Intel 22核心大杀器深度测试:谁敢一战!
很多人都说,Intel 这些年也懒了,一直在"挤牙膏",但那只是在桌面领域而已,需求疲软、竞争乏力,换谁也跑不动,而在高性能的服务器市场上,Intel 可一直是在狂奔。
现在,14nm 新工艺的 Broadwell-EP Xeon E5-2600 v4 系列处理器全新发布了,最大亮点就是核心数量猛增至 22 个 ( 44 线程 ) ,而且下一代 Skylake-EP 还会进一步增加到 28 个 ( 56 线程 ) 。
在领略了 18 核心 E5-2697 v4 的威力之后,我们再来瞻仰一下顶级 22 核心 E5-2699 v4 的狂暴表现吧,同时还有 18 核心的 Xeon E5-2697 v4。
神一般的 Xeon E5-2699 v4
上边是 E5 v4,下边是 E5 v3:不太一样,但都是 LGA2011-3 封装
两代变化
E5 v4 型号、价格表
本次测试主要采用两台 2U 架机,分别是 Intel S2600WT、SuperMicro 6027R-73DARF,具体配置如下:
注:Xeon E5-2600 四代产品分别基于 32nm Sandy Bridge-EP、22nm Ivy Bridge-EP、22nm Haswell-EP、14nm Broadwell-EP。
BIOS 界面
【单核心性能】
本次测试使用 SPEC CPU2006,可以很好地评估单个核心的性能,涉及不同整数负载。
测试中还特别加入了 AMD Opera 6376,不过因为其架构很特殊,测试使用其一个模块 / 两个核心。
以第一代 Sandy Bridge-EP E5-2690 为基准,后边基带的性能怎么反而有很多降低了?单核心性能嘛,E5-2690 的频率达 2.9GHz,E5-2697 v2 降低到了 2.7GHz,最近两代高端型号更是只有 2.2GHz 左右。
频率降低这么多 ( 大约 25% ) ,性能还可以维持在 90%左右的水平,部分还能领先,可见单核心性能是有了大幅度提升的,也就是来自架构改进。
如果将编译器设置改为 -Ofast,E5-2699 v4 的绝对性能骤然提升了超过 19%,结果在频率低很多的情况下,反而还能领先 E5-2690 3%。
这是 Intel 宣传的最近九代处理器的单核心 / 架构性能变化,可以看出确实是隔代大提升,能达到 10-15%,而在引入新工艺的时候,性能提升最多也不超过 5%,有时候还根本没有提升。累积下来,这些年已经提升了几乎 20%。
【多线程性能】
估计不看结果你也能想象出来,22 核心发威的时候到了。
LZMA 压缩解压是有多少核心就可以用到多少核心,E5-2699 v4 自然一路狂飙,领先上代 18 核心的 E5-2699 v3 25-28%,更是第一代 8 核心 E5-2690 2.6 倍以上。
另外,在频率低 200MHz、同样 18 核心的情况下,E5-2695 v4 仍可以领先 E5-2699 v3 4-9%,可见架构之改进。
【内存带宽 / 延迟性能】
E5 v4 内存支持 DDR4-2400,比上的一代的 DDR4-2133 略有提升。
ICC 编译环境下带宽提升了 15%,GCC 下则基本相同。
随着三级缓存的不断增大,延迟也在增加,E5 v4 几乎已经是第一代 E5 的两倍,不过考虑到三级缓存已经增加了几乎两倍 ( 55MB VS. 20MB ) ,还是难能可贵的。
AMD Zen 架构跑分首曝:成功逆袭 Intel!
【数据库性能】
同样有稳步提升,18 核心都达到了四年前 8 核心的两倍多。
【应用开发性能】
Linux 内核编译对多核心支持并不是特别完善,但是 E5-2699 v4 依然达到了初代旗舰的 2.7 倍,E5-2695 v4 也超过了 E5-2699 v3 9%之多。
【SAP S&D 性能】
越来越多的核心、越来越大的三级缓存、越来越好的 NUMA 一致性,是的 E5-2699 v4 的性能再次大跃进,已是初代 8 核的三倍多。
【Spark 性能】
结果是每天完成的工作数量 ( 每次处理 300GB 网络数据 ) 。虽然对双路的支持不是特别好,但是单颗处理器的性能还是可以充分发挥出来的。
E5-2699 v4 完成任务只需 4 个半小时,E5-2690 则需要耗时 6 小时 40 分钟。都是双路的时候 E5-2699 v4 要比 E5-2699 v3 快大约 20 分钟。
【HPC 计算性能】
这代 22 核心和上代 18 核心似乎性能差不多,问题主要是在这个 AVX 指令集测试中,Broadwell-EP 的加速频率比上代更低。
【NAMD 浮点性能】
已经是当年 8 核心的 2.5 倍了。