2024年2月25日发(作者:华阳羽)
0.2GHz主频差距可有可无?至强E3-1220和E3-1240对比评测
服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HP DL120 G7,测试的处理器为E3-1220和E3-1240。
惠普ProLiant DL120 G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。
惠普ProLiant DL120 G7服务器前后视图
前置USB接口和状态指示灯
惠普ProLiant DL120 G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支
持SATA或SAS硬盘,后面板设计也比较简单。
惠普ProLiant DL120 G7开箱图
惠普ProLiant DL120 G7的内部空间非常宽敞。它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。为了有效提升散热效果,惠普ProLiant DL120 G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。
惠普ProLiant DL120 G7配备的电源
惠普ProLiant DL120 G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。
惠普ProLiant DL120 G7服务器内部拆解
至强E3-1220处理器
至强E3-1240处理器
这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其
中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。
惠普ProLiant DL120 G7服务器内存
应对我们测试的要求,惠普ProLiant DL120 G7服务器一共配置了4条4GB DDR3 ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。
西部数据WD5003ABYX
惠普ProLiant DL120 G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。测试中我们使用这些硬盘组建了RAID 5阵列。
惠普ProLiant DL120 G7服务器配备的阵列卡
惠普ProLiant DL120 G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。这块阵列卡可以实现RAID 5、RAID 6等常用阵列和RAID 0、RAID 1等基本阵列。
服务器扩展槽位置
惠普ProLiant DL120 G7服务器提供了4个扩展槽,分别是PCI-E X16、PCI-E X8和PCI-E
X4。
板载的显示芯片
板载的英特尔千兆网络芯片
惠普特色的iLO3远程管理芯片
服务器测试环境介绍
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
网络实验室控制台
千兆交换机,120个千兆网口
用于产生用户访问压力的塔式服务器
服务器测试工具介绍
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也
是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC
CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU
2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作
的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034
Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel
Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2011
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows
Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware
Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
惠普ProLiant DL120 G7服务器配置一览
平台信息服务器
产品惠普DL120 G7服务器
名称
平台单路 Sandy Bridge-E3
类型
处理器子系统
处理器型Intel Xeon E3-1220
号
处理器架Intel 32nm Sandy Bridge
构
代号 Sandy Bridge
处理器封Socket 1155 LGA
装
核心/线程4/4
数量
主频 3.1GHz 3.3GHz
4/4
Socket 1155 LGA
Sandy Bridge
Intel 32nm Sandy Bridge
Intel Xeon E3-1240
单路 Sandy Bridge-E3
惠普DL120 G7服务器
处理MMX,SSE,SSE2,SSE3, MMX,SSE,SSE2,SSE3,
器指
令集 SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX
外部DMI
总线 5.0GT/S
L1
Code 4× 32KB 8路集合关联
Cache
L1
Data 4× 32KB 4路集合关联
Cache
L2
4× 256KB 8路集合关联
Cache
L3
8MB 16路集合关联
Cache
型号惠普ProLiant DL120 G7
主板
主板芯片惠普ProLiant DL120 G7
组
北桥2×QPI
芯片DMI
5.0GT/S
4× 32KB 8路集合关联
4× 32KB 4路集合关联
4× 256KB 8路集合关联
8MB 16路集合关联
服务器主板
惠普ProLiant DL120 G7
惠普ProLiant DL120 G7
2×QPI
特性
VT-d Gen 2 VT-d Gen 2
子系统内存
控制器内每集成双通道U-ECC DDR3 1333CPU 每集成双通道U-ECC DDR3 1333CPU
存
内存4GB R-ECC DDR3 1333 SDRAM ×4条 4GB R-ECC DDR3 1333 SDRAM ×4条
类型
存储子系统
磁盘 LSI Embedded MegaRAID SAS RAID LSI Embedded MegaRAID SAS RAID
控制Controller
器
磁盘控制4x SATA 3Gb/s 4x SATA 3Gb/s
Controller
器规 MatrixRAID 0/1/3/5
格
控制LSI MegaSR
器驱 13.06.0212.2009
动
型号LSI MegaSR
数量 13.06.0212.2009
硬盘
7200RPM
MatrixRAID 0/1/3/5
LSI MegaSR
13.06.0212.2009
LSI MegaSR 13.06.0212.2009
规格7200RPM
硬盘 500GB 500GB
SATA 3Gbps SATA 3Gbps
16MB Cache 16MB Cache
软件环境
操作Microsoft Windows Server 2008 Microsoft Windows Server 2008
系统 Enterprise R2 x64 Enterprise R2 x64
由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。
处理器详细规格
至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。
至强E3-1240处理器信息
至强E3-1220处理器信息
16GB内存容量
Sisoftware Sandra 2011处理器性能
SiSoftware Sandra Pro Business 2011
产品名称
平台类型
处理器型号
HP DL120 G7 HP DL120 G7
单路Intel SandyBridge 单路Intel SandyBridge
至强E3-1240(关超线程) 至强E3-1220
Processor Arithmetic Benchmark
处理器算术运算测试
总计本地功效
总计本地功效对比速度
Dhrystone iSSE4.2
Dhrystone iSSE4.2 vs SPEED
Whetstone iSSE3
Dhrystone iSSE3 vs SPEED
71GOPS
19.22MOPS/MHz
103.54GIPS
28.04MIPS/MHz
48.63GFLOPS
13.17MFLOPS/MHz
66.64GOPS
19.64MOPS/MHz
97.44GIPS
28.73MIPS/MHz
45.57GFLOPS
13.43MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
总计多媒体功效
总计多媒体功效对比速度
Multi-Media Int x16 iSSE4.1
130.75MPixel/s
35.41kPixels/s/MHz
158.52MPixel/s
123MPixel/s
36.28kPixels/s/MHz
149.2MPixel/s
Multi-Media Int x16 iSSE4.1 vs
42.94kPixels/s/MHz
SPEED
Multi-Media Float x8 iSSE2 107.84MPixel/s
43.99kPixel/s/MHz
101.51MPixel/s
Multi-Media Float x8 iSSE2 vs
29.21kPixels/s/MHz
SPEED
Multi-Media Double x4 iSSE2 58.56MPixel/s
29.93kPixels/s/MHz
54.86MPixel/s
Multi-Media Double x4 iSSE2 vs
15.86kPixels/s/MHz
SPEED
16.17kPixels/s/MHz
Multi-Core Efficiency Benchmark
处理器效能测试
内联核带宽 8.63GB/s
内联核带宽对比速度 2.39MB/s/MHz
内联核延迟(越小越好) 39.2ns
内联核延迟对比速度(越小越好) 0.11ns/MHz
Java算数性能测试
总计 Java 功效 58.58GOPS
总计 Java 功效对比速度 16.31MOPSMHz
Dhrystone Java 108.55GIPS
Dhrystone Java对比速度 30.22MIPS/MHz
Whetstone Java 31.6GFLOPS
Whetstone Java对比速度 8.80MFLOPSMHz
Java多媒体性能测试
总计多媒体Java功效 18MPixel/s
总计多媒体Java功效对比速度 4.88kPixels/s/MHz
多媒体整数 x1 Java 20.68MPixel/s
多媒体整数 x1 Java对比速度 5.60kPixels/s/MHz
多媒体浮点数 x1 Java 15.7MPixel/s
多媒体浮点数 x1 Java对比速度 4.25kPixels/s/MHz
多媒体双精度 x1 Java 16MPixel/s
8GB/s
2.44MB/s/MHz
42.0ns
0.12ns/MHz
57GOPS
16.81MOPSMHz
109.83GIPS
32.38MIPS/MHz
29.6GFLOPS
8.73MFLOPS/MHz
17MPixel/s
4.99kPixels/s/MHz
19.4MPixel/s
5.72kPixels/s/MHz
14.79MPixel/s
4.36kPixels/s/MHz
14.76MPixel/s
多媒体双精度 x1 Java对比速度 4.32kPixels/s/MHz 4.35kPixels/s/MHz
.NET Arithmetic Benchmark
.NET算术运算测试
总计 .NET 功效
总计 .NET 功效对比速度
Dhrystone .NET
Dhrystone .NET vs SPEED
Whetstone .NET
Whetstone .NET vs SPEED
21.32GOPS
5.77MOPS/MHz
15.26GIPS
4.13MIPS/MHz
29.77GFLOPS
8.06MFLOPS/MHz
19.77GOPS
6.00MOPS/MHz
14.15GIPS
4.30MIPS/MHz
27.63GFLOPS
8.39MFLOPS/MHz
.NET Multi-Media Benchmark .NET多媒体测试
总计多媒体.NET功效
总计多媒体.NET功效对比速度
多媒体整数 x1 .NET
多媒体整数x1 .NET vs SPEED
多媒体浮点数 x1 .NET
14.85MPixel/s
4.02kPixels/MHz
28.24MPixel/s
7.65kPixels/s/MHz
7.8MPixel/s
14MPixel/s
4.14kPixels/s/MHz
26.54MPixel/s
7.82kPixels/s/MHz
7.41MPixel/s
2.19kPixels/s/MHz
14.74MPixel/s
4.35kPixels/s/MHz
多媒体浮点数 x1 .NET vs SPEED 2.12kPixels/s/MHz
多媒体双精度 x1 .NET 15.63MPixel/s
多媒体双精度 x1 .NET vs SPEED 4.23kPixels/s/MHz
测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。
Sisoftware Sandra 2011内存缓存性能
SiSoftware Sandra Pro Business 2011
产品名称
平台类型
处理器型号
HP DL120 G7
Intel SandyBridge
HP DL120 G7
Intel SandyBridge
至强E3-1240(关超线程) 至强E3-1220
Memory Bandwidth Benchmark
内存带宽测试
总体内存性能
总体内存性能对比速度
整数 B/F iSSE2 内存带宽
整数 B/F iSSE2 内存带宽对比速17.3GB/s
13.29MB/sMHz
17.3GB/s
17.27GB/s
13.28MB/sMHz
17.27GB/s
13.30MB/sMHz
度
整数 B/F iSSE2 内存带宽
整数 B/F iSSE2 内存带宽对比速13.29MB/sMHz
度
Memory Latency Benchmark
17.29GB/s
13.28MB/sMHz
17.27GB/s
13.28MB/sMHz
内存延迟测试
内存延迟(越小越好)
内存延迟对比速度 (越小越好)
速度因素 (越小越好)
内部数据高速缓存
二级板载高速缓存
三级板载高速缓存
75.3ns
0.06ns/MHz
68.10
4clocks
11clocks
35clocks
76.6ns
0.06ns/MHz
64
4clocks
11clocks
35clocks
Cache and Memory Benchmark 缓存及内存测试
缓存/内存带宽
缓存/内存带宽对比速度
速度因素(越小越好)
内部数据高速缓存
二级板载高速缓存
三级板载高速缓存
95.33GB/s
27.18MB/s/MHz
38.10
410.2GB/s
345.3GB/s
172.8GB/s
91.86GB/s
27.73MB/s/MHz
35.90
386GB/s
323.66GB/s
165GB/s
由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。
SPEC CPU 2006处理器子系统性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64
Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了
Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了nch PERL编程语言、2 压缩、 C编译器、 组合优化、 人工智能:围棋、 基因序列搜索、 人工智能:国际象棋、ntum 物理:量子计算、464.h264ref 视频压缩、p 离散事件仿真、 寻路算法、bmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如 流体力学、 量子化学、 量子力学、 物理:计算流体力学、s 生物化学/分子力学、ADM 物理:广义相对论、3d 流体力学、 生物/分子、 有限元分析、 线形编程、优化、 影像光线追踪、ix 结构力学、TD 计算电磁学、 量子化学、 流体力学、 天气预报、3 语音
识别共17项测试。
SPEC CPU 2006浮点运算测试成绩
SPEC测试成绩中我们看到,二者测试成绩几乎相同,可见在不同的测试项目中,对主频的敏感度也并不相同,并不是主频高,测试成绩就一定好。
CineBench 11.5性能测试
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。
CineBench 11.5测试成绩
从CineBench 11.5测试成绩中可以看出,二者测试成绩几乎相同。
总结
从Sisoftware Sandra 2011、SPEC CPU 2006以及CineBench 11.5的测试成绩中,我们可以看到,虽然E3-1240的主频略高,但是也并没有表现出明显的优势。我们相信主频越高,在某些方面会越好,但是在实际的采购中,更需要结合自身的实际情况加以考虑,而不是一味的追求高主频,高主频需要面对的是高价格和高功耗
2024年2月25日发(作者:华阳羽)
0.2GHz主频差距可有可无?至强E3-1220和E3-1240对比评测
服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HP DL120 G7,测试的处理器为E3-1220和E3-1240。
惠普ProLiant DL120 G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。
惠普ProLiant DL120 G7服务器前后视图
前置USB接口和状态指示灯
惠普ProLiant DL120 G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支
持SATA或SAS硬盘,后面板设计也比较简单。
惠普ProLiant DL120 G7开箱图
惠普ProLiant DL120 G7的内部空间非常宽敞。它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。为了有效提升散热效果,惠普ProLiant DL120 G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。
惠普ProLiant DL120 G7配备的电源
惠普ProLiant DL120 G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。
惠普ProLiant DL120 G7服务器内部拆解
至强E3-1220处理器
至强E3-1240处理器
这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其
中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。
惠普ProLiant DL120 G7服务器内存
应对我们测试的要求,惠普ProLiant DL120 G7服务器一共配置了4条4GB DDR3 ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。
西部数据WD5003ABYX
惠普ProLiant DL120 G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。测试中我们使用这些硬盘组建了RAID 5阵列。
惠普ProLiant DL120 G7服务器配备的阵列卡
惠普ProLiant DL120 G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。这块阵列卡可以实现RAID 5、RAID 6等常用阵列和RAID 0、RAID 1等基本阵列。
服务器扩展槽位置
惠普ProLiant DL120 G7服务器提供了4个扩展槽,分别是PCI-E X16、PCI-E X8和PCI-E
X4。
板载的显示芯片
板载的英特尔千兆网络芯片
惠普特色的iLO3远程管理芯片
服务器测试环境介绍
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
网络实验室控制台
千兆交换机,120个千兆网口
用于产生用户访问压力的塔式服务器
服务器测试工具介绍
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也
是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC
CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU
2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作
的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034
Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel
Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2011
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows
Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware
Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
惠普ProLiant DL120 G7服务器配置一览
平台信息服务器
产品惠普DL120 G7服务器
名称
平台单路 Sandy Bridge-E3
类型
处理器子系统
处理器型Intel Xeon E3-1220
号
处理器架Intel 32nm Sandy Bridge
构
代号 Sandy Bridge
处理器封Socket 1155 LGA
装
核心/线程4/4
数量
主频 3.1GHz 3.3GHz
4/4
Socket 1155 LGA
Sandy Bridge
Intel 32nm Sandy Bridge
Intel Xeon E3-1240
单路 Sandy Bridge-E3
惠普DL120 G7服务器
处理MMX,SSE,SSE2,SSE3, MMX,SSE,SSE2,SSE3,
器指
令集 SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX
外部DMI
总线 5.0GT/S
L1
Code 4× 32KB 8路集合关联
Cache
L1
Data 4× 32KB 4路集合关联
Cache
L2
4× 256KB 8路集合关联
Cache
L3
8MB 16路集合关联
Cache
型号惠普ProLiant DL120 G7
主板
主板芯片惠普ProLiant DL120 G7
组
北桥2×QPI
芯片DMI
5.0GT/S
4× 32KB 8路集合关联
4× 32KB 4路集合关联
4× 256KB 8路集合关联
8MB 16路集合关联
服务器主板
惠普ProLiant DL120 G7
惠普ProLiant DL120 G7
2×QPI
特性
VT-d Gen 2 VT-d Gen 2
子系统内存
控制器内每集成双通道U-ECC DDR3 1333CPU 每集成双通道U-ECC DDR3 1333CPU
存
内存4GB R-ECC DDR3 1333 SDRAM ×4条 4GB R-ECC DDR3 1333 SDRAM ×4条
类型
存储子系统
磁盘 LSI Embedded MegaRAID SAS RAID LSI Embedded MegaRAID SAS RAID
控制Controller
器
磁盘控制4x SATA 3Gb/s 4x SATA 3Gb/s
Controller
器规 MatrixRAID 0/1/3/5
格
控制LSI MegaSR
器驱 13.06.0212.2009
动
型号LSI MegaSR
数量 13.06.0212.2009
硬盘
7200RPM
MatrixRAID 0/1/3/5
LSI MegaSR
13.06.0212.2009
LSI MegaSR 13.06.0212.2009
规格7200RPM
硬盘 500GB 500GB
SATA 3Gbps SATA 3Gbps
16MB Cache 16MB Cache
软件环境
操作Microsoft Windows Server 2008 Microsoft Windows Server 2008
系统 Enterprise R2 x64 Enterprise R2 x64
由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。
处理器详细规格
至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。
至强E3-1240处理器信息
至强E3-1220处理器信息
16GB内存容量
Sisoftware Sandra 2011处理器性能
SiSoftware Sandra Pro Business 2011
产品名称
平台类型
处理器型号
HP DL120 G7 HP DL120 G7
单路Intel SandyBridge 单路Intel SandyBridge
至强E3-1240(关超线程) 至强E3-1220
Processor Arithmetic Benchmark
处理器算术运算测试
总计本地功效
总计本地功效对比速度
Dhrystone iSSE4.2
Dhrystone iSSE4.2 vs SPEED
Whetstone iSSE3
Dhrystone iSSE3 vs SPEED
71GOPS
19.22MOPS/MHz
103.54GIPS
28.04MIPS/MHz
48.63GFLOPS
13.17MFLOPS/MHz
66.64GOPS
19.64MOPS/MHz
97.44GIPS
28.73MIPS/MHz
45.57GFLOPS
13.43MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
总计多媒体功效
总计多媒体功效对比速度
Multi-Media Int x16 iSSE4.1
130.75MPixel/s
35.41kPixels/s/MHz
158.52MPixel/s
123MPixel/s
36.28kPixels/s/MHz
149.2MPixel/s
Multi-Media Int x16 iSSE4.1 vs
42.94kPixels/s/MHz
SPEED
Multi-Media Float x8 iSSE2 107.84MPixel/s
43.99kPixel/s/MHz
101.51MPixel/s
Multi-Media Float x8 iSSE2 vs
29.21kPixels/s/MHz
SPEED
Multi-Media Double x4 iSSE2 58.56MPixel/s
29.93kPixels/s/MHz
54.86MPixel/s
Multi-Media Double x4 iSSE2 vs
15.86kPixels/s/MHz
SPEED
16.17kPixels/s/MHz
Multi-Core Efficiency Benchmark
处理器效能测试
内联核带宽 8.63GB/s
内联核带宽对比速度 2.39MB/s/MHz
内联核延迟(越小越好) 39.2ns
内联核延迟对比速度(越小越好) 0.11ns/MHz
Java算数性能测试
总计 Java 功效 58.58GOPS
总计 Java 功效对比速度 16.31MOPSMHz
Dhrystone Java 108.55GIPS
Dhrystone Java对比速度 30.22MIPS/MHz
Whetstone Java 31.6GFLOPS
Whetstone Java对比速度 8.80MFLOPSMHz
Java多媒体性能测试
总计多媒体Java功效 18MPixel/s
总计多媒体Java功效对比速度 4.88kPixels/s/MHz
多媒体整数 x1 Java 20.68MPixel/s
多媒体整数 x1 Java对比速度 5.60kPixels/s/MHz
多媒体浮点数 x1 Java 15.7MPixel/s
多媒体浮点数 x1 Java对比速度 4.25kPixels/s/MHz
多媒体双精度 x1 Java 16MPixel/s
8GB/s
2.44MB/s/MHz
42.0ns
0.12ns/MHz
57GOPS
16.81MOPSMHz
109.83GIPS
32.38MIPS/MHz
29.6GFLOPS
8.73MFLOPS/MHz
17MPixel/s
4.99kPixels/s/MHz
19.4MPixel/s
5.72kPixels/s/MHz
14.79MPixel/s
4.36kPixels/s/MHz
14.76MPixel/s
多媒体双精度 x1 Java对比速度 4.32kPixels/s/MHz 4.35kPixels/s/MHz
.NET Arithmetic Benchmark
.NET算术运算测试
总计 .NET 功效
总计 .NET 功效对比速度
Dhrystone .NET
Dhrystone .NET vs SPEED
Whetstone .NET
Whetstone .NET vs SPEED
21.32GOPS
5.77MOPS/MHz
15.26GIPS
4.13MIPS/MHz
29.77GFLOPS
8.06MFLOPS/MHz
19.77GOPS
6.00MOPS/MHz
14.15GIPS
4.30MIPS/MHz
27.63GFLOPS
8.39MFLOPS/MHz
.NET Multi-Media Benchmark .NET多媒体测试
总计多媒体.NET功效
总计多媒体.NET功效对比速度
多媒体整数 x1 .NET
多媒体整数x1 .NET vs SPEED
多媒体浮点数 x1 .NET
14.85MPixel/s
4.02kPixels/MHz
28.24MPixel/s
7.65kPixels/s/MHz
7.8MPixel/s
14MPixel/s
4.14kPixels/s/MHz
26.54MPixel/s
7.82kPixels/s/MHz
7.41MPixel/s
2.19kPixels/s/MHz
14.74MPixel/s
4.35kPixels/s/MHz
多媒体浮点数 x1 .NET vs SPEED 2.12kPixels/s/MHz
多媒体双精度 x1 .NET 15.63MPixel/s
多媒体双精度 x1 .NET vs SPEED 4.23kPixels/s/MHz
测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。
Sisoftware Sandra 2011内存缓存性能
SiSoftware Sandra Pro Business 2011
产品名称
平台类型
处理器型号
HP DL120 G7
Intel SandyBridge
HP DL120 G7
Intel SandyBridge
至强E3-1240(关超线程) 至强E3-1220
Memory Bandwidth Benchmark
内存带宽测试
总体内存性能
总体内存性能对比速度
整数 B/F iSSE2 内存带宽
整数 B/F iSSE2 内存带宽对比速17.3GB/s
13.29MB/sMHz
17.3GB/s
17.27GB/s
13.28MB/sMHz
17.27GB/s
13.30MB/sMHz
度
整数 B/F iSSE2 内存带宽
整数 B/F iSSE2 内存带宽对比速13.29MB/sMHz
度
Memory Latency Benchmark
17.29GB/s
13.28MB/sMHz
17.27GB/s
13.28MB/sMHz
内存延迟测试
内存延迟(越小越好)
内存延迟对比速度 (越小越好)
速度因素 (越小越好)
内部数据高速缓存
二级板载高速缓存
三级板载高速缓存
75.3ns
0.06ns/MHz
68.10
4clocks
11clocks
35clocks
76.6ns
0.06ns/MHz
64
4clocks
11clocks
35clocks
Cache and Memory Benchmark 缓存及内存测试
缓存/内存带宽
缓存/内存带宽对比速度
速度因素(越小越好)
内部数据高速缓存
二级板载高速缓存
三级板载高速缓存
95.33GB/s
27.18MB/s/MHz
38.10
410.2GB/s
345.3GB/s
172.8GB/s
91.86GB/s
27.73MB/s/MHz
35.90
386GB/s
323.66GB/s
165GB/s
由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。
SPEC CPU 2006处理器子系统性能测试
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64
Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了
Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了nch PERL编程语言、2 压缩、 C编译器、 组合优化、 人工智能:围棋、 基因序列搜索、 人工智能:国际象棋、ntum 物理:量子计算、464.h264ref 视频压缩、p 离散事件仿真、 寻路算法、bmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如 流体力学、 量子化学、 量子力学、 物理:计算流体力学、s 生物化学/分子力学、ADM 物理:广义相对论、3d 流体力学、 生物/分子、 有限元分析、 线形编程、优化、 影像光线追踪、ix 结构力学、TD 计算电磁学、 量子化学、 流体力学、 天气预报、3 语音
识别共17项测试。
SPEC CPU 2006浮点运算测试成绩
SPEC测试成绩中我们看到,二者测试成绩几乎相同,可见在不同的测试项目中,对主频的敏感度也并不相同,并不是主频高,测试成绩就一定好。
CineBench 11.5性能测试
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。
CineBench 11.5测试成绩
从CineBench 11.5测试成绩中可以看出,二者测试成绩几乎相同。
总结
从Sisoftware Sandra 2011、SPEC CPU 2006以及CineBench 11.5的测试成绩中,我们可以看到,虽然E3-1240的主频略高,但是也并没有表现出明显的优势。我们相信主频越高,在某些方面会越好,但是在实际的采购中,更需要结合自身的实际情况加以考虑,而不是一味的追求高主频,高主频需要面对的是高价格和高功耗