最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

0.2GHz主频差距可有可无?至强E3-1220和E3-1240对比评测

IT圈 admin 212浏览 0评论

2024年2月25日发(作者:华阳羽)

0.2GHz主频差距可有可无?至强E3-1220和E3-1240对比评测

服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HP DL120 G7,测试的处理器为E3-1220和E3-1240。

惠普ProLiant DL120 G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。

惠普ProLiant DL120 G7服务器前后视图

前置USB接口和状态指示灯

惠普ProLiant DL120 G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支

持SATA或SAS硬盘,后面板设计也比较简单。

惠普ProLiant DL120 G7开箱图

惠普ProLiant DL120 G7的内部空间非常宽敞。它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。为了有效提升散热效果,惠普ProLiant DL120 G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。

惠普ProLiant DL120 G7配备的电源

惠普ProLiant DL120 G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。

惠普ProLiant DL120 G7服务器内部拆解

至强E3-1220处理器

至强E3-1240处理器

这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其

中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。

惠普ProLiant DL120 G7服务器内存

应对我们测试的要求,惠普ProLiant DL120 G7服务器一共配置了4条4GB DDR3 ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。

西部数据WD5003ABYX

惠普ProLiant DL120 G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。测试中我们使用这些硬盘组建了RAID 5阵列。

惠普ProLiant DL120 G7服务器配备的阵列卡

惠普ProLiant DL120 G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。这块阵列卡可以实现RAID 5、RAID 6等常用阵列和RAID 0、RAID 1等基本阵列。

服务器扩展槽位置

惠普ProLiant DL120 G7服务器提供了4个扩展槽,分别是PCI-E X16、PCI-E X8和PCI-E

X4。

板载的显示芯片

板载的英特尔千兆网络芯片

惠普特色的iLO3远程管理芯片

服务器测试环境介绍

为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。

我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。

网络实验室控制台

千兆交换机,120个千兆网口

用于产生用户访问压力的塔式服务器

服务器测试工具介绍

对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也

是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。

处理器子系统测试

对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。

此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。

SPEC CPU 2006 v1.1

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC

CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU

2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作

的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034

Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel

Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。

内存子系统测试

对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。

SiSoftware Sandra v2011

SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows

Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware

Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

惠普ProLiant DL120 G7服务器配置一览

平台信息服务器

产品惠普DL120 G7服务器

名称

平台单路 Sandy Bridge-E3

类型

处理器子系统

处理器型Intel Xeon E3-1220

处理器架Intel 32nm Sandy Bridge

代号 Sandy Bridge

处理器封Socket 1155 LGA

核心/线程4/4

数量

主频 3.1GHz 3.3GHz

4/4

Socket 1155 LGA

Sandy Bridge

Intel 32nm Sandy Bridge

Intel Xeon E3-1240

单路 Sandy Bridge-E3

惠普DL120 G7服务器

处理MMX,SSE,SSE2,SSE3, MMX,SSE,SSE2,SSE3,

器指

令集 SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

外部DMI

总线 5.0GT/S

L1

Code 4× 32KB 8路集合关联

Cache

L1

Data 4× 32KB 4路集合关联

Cache

L2

4× 256KB 8路集合关联

Cache

L3

8MB 16路集合关联

Cache

型号惠普ProLiant DL120 G7

主板

主板芯片惠普ProLiant DL120 G7

北桥2×QPI

芯片DMI

5.0GT/S

4× 32KB 8路集合关联

4× 32KB 4路集合关联

4× 256KB 8路集合关联

8MB 16路集合关联

服务器主板

惠普ProLiant DL120 G7

惠普ProLiant DL120 G7

2×QPI

特性

VT-d Gen 2 VT-d Gen 2

子系统内存

控制器内每集成双通道U-ECC DDR3 1333CPU 每集成双通道U-ECC DDR3 1333CPU

内存4GB R-ECC DDR3 1333 SDRAM ×4条 4GB R-ECC DDR3 1333 SDRAM ×4条

类型

存储子系统

磁盘 LSI Embedded MegaRAID SAS RAID LSI Embedded MegaRAID SAS RAID

控制Controller

磁盘控制4x SATA 3Gb/s 4x SATA 3Gb/s

Controller

器规 MatrixRAID 0/1/3/5

控制LSI MegaSR

器驱 13.06.0212.2009

型号LSI MegaSR

数量 13.06.0212.2009

硬盘

7200RPM

MatrixRAID 0/1/3/5

LSI MegaSR

13.06.0212.2009

LSI MegaSR 13.06.0212.2009

规格7200RPM

硬盘 500GB 500GB

SATA 3Gbps SATA 3Gbps

16MB Cache 16MB Cache

软件环境

操作Microsoft Windows Server 2008 Microsoft Windows Server 2008

系统 Enterprise R2 x64 Enterprise R2 x64

由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。

处理器详细规格

至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。

至强E3-1240处理器信息

至强E3-1220处理器信息

16GB内存容量

Sisoftware Sandra 2011处理器性能

SiSoftware Sandra Pro Business 2011

产品名称

平台类型

处理器型号

HP DL120 G7 HP DL120 G7

单路Intel SandyBridge 单路Intel SandyBridge

至强E3-1240(关超线程) 至强E3-1220

Processor Arithmetic Benchmark

处理器算术运算测试

总计本地功效

总计本地功效对比速度

Dhrystone iSSE4.2

Dhrystone iSSE4.2 vs SPEED

Whetstone iSSE3

Dhrystone iSSE3 vs SPEED

71GOPS

19.22MOPS/MHz

103.54GIPS

28.04MIPS/MHz

48.63GFLOPS

13.17MFLOPS/MHz

66.64GOPS

19.64MOPS/MHz

97.44GIPS

28.73MIPS/MHz

45.57GFLOPS

13.43MFLOPS/MHz

Processor Multi-Media Benchmark

处理器多媒体测试

总计多媒体功效

总计多媒体功效对比速度

Multi-Media Int x16 iSSE4.1

130.75MPixel/s

35.41kPixels/s/MHz

158.52MPixel/s

123MPixel/s

36.28kPixels/s/MHz

149.2MPixel/s

Multi-Media Int x16 iSSE4.1 vs

42.94kPixels/s/MHz

SPEED

Multi-Media Float x8 iSSE2 107.84MPixel/s

43.99kPixel/s/MHz

101.51MPixel/s

Multi-Media Float x8 iSSE2 vs

29.21kPixels/s/MHz

SPEED

Multi-Media Double x4 iSSE2 58.56MPixel/s

29.93kPixels/s/MHz

54.86MPixel/s

Multi-Media Double x4 iSSE2 vs

15.86kPixels/s/MHz

SPEED

16.17kPixels/s/MHz

Multi-Core Efficiency Benchmark

处理器效能测试

内联核带宽 8.63GB/s

内联核带宽对比速度 2.39MB/s/MHz

内联核延迟(越小越好) 39.2ns

内联核延迟对比速度(越小越好) 0.11ns/MHz

Java算数性能测试

总计 Java 功效 58.58GOPS

总计 Java 功效对比速度 16.31MOPSMHz

Dhrystone Java 108.55GIPS

Dhrystone Java对比速度 30.22MIPS/MHz

Whetstone Java 31.6GFLOPS

Whetstone Java对比速度 8.80MFLOPSMHz

Java多媒体性能测试

总计多媒体Java功效 18MPixel/s

总计多媒体Java功效对比速度 4.88kPixels/s/MHz

多媒体整数 x1 Java 20.68MPixel/s

多媒体整数 x1 Java对比速度 5.60kPixels/s/MHz

多媒体浮点数 x1 Java 15.7MPixel/s

多媒体浮点数 x1 Java对比速度 4.25kPixels/s/MHz

多媒体双精度 x1 Java 16MPixel/s

8GB/s

2.44MB/s/MHz

42.0ns

0.12ns/MHz

57GOPS

16.81MOPSMHz

109.83GIPS

32.38MIPS/MHz

29.6GFLOPS

8.73MFLOPS/MHz

17MPixel/s

4.99kPixels/s/MHz

19.4MPixel/s

5.72kPixels/s/MHz

14.79MPixel/s

4.36kPixels/s/MHz

14.76MPixel/s

多媒体双精度 x1 Java对比速度 4.32kPixels/s/MHz 4.35kPixels/s/MHz

.NET Arithmetic Benchmark

.NET算术运算测试

总计 .NET 功效

总计 .NET 功效对比速度

Dhrystone .NET

Dhrystone .NET vs SPEED

Whetstone .NET

Whetstone .NET vs SPEED

21.32GOPS

5.77MOPS/MHz

15.26GIPS

4.13MIPS/MHz

29.77GFLOPS

8.06MFLOPS/MHz

19.77GOPS

6.00MOPS/MHz

14.15GIPS

4.30MIPS/MHz

27.63GFLOPS

8.39MFLOPS/MHz

.NET Multi-Media Benchmark .NET多媒体测试

总计多媒体.NET功效

总计多媒体.NET功效对比速度

多媒体整数 x1 .NET

多媒体整数x1 .NET vs SPEED

多媒体浮点数 x1 .NET

14.85MPixel/s

4.02kPixels/MHz

28.24MPixel/s

7.65kPixels/s/MHz

7.8MPixel/s

14MPixel/s

4.14kPixels/s/MHz

26.54MPixel/s

7.82kPixels/s/MHz

7.41MPixel/s

2.19kPixels/s/MHz

14.74MPixel/s

4.35kPixels/s/MHz

多媒体浮点数 x1 .NET vs SPEED 2.12kPixels/s/MHz

多媒体双精度 x1 .NET 15.63MPixel/s

多媒体双精度 x1 .NET vs SPEED 4.23kPixels/s/MHz

测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。

Sisoftware Sandra 2011内存缓存性能

SiSoftware Sandra Pro Business 2011

产品名称

平台类型

处理器型号

HP DL120 G7

Intel SandyBridge

HP DL120 G7

Intel SandyBridge

至强E3-1240(关超线程) 至强E3-1220

Memory Bandwidth Benchmark

内存带宽测试

总体内存性能

总体内存性能对比速度

整数 B/F iSSE2 内存带宽

整数 B/F iSSE2 内存带宽对比速17.3GB/s

13.29MB/sMHz

17.3GB/s

17.27GB/s

13.28MB/sMHz

17.27GB/s

13.30MB/sMHz

整数 B/F iSSE2 内存带宽

整数 B/F iSSE2 内存带宽对比速13.29MB/sMHz

Memory Latency Benchmark

17.29GB/s

13.28MB/sMHz

17.27GB/s

13.28MB/sMHz

内存延迟测试

内存延迟(越小越好)

内存延迟对比速度 (越小越好)

速度因素 (越小越好)

内部数据高速缓存

二级板载高速缓存

三级板载高速缓存

75.3ns

0.06ns/MHz

68.10

4clocks

11clocks

35clocks

76.6ns

0.06ns/MHz

64

4clocks

11clocks

35clocks

Cache and Memory Benchmark 缓存及内存测试

缓存/内存带宽

缓存/内存带宽对比速度

速度因素(越小越好)

内部数据高速缓存

二级板载高速缓存

三级板载高速缓存

95.33GB/s

27.18MB/s/MHz

38.10

410.2GB/s

345.3GB/s

172.8GB/s

91.86GB/s

27.73MB/s/MHz

35.90

386GB/s

323.66GB/s

165GB/s

由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。

SPEC CPU 2006处理器子系统性能测试

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64

Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了

Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。

SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。

整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了nch PERL编程语言、2 压缩、 C编译器、 组合优化、 人工智能:围棋、 基因序列搜索、 人工智能:国际象棋、ntum 物理:量子计算、464.h264ref 视频压缩、p 离散事件仿真、 寻路算法、bmk XML处理共12项。

SPEC CPU 2006整数测试成绩

浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如 流体力学、 量子化学、 量子力学、 物理:计算流体力学、s 生物化学/分子力学、ADM 物理:广义相对论、3d 流体力学、 生物/分子、 有限元分析、 线形编程、优化、 影像光线追踪、ix 结构力学、TD 计算电磁学、 量子化学、 流体力学、 天气预报、3 语音

识别共17项测试。

SPEC CPU 2006浮点运算测试成绩

SPEC测试成绩中我们看到,二者测试成绩几乎相同,可见在不同的测试项目中,对主频的敏感度也并不相同,并不是主频高,测试成绩就一定好。

CineBench 11.5性能测试

CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。

CineBench 11.5测试成绩

从CineBench 11.5测试成绩中可以看出,二者测试成绩几乎相同。

总结

从Sisoftware Sandra 2011、SPEC CPU 2006以及CineBench 11.5的测试成绩中,我们可以看到,虽然E3-1240的主频略高,但是也并没有表现出明显的优势。我们相信主频越高,在某些方面会越好,但是在实际的采购中,更需要结合自身的实际情况加以考虑,而不是一味的追求高主频,高主频需要面对的是高价格和高功耗

2024年2月25日发(作者:华阳羽)

0.2GHz主频差距可有可无?至强E3-1220和E3-1240对比评测

服务器作为一种定制化的工具,各类别之间相差甚大,即使是同一系列的服务器,由于配置(包括处理器、内存、硬盘、Raid卡等等)差异,在性能上也会体现出很大的区别。处理器作为重要的组成部分之一,采购过程中,人们都习惯性的选择主频更高的,而对其中有多大的区别或许并不了解,IT168将通过对同一台服务器不同的处理器进行测试,为广大用户提供选购参考,今天我们采用的测试服务器为HP DL120 G7,测试的处理器为E3-1220和E3-1240。

惠普ProLiant DL120 G7是一款采用1U高度的机架式服务器,搭载了至强E3处理器平台。

惠普ProLiant DL120 G7服务器前后视图

前置USB接口和状态指示灯

惠普ProLiant DL120 G7的前面板设计比较简单,提供了4个3.5英寸的硬盘位,可以支

持SATA或SAS硬盘,后面板设计也比较简单。

惠普ProLiant DL120 G7开箱图

惠普ProLiant DL120 G7的内部空间非常宽敞。它内部有4个风扇用来散热,其中3个负责给处理器、内存等关键部件散热,1个用作阵列卡的散热。为了有效提升散热效果,惠普ProLiant DL120 G7服务器在处理器和内存部分还有一个导风罩,可以更好的促进空气流动。

惠普ProLiant DL120 G7配备的电源

惠普ProLiant DL120 G7标配了台达400W电源,对于E3这样低功耗的平台来说,400W已经足够。

惠普ProLiant DL120 G7服务器内部拆解

至强E3-1220处理器

至强E3-1240处理器

这次我们对比的是Intel至强E3平台下的两款处理器,分别为E3-1220和E3-1240,其

中E3-1240处理器,主频为3.3GHz,具备4核心8线程,TDP为80W;而E3-1220处理器主频为3.1GHz,4核心4线程,TDP同样为80W,为了单纯的比较主频对于服务器性能的影响,特意将E3-1240的超线程功能关掉,因而两颗处理器测试中均为4核心4线程,特此说明。

惠普ProLiant DL120 G7服务器内存

应对我们测试的要求,惠普ProLiant DL120 G7服务器一共配置了4条4GB DDR3 ECC内存,总容量16GB对于日常的E3处理器应用来说已经完全够用。

西部数据WD5003ABYX

惠普ProLiant DL120 G7服务器采用了西部数据WD5003ABYX硬盘,容量为500GB。测试中我们使用这些硬盘组建了RAID 5阵列。

惠普ProLiant DL120 G7服务器配备的阵列卡

惠普ProLiant DL120 G7服务器提供了一个P212阵列卡,并提供了对应的内存和电池。这块阵列卡可以实现RAID 5、RAID 6等常用阵列和RAID 0、RAID 1等基本阵列。

服务器扩展槽位置

惠普ProLiant DL120 G7服务器提供了4个扩展槽,分别是PCI-E X16、PCI-E X8和PCI-E

X4。

板载的显示芯片

板载的英特尔千兆网络芯片

惠普特色的iLO3远程管理芯片

服务器测试环境介绍

为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。

我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。

网络实验室控制台

千兆交换机,120个千兆网口

用于产生用户访问压力的塔式服务器

服务器测试工具介绍

对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也

是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。

处理器子系统测试

对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。

此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。

SPEC CPU 2006 v1.1

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC

CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU

2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作

的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034

Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel

Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。

内存子系统测试

对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。

SiSoftware Sandra v2011

SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows

Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware

Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

惠普ProLiant DL120 G7服务器配置一览

平台信息服务器

产品惠普DL120 G7服务器

名称

平台单路 Sandy Bridge-E3

类型

处理器子系统

处理器型Intel Xeon E3-1220

处理器架Intel 32nm Sandy Bridge

代号 Sandy Bridge

处理器封Socket 1155 LGA

核心/线程4/4

数量

主频 3.1GHz 3.3GHz

4/4

Socket 1155 LGA

Sandy Bridge

Intel 32nm Sandy Bridge

Intel Xeon E3-1240

单路 Sandy Bridge-E3

惠普DL120 G7服务器

处理MMX,SSE,SSE2,SSE3, MMX,SSE,SSE2,SSE3,

器指

令集 SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX SSE4.1,SSE4.2,EM64T,VT-x,AES,AVX

外部DMI

总线 5.0GT/S

L1

Code 4× 32KB 8路集合关联

Cache

L1

Data 4× 32KB 4路集合关联

Cache

L2

4× 256KB 8路集合关联

Cache

L3

8MB 16路集合关联

Cache

型号惠普ProLiant DL120 G7

主板

主板芯片惠普ProLiant DL120 G7

北桥2×QPI

芯片DMI

5.0GT/S

4× 32KB 8路集合关联

4× 32KB 4路集合关联

4× 256KB 8路集合关联

8MB 16路集合关联

服务器主板

惠普ProLiant DL120 G7

惠普ProLiant DL120 G7

2×QPI

特性

VT-d Gen 2 VT-d Gen 2

子系统内存

控制器内每集成双通道U-ECC DDR3 1333CPU 每集成双通道U-ECC DDR3 1333CPU

内存4GB R-ECC DDR3 1333 SDRAM ×4条 4GB R-ECC DDR3 1333 SDRAM ×4条

类型

存储子系统

磁盘 LSI Embedded MegaRAID SAS RAID LSI Embedded MegaRAID SAS RAID

控制Controller

磁盘控制4x SATA 3Gb/s 4x SATA 3Gb/s

Controller

器规 MatrixRAID 0/1/3/5

控制LSI MegaSR

器驱 13.06.0212.2009

型号LSI MegaSR

数量 13.06.0212.2009

硬盘

7200RPM

MatrixRAID 0/1/3/5

LSI MegaSR

13.06.0212.2009

LSI MegaSR 13.06.0212.2009

规格7200RPM

硬盘 500GB 500GB

SATA 3Gbps SATA 3Gbps

16MB Cache 16MB Cache

软件环境

操作Microsoft Windows Server 2008 Microsoft Windows Server 2008

系统 Enterprise R2 x64 Enterprise R2 x64

由于我们采用的是同一台服务器进行测试,并且关掉了E3-1240的超线程功能,因此,除了主频上的差异,其它并无区别。

处理器详细规格

至强E3-1240处理器是至强E3家族的中端产品,而E3-1220是E3系列的低端产品,下面我们通过CPU-Z软件来查看它的详细信息。

至强E3-1240处理器信息

至强E3-1220处理器信息

16GB内存容量

Sisoftware Sandra 2011处理器性能

SiSoftware Sandra Pro Business 2011

产品名称

平台类型

处理器型号

HP DL120 G7 HP DL120 G7

单路Intel SandyBridge 单路Intel SandyBridge

至强E3-1240(关超线程) 至强E3-1220

Processor Arithmetic Benchmark

处理器算术运算测试

总计本地功效

总计本地功效对比速度

Dhrystone iSSE4.2

Dhrystone iSSE4.2 vs SPEED

Whetstone iSSE3

Dhrystone iSSE3 vs SPEED

71GOPS

19.22MOPS/MHz

103.54GIPS

28.04MIPS/MHz

48.63GFLOPS

13.17MFLOPS/MHz

66.64GOPS

19.64MOPS/MHz

97.44GIPS

28.73MIPS/MHz

45.57GFLOPS

13.43MFLOPS/MHz

Processor Multi-Media Benchmark

处理器多媒体测试

总计多媒体功效

总计多媒体功效对比速度

Multi-Media Int x16 iSSE4.1

130.75MPixel/s

35.41kPixels/s/MHz

158.52MPixel/s

123MPixel/s

36.28kPixels/s/MHz

149.2MPixel/s

Multi-Media Int x16 iSSE4.1 vs

42.94kPixels/s/MHz

SPEED

Multi-Media Float x8 iSSE2 107.84MPixel/s

43.99kPixel/s/MHz

101.51MPixel/s

Multi-Media Float x8 iSSE2 vs

29.21kPixels/s/MHz

SPEED

Multi-Media Double x4 iSSE2 58.56MPixel/s

29.93kPixels/s/MHz

54.86MPixel/s

Multi-Media Double x4 iSSE2 vs

15.86kPixels/s/MHz

SPEED

16.17kPixels/s/MHz

Multi-Core Efficiency Benchmark

处理器效能测试

内联核带宽 8.63GB/s

内联核带宽对比速度 2.39MB/s/MHz

内联核延迟(越小越好) 39.2ns

内联核延迟对比速度(越小越好) 0.11ns/MHz

Java算数性能测试

总计 Java 功效 58.58GOPS

总计 Java 功效对比速度 16.31MOPSMHz

Dhrystone Java 108.55GIPS

Dhrystone Java对比速度 30.22MIPS/MHz

Whetstone Java 31.6GFLOPS

Whetstone Java对比速度 8.80MFLOPSMHz

Java多媒体性能测试

总计多媒体Java功效 18MPixel/s

总计多媒体Java功效对比速度 4.88kPixels/s/MHz

多媒体整数 x1 Java 20.68MPixel/s

多媒体整数 x1 Java对比速度 5.60kPixels/s/MHz

多媒体浮点数 x1 Java 15.7MPixel/s

多媒体浮点数 x1 Java对比速度 4.25kPixels/s/MHz

多媒体双精度 x1 Java 16MPixel/s

8GB/s

2.44MB/s/MHz

42.0ns

0.12ns/MHz

57GOPS

16.81MOPSMHz

109.83GIPS

32.38MIPS/MHz

29.6GFLOPS

8.73MFLOPS/MHz

17MPixel/s

4.99kPixels/s/MHz

19.4MPixel/s

5.72kPixels/s/MHz

14.79MPixel/s

4.36kPixels/s/MHz

14.76MPixel/s

多媒体双精度 x1 Java对比速度 4.32kPixels/s/MHz 4.35kPixels/s/MHz

.NET Arithmetic Benchmark

.NET算术运算测试

总计 .NET 功效

总计 .NET 功效对比速度

Dhrystone .NET

Dhrystone .NET vs SPEED

Whetstone .NET

Whetstone .NET vs SPEED

21.32GOPS

5.77MOPS/MHz

15.26GIPS

4.13MIPS/MHz

29.77GFLOPS

8.06MFLOPS/MHz

19.77GOPS

6.00MOPS/MHz

14.15GIPS

4.30MIPS/MHz

27.63GFLOPS

8.39MFLOPS/MHz

.NET Multi-Media Benchmark .NET多媒体测试

总计多媒体.NET功效

总计多媒体.NET功效对比速度

多媒体整数 x1 .NET

多媒体整数x1 .NET vs SPEED

多媒体浮点数 x1 .NET

14.85MPixel/s

4.02kPixels/MHz

28.24MPixel/s

7.65kPixels/s/MHz

7.8MPixel/s

14MPixel/s

4.14kPixels/s/MHz

26.54MPixel/s

7.82kPixels/s/MHz

7.41MPixel/s

2.19kPixels/s/MHz

14.74MPixel/s

4.35kPixels/s/MHz

多媒体浮点数 x1 .NET vs SPEED 2.12kPixels/s/MHz

多媒体双精度 x1 .NET 15.63MPixel/s

多媒体双精度 x1 .NET vs SPEED 4.23kPixels/s/MHz

测试成绩中我们可以看到,由于存在0.2GHz的主频差距,两款处理器之间的测试成绩略微存在差距,经粗略计算,各项测试成绩基本与主频成正比。

Sisoftware Sandra 2011内存缓存性能

SiSoftware Sandra Pro Business 2011

产品名称

平台类型

处理器型号

HP DL120 G7

Intel SandyBridge

HP DL120 G7

Intel SandyBridge

至强E3-1240(关超线程) 至强E3-1220

Memory Bandwidth Benchmark

内存带宽测试

总体内存性能

总体内存性能对比速度

整数 B/F iSSE2 内存带宽

整数 B/F iSSE2 内存带宽对比速17.3GB/s

13.29MB/sMHz

17.3GB/s

17.27GB/s

13.28MB/sMHz

17.27GB/s

13.30MB/sMHz

整数 B/F iSSE2 内存带宽

整数 B/F iSSE2 内存带宽对比速13.29MB/sMHz

Memory Latency Benchmark

17.29GB/s

13.28MB/sMHz

17.27GB/s

13.28MB/sMHz

内存延迟测试

内存延迟(越小越好)

内存延迟对比速度 (越小越好)

速度因素 (越小越好)

内部数据高速缓存

二级板载高速缓存

三级板载高速缓存

75.3ns

0.06ns/MHz

68.10

4clocks

11clocks

35clocks

76.6ns

0.06ns/MHz

64

4clocks

11clocks

35clocks

Cache and Memory Benchmark 缓存及内存测试

缓存/内存带宽

缓存/内存带宽对比速度

速度因素(越小越好)

内部数据高速缓存

二级板载高速缓存

三级板载高速缓存

95.33GB/s

27.18MB/s/MHz

38.10

410.2GB/s

345.3GB/s

172.8GB/s

91.86GB/s

27.73MB/s/MHz

35.90

386GB/s

323.66GB/s

165GB/s

由于内存测试和主频关系不大,我们看到内存带宽及内存延迟几乎没有差距,只是在缓存测试中有一些区别。

SPEC CPU 2006处理器子系统性能测试

SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。

SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64

Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了

Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。

SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。

整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了nch PERL编程语言、2 压缩、 C编译器、 组合优化、 人工智能:围棋、 基因序列搜索、 人工智能:国际象棋、ntum 物理:量子计算、464.h264ref 视频压缩、p 离散事件仿真、 寻路算法、bmk XML处理共12项。

SPEC CPU 2006整数测试成绩

浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如 流体力学、 量子化学、 量子力学、 物理:计算流体力学、s 生物化学/分子力学、ADM 物理:广义相对论、3d 流体力学、 生物/分子、 有限元分析、 线形编程、优化、 影像光线追踪、ix 结构力学、TD 计算电磁学、 量子化学、 流体力学、 天气预报、3 语音

识别共17项测试。

SPEC CPU 2006浮点运算测试成绩

SPEC测试成绩中我们看到,二者测试成绩几乎相同,可见在不同的测试项目中,对主频的敏感度也并不相同,并不是主频高,测试成绩就一定好。

CineBench 11.5性能测试

CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。

CineBench 11.5测试成绩

从CineBench 11.5测试成绩中可以看出,二者测试成绩几乎相同。

总结

从Sisoftware Sandra 2011、SPEC CPU 2006以及CineBench 11.5的测试成绩中,我们可以看到,虽然E3-1240的主频略高,但是也并没有表现出明显的优势。我们相信主频越高,在某些方面会越好,但是在实际的采购中,更需要结合自身的实际情况加以考虑,而不是一味的追求高主频,高主频需要面对的是高价格和高功耗

发布评论

评论列表 (0)

  1. 暂无评论