扫一扫
关注微信公众号

Intel四核至强产品Clovertown评测(1)
2007-07-28   CNET中国·ZOL 

498)this.style.width=498;" align=no>

转眼间,AMD与Intel两大厂商之间GHz频率之争都已经成为了历史。现在除非是比较同一个系列的处理器相比较,否则频率速度的高低并不能完全反应CPU的性能。就处理器发展趋势来看,处理器乃至整个平台的性能取决于单个CPU的核心数目,因此我们看到Intel正在积极从双核心移转为四核心处理器。(在07年3月20日Intel在中国北京结束了多核应用论坛上,Intel服务器产品市场经理\服务器平台事业部——顾凡先生,已经明确表示四核处理将成为07年双路服务器市场的主流。)

四核心的桌面级处理器Core 2 Extreme QX6700是Intel于2006年11月14日发布的,同时Intel也发布了基于研发代号为Clovertown的Xeon 5355服务器/工作站版本。AMD与Intel不再从处理器压榨出更高频率,而是注重转向设计多核处理器是有许多原因的。其中之一是,更多执行核心可以同时承受更多工作负载,前提条件是用户要使用较新的操作系统,以设计有多线程的应用程序(threads-目前大多数新软件都是如此设计)执行。理论上讲,单颗CPU内的核心数量增加1倍,也可以获得双倍的性能提高;虽然缓存与接口(interface)理论上会限制的效能,但更的多核心设计有助于性能的提高,也比传统提升频率的做法要更直接。此外,频率增加也会大幅增加耗电需求,但增加处理单元时的耗电需求只会稳定地以线性提升。

用户大概会以为双核心或四核心处理器的体积会比单核心处理器的外观大很多,事实上则不然。虽然晶体管数目倍数成长,但硅晶元体积并未大幅增加。由于目前的制程技术能以符合经济效益的方式生产(生产较大的硅晶元产品成本高昂),因此AMD与Intel都有办法让处理器核心数加倍而价格基本保持不变;目前多数处理器仍是以90nm制程工艺生产,AMD籍此生产其Opteron双核心Italy处理器,而英特尔则藉此生产其第一代双核心Xeon Paxville处理器。

不过,65nm制程的出现使英特尔足以满怀信心地部署四核心产品。在桌面级市场Intel推出了Core 2 Quad的Kentsfield来满足需求,而在服务器及工作站领域Intel则推出了Clovertown的Xeon 5300系列处理器,但近期内不会有笔记本的四核处理器推出。虽然AMD在2007年春季之前不会推出四核心Opteron,但计划会推出名符其实的单裸晶(die)四核心处理器;而英特尔则是将二个双核心Woodcrest Xeon整合于单一处理器上,打造出一颗四核心处理器。尤于英特尔的设计有其劣势,某些人称这种方式为临时快捷方式(quick-and-dirty),但实际效果却很显著;英特尔提供1.6至3.0GHz之间的版本,采用2x 4MB L2缓存及FSB1066或FSB1333MHz。

(其实在测试之前,我们要补充一段内容,这段内容摘自2007年3月20日Intel多核应用论坛的专访,主要是针对处理器die的封装问题, Intel的服务器产品市场经理回答道:在我们的计划中没有将65纳米的四核处理器的2个die合成一个 die,包括在45纳米发布前我们也没有这个打算。首先用户不会关心双核处理器的封装形式,他们关注的是产品的性能、功耗及价格。在我们出售的四核产品中用户对我们的产品非常满意,至于讨论怎样的处理器封装形式我认为是没有太多意义的。作为Intel,我们要为用户考虑,如何可以让用户可以用更低的成本获得更高的投资回报,这是我们要做的事情。另外针对这种将两个die合成一个die的方式会让Intel在制造成本方面增加很多的成本,而这些成本也会提高用户的投资成本,因此我们采用目前的这样方法是比较经济的。从技术的层面来看,实现一个die的封装形式非常简单,Intel也完全有能力制造这种产品,我们会在Q4推出的45纳米产品中增加一些新的技术,对65纳米的四核产品不会做改动。)

下面就让我们来看看四核心Xeon有什么能耐。

498)this.style.width=498;" align=no>

将两颗双核Xeon 51xx Woodcrest处理器合并在一起四核Xeon 53xx就这样诞生了

498)this.style.width=498;" align=no>

从左到右依次:Dempsey(3.73-GHz NetBurst双核心)、Woodcrest(3.0-GHz Core 2双核心)、Clovertown(3.0-GHz core 2四核心)

一般而言,更多核心所需要的耗电更多的说法是正确的。当CPU负载较高时,所要运作的晶体管数也就更多,因此需要的电力也就更多。然而新款处理器都内建省电机制,AMD称之为Cool and Quiet(凉又静)技术,Intel则在桌面市场和移动市场提供SpeedStep技术,在专业产品中加上DBS(Demand-Based Switching,依需求切换)技术。省电的功能也是用类似的方式运作,这需要主板BIOS 与操作系统及处理器驱动程序的支持。驱动程序会监督系统工作的负载,当工作需求低时,会促使处理器降低核心频率与工作电压。当操作系统需要更多性能时,频率就会随之增加。AMD的Cool and Quiet技术提供多个频率区隔,而Intel的SpeedStep技术只有二个频率等级:最大与SpeedStep速度。作为媒体第三方我们并不偏爱任何一家的技术,其间的优胜劣败得视使用者的特定环境而定,无论是AMD或Intel处理器用户,只要确定Cool and Quiet与DBS功能有开启即可,这会在大型系统环境中节省电源,并有助于系统散热与空调降温。

在核心数量增加的同时,厂商也会推出更多省电的技巧。处理器可以关闭不用的核心或不使用的缓存区段;英特尔的 65nm产品多采用闲置时(睡眠模式)不需要电源的省电频率闸(clock gating),或称为睡眠晶体管。与双核心系统相比,四核心计算机在高负载情况下的耗电与热度更高,不过由于可以享受到的效能增长前所未有,因此这个缺点倒是可以接受,但其间的考虑因素绝对合理。如果系统热度与耗电增加15∼20%,但一项高需求工作负载的处理时间降低15∼40%,那么计算机可以更快返回低耗电模式,此状态下的耗电只比双核心多出一些,而双核心会在较高耗电状态下保持较长的时间。

Xeon处理器的设计额定功率在65W或80W,而所有四核心Xeon(1.6、1.86与2.33 GHz)也不会超过这个额定功率,只有主频为3.0 GHz型号需要较高的120W的功耗。

多核心瓶颈

多核瓶颈在于让高性能装置发挥效率,也就是需要一个快速的数据存储路径,就快速3D绘图方案而言,高速绘图内存是必要的。如果我们再回头观察处理器,会发现接口(interface)是其瓶颈所在,尤其是英特尔架构。目前AMD的所有处理器都已内建DDR或DDR2 内存控制器,也就是说处理器核心要存取数据时,已不需数据路径;而英特尔方案仍需要将内存控制芯片设计在芯片组中,虽然英特尔已为Xeon平台提供 Dual Independent Front Side Bus与四信道DDR2内存控制器,但所有核心仍共享数据路径。(FB-DIMM英文全称为“Fully Buffered-DIMM”,又称为全缓冲双列内存模组的推出也是为缓解内存在数据交换时的不足。)

这个整个问题显得有点棘手:你可以想象二颗八核心处理器争夺同一组RAM资源是什么情况吗?AMD的产品无法这么做,因为每个处理器皆使用本身的内存。是的,如果一颗处理器存取位于另一颗处理器的RAM或L2缓存上的资料,会有一致性的问题出现,但最终的结果还是可以令人接受。此外,未来的操作系统也能察觉实体处理器的存在(Windows Vista Ultimate Edition),因此可以指定执行绪或应用程序工作负载给特定处理器,这是有助于激发工作负载平衡的聪明办法;这个方法同时适用于Opteron与 Xeon平台,相对来看AMD方案比较有利。

498)this.style.width=498;" align=no>

两款双核处理器

5000系列的意义在于它是英特尔推出第一款双核心架构的Xeon处理器,在双核心Paxville推出不久, Intel很快又推出了(Dempsey)90nm双核心处理器,严格地说Dempsey才是Intel推出的第一款双核产品,但这些产品仍是以 NetBurst架构设计。而最新Core 2微架构设计的Xeon Woodcrest称为5100,四核心的Xeon Clovertown命名为5300;最后二个数字代表CPU型号与总线速度。请参阅以下表格,找出你平台适用的Xeon型号。

处理器型号

架构

快取

频率

FSB

耗电

系统类型

四核心

双核心

HT技术

X5355

65nm

8 MB L2

2.66 GHz

FSB1333

120W

DP(桌上型)

X

E5345

65nm

8 MB L2

2.33 GHz

FSB1333

80W

DP(桌上型)

X

E5320

65nm

8 MB L2

1.86 GHz

FSB1066

80W

DP(桌上型)

X

E5310

65nm

8 MB L2

1.60 GHz

FSB1066

80W

DP(桌上型)

X

5160

65 nm

4 MB

3.0 GHz

FSB1333

80W

DP(桌上型)

X

5150

65 nm

4 MB

2.66 GHz

FSB1333

65W

DP(桌上型)

X

5148 LV

65 nm

4 MB

2.33 GHz

FSB1333

40W

DP(桌上型)

5140

65 nm

4 MB

2.33 GHz

FSB1333

65W

DP(桌上型)

X

5130

65 nm

4 MB

2.00 GHz

FSB1333

65W

DP(桌上型)

X

5120

65 nm

4 MB

1.87 GHz

FSB1066

65W

DP(桌上型)

X

5110

65 nm

4 MB

1.6 GHz

FSB1066

65W

DP(桌上型)

X

5080

65 nm

2x2 MB

3.73 GHz

FSB1066

130W

DP(桌上型)

X

X

5063

65 nm

2x2 MB

3.20 GHz

FSB1066

95W

DP(桌上型)

X

X

5060

65 nm

2x2 MB

3.20 GHz

FSB1066

130W

DP(桌上型)

X

X

5050

65 nm

2x2 MB

3.00 GHz

FSB667

95W

DP(桌上型)

X

X

5030

65 nm

2x2 MB

2.67 GHz

FSB667

95W

DP(桌上型)

X

X

498)this.style.width=498;" align=no>



英特尔结合二颗Woodcrest Xeon 5100处理器,在单一处理器上打造四核心Clovertown。实际上,它是颗“双”双核心,二个核心都拥有本身的4MB共享二级缓存。

498)this.style.width=498;" align=no>

Socket 771、FSB1333或FSB1066

所有Xeon 5300系列处理器都是采用目前英特尔服务器产品主流的Socket LGA 771针脚设计,目前有四个版本:FSB1066平台的1.6与1.86 GHz版本和FSB1333的2.33与3.0 GHz版本,用户需要购买英特尔的5000芯片组系列,才能支持FSB1066或FSB1333MHz的处理器。

英特尔的处理器总线是以四倍数据传输率(QDR)技术设计,也就是说每个频率周期可以传输四个数据区块(chunk)。有鉴于此,你可以知道 FSB1333是根据333 MHz频率速度,而FSB1066的速度为266 MHz。我们很高兴看到英特尔能针对四核心处理器的性能采用较快的333MHz频率,从而暂时解决了目前的瓶颈威胁。

Xeon Clovertown架构

如果你对Core 2微架构(新款Xeon采用)的细节有兴趣,我们建议你可以阅读IDF Spring 2006文件,IDF Spring 2006:英特尔的微架构是否会拉近技术差距?

5000芯片组提供三种版本支持双核及四核Xeon 5300平台。5000V定位于廉价的超值版,它的内存容量只支持到32GB内存,其它两款可支持最高64GB的全缓冲式DDR2内存(DDR2-533或667),无论有无ECC、双信道或四信道模式。北桥与南桥是通过x4 PCI Express连结,5000系列提供20个PCI Express线道(lane),根据芯片组型号定义不同搭配方式。

早期的E7500新片组与最新5000系列芯片组的主要差别在于后者的Dual Independent Bus(DIB)架构,旧式Xeon平台上的处理器必须分享可能形成瓶颈所在的FSB(前端总线),现在每个处理器插槽都使用本身的接口。由于频率速度提升为333MHz,每颗处理器的总线频率提升为10.66 GB/s,即使在266 MHz的速度,带宽仍有8.33 GB/s。


热词搜索:

上一篇:中兴ZXF20双路双核服务器测试报告
下一篇:有关Debug命令的重要信息(2)

分享到: 收藏