2024年4月2日发(作者:郦运珹)
.c_技术前沿
]文/图甘心@人
近年来.AMD在处理器市场混的也算不错.特别是几款高
性价比的双核.三核和四核处理器上市赚足了消费者眼球.也
挣到了银子。不过随着Intel的Core l系列处理器的推出 AMD处
计.这让处理器在功能更加灵活的基础上更容易控制成本。目前,
无论是羿龙fPhen0m)四核,三核还是双核处理器的内核结构
都是统一采用四核(或者更多核)的物理结构.再根据市场策
略对内核进行有选择的屏蔽 这样难以控制成本 而BulIbozer处
理器所引入的模块化设计刚好可以解决这个问题
理器在性能上毫无优势可言了,在Inte 虽悍的技术实力和领先的
市场份额面前 AMD显得有点力不从心。因此,AMD只有再次
进行技术创新 才有希望改变一直被Intel所压迫的局面。
在今年8月底至9月期间.AMD向外界发布了大量下~代处
理器BulIdozer(中文代号“推土机”)的信息。很显然.AMD将
希望全部寄托在了Bu
Bu J jdoze r处理
1.Bul Ibozer如何实现模块化设计
Bul】dozer在核
心设计方面每两个
核心组成一个单独
的单元(称之为 核
心模块 两块物
理内核集成到一个
模块中),比如双
核处理器只需要集
器将会首先应用于
服务器领域,预计
首批芯片将是代号
为”InterIagos 的
服务器处理器.核
心数在1 2个至1 6个
之间;而针对桌面
成一个模块就可以
了 即使是八核处
理器也只需要集成
四个模块.这让产
Bulldozer的“核心模块”
品生产及成本控制
更加具有灵活性
处理器核心模块的
两个核心各自拥有
一
级缓存.但是共
享二级缓存和预取、
解码单元,所有的
核心模块“共享
Bulldozer处理器(两个核心模块组成)示意图
8MB三级缓存和北桥模块。
2。未来AMD处理器的内核数量如何定义
未来的新架构四核心处理器指的是四个这样的模块呢,还
是四个计算核心呢7 AMD对此给出的回复是: 将每个拥有双
整数核心的BulIdozer模块视为一个独立的单元就对了。 显然.
78
技术前沿r ̄rela.d
编辑蕊里杰/蔓编吴杰平
AMD在这里可以回避单纯的核心数量问题,更强调两两组成的
有机整体.所以在面对推土机架构处理器的时候我们可以说它
是四核心、八核心的 也可以说成是双模块、四模块的。
2.浮点和整数计算性能大幅提升
Bul Idozer所采用的集群多线程架构之所以能实现如此高的性
能,其中一个大原因就是AMD增加了CPU的运算单元.每一个模
块都具备可以将一个大任务细分为多个并行任务的能力。 ButI-
高效的集群多线程架构
1.多线程(SMT) 多核心(CMP)都存在不少缺点
尽管多线程、多核和BLJlld。zer在线程并行执行方面是相同的.
但是内核的分区却截然不同。多线程就是在一个单个的处理核
心内同时执行多个工作线程 多核心则是通过集成多个处理内
核提升处理能力。
dozer模块的两个核心支持执行两个线程,会共享对延迟要求较
高的功能.好处是比两个线程共享一个核心有更高的伸缩性和
可预测性
BulIdozer这种将两个线程的整数运算独立开来的设计可以更
有效地提高处理器在基本应用中的性能。由于Intel的Nehalem架
构的超线程技术是两个硬件线程共享3组运算单元,冲突在所难
现在主流的多核处理器都是用了CMP技术.而像PentIum 4、
Core i7这样的处理器所谓的 超线程技术”则属于多线程技术,
而Bulldozer是基于集群多线程架构( ̄pCluster-Based iVuilti-threading.
简称CMT)。BulIdozer的内核模块是~个可以同时运行两个线程
的处理组件,两个内核可以执行两个完全不会相互干扰的线程。
免,而BulIdoze rEIJ是两个硬件线程独享4个整数运算单元 性能
提升将会更加明显。
3。分支预测与功耗优化
BulIdozer架构拥有一条更深层的管线,这条管线依靠改进型
分支预测与预取器来解决由错误的分支预测造成的瓶颈问题。
但与旧架构不同,
预测与读取管线都
运行在非耦合状态
下 未提取地址序
列由预测器创建.
允许取逻辑通过这
个序列并与指令缓
存中的数据进行对
比
BuI Idoze r还在
定向预测指令预取
能效,电源管理方
面做了大量努力.微架构方面支持资源动态共享、数据转移最
Bulldozer核心模块微架构
小化、大量时钟和电源栅极.并增加了主动电源管理(APM),
支持芯片级的核心功耗栅极。根据不同的工作负载.芯片功耗
也会实时相应调整.同时给超频留下了空间。
Bul Idozer还将支持Turbo Core特性,而且会t::[:;Thuban(Phen-
om Il×6)里的有所改进.将会有一些增强使其动力更强劲。这
是服务器处理器第一次引入Turbo Core技术。我们预计这会在使
用单线程程序的时候带来显著性能提升,同时对大负载量也会
有帮助
总结:Bulldozer处理器在架构设计上面做出了重要的改
变,而且就目前来看这样的改变是相当重要,而且改变得相
当出色。模块化的设计和集群多线程架构不但能够灵活地实
现多线程处理的需求,而且还能降低不必要的成本浪费。圈
Bulldozer微架构之共享浮点单元
现代计冀鞭\2010 10 79
2024年4月2日发(作者:郦运珹)
.c_技术前沿
]文/图甘心@人
近年来.AMD在处理器市场混的也算不错.特别是几款高
性价比的双核.三核和四核处理器上市赚足了消费者眼球.也
挣到了银子。不过随着Intel的Core l系列处理器的推出 AMD处
计.这让处理器在功能更加灵活的基础上更容易控制成本。目前,
无论是羿龙fPhen0m)四核,三核还是双核处理器的内核结构
都是统一采用四核(或者更多核)的物理结构.再根据市场策
略对内核进行有选择的屏蔽 这样难以控制成本 而BulIbozer处
理器所引入的模块化设计刚好可以解决这个问题
理器在性能上毫无优势可言了,在Inte 虽悍的技术实力和领先的
市场份额面前 AMD显得有点力不从心。因此,AMD只有再次
进行技术创新 才有希望改变一直被Intel所压迫的局面。
在今年8月底至9月期间.AMD向外界发布了大量下~代处
理器BulIdozer(中文代号“推土机”)的信息。很显然.AMD将
希望全部寄托在了Bu
Bu J jdoze r处理
1.Bul Ibozer如何实现模块化设计
Bul】dozer在核
心设计方面每两个
核心组成一个单独
的单元(称之为 核
心模块 两块物
理内核集成到一个
模块中),比如双
核处理器只需要集
器将会首先应用于
服务器领域,预计
首批芯片将是代号
为”InterIagos 的
服务器处理器.核
心数在1 2个至1 6个
之间;而针对桌面
成一个模块就可以
了 即使是八核处
理器也只需要集成
四个模块.这让产
Bulldozer的“核心模块”
品生产及成本控制
更加具有灵活性
处理器核心模块的
两个核心各自拥有
一
级缓存.但是共
享二级缓存和预取、
解码单元,所有的
核心模块“共享
Bulldozer处理器(两个核心模块组成)示意图
8MB三级缓存和北桥模块。
2。未来AMD处理器的内核数量如何定义
未来的新架构四核心处理器指的是四个这样的模块呢,还
是四个计算核心呢7 AMD对此给出的回复是: 将每个拥有双
整数核心的BulIdozer模块视为一个独立的单元就对了。 显然.
78
技术前沿r ̄rela.d
编辑蕊里杰/蔓编吴杰平
AMD在这里可以回避单纯的核心数量问题,更强调两两组成的
有机整体.所以在面对推土机架构处理器的时候我们可以说它
是四核心、八核心的 也可以说成是双模块、四模块的。
2.浮点和整数计算性能大幅提升
Bul Idozer所采用的集群多线程架构之所以能实现如此高的性
能,其中一个大原因就是AMD增加了CPU的运算单元.每一个模
块都具备可以将一个大任务细分为多个并行任务的能力。 ButI-
高效的集群多线程架构
1.多线程(SMT) 多核心(CMP)都存在不少缺点
尽管多线程、多核和BLJlld。zer在线程并行执行方面是相同的.
但是内核的分区却截然不同。多线程就是在一个单个的处理核
心内同时执行多个工作线程 多核心则是通过集成多个处理内
核提升处理能力。
dozer模块的两个核心支持执行两个线程,会共享对延迟要求较
高的功能.好处是比两个线程共享一个核心有更高的伸缩性和
可预测性
BulIdozer这种将两个线程的整数运算独立开来的设计可以更
有效地提高处理器在基本应用中的性能。由于Intel的Nehalem架
构的超线程技术是两个硬件线程共享3组运算单元,冲突在所难
现在主流的多核处理器都是用了CMP技术.而像PentIum 4、
Core i7这样的处理器所谓的 超线程技术”则属于多线程技术,
而Bulldozer是基于集群多线程架构( ̄pCluster-Based iVuilti-threading.
简称CMT)。BulIdozer的内核模块是~个可以同时运行两个线程
的处理组件,两个内核可以执行两个完全不会相互干扰的线程。
免,而BulIdoze rEIJ是两个硬件线程独享4个整数运算单元 性能
提升将会更加明显。
3。分支预测与功耗优化
BulIdozer架构拥有一条更深层的管线,这条管线依靠改进型
分支预测与预取器来解决由错误的分支预测造成的瓶颈问题。
但与旧架构不同,
预测与读取管线都
运行在非耦合状态
下 未提取地址序
列由预测器创建.
允许取逻辑通过这
个序列并与指令缓
存中的数据进行对
比
BuI Idoze r还在
定向预测指令预取
能效,电源管理方
面做了大量努力.微架构方面支持资源动态共享、数据转移最
Bulldozer核心模块微架构
小化、大量时钟和电源栅极.并增加了主动电源管理(APM),
支持芯片级的核心功耗栅极。根据不同的工作负载.芯片功耗
也会实时相应调整.同时给超频留下了空间。
Bul Idozer还将支持Turbo Core特性,而且会t::[:;Thuban(Phen-
om Il×6)里的有所改进.将会有一些增强使其动力更强劲。这
是服务器处理器第一次引入Turbo Core技术。我们预计这会在使
用单线程程序的时候带来显著性能提升,同时对大负载量也会
有帮助
总结:Bulldozer处理器在架构设计上面做出了重要的改
变,而且就目前来看这样的改变是相当重要,而且改变得相
当出色。模块化的设计和集群多线程架构不但能够灵活地实
现多线程处理的需求,而且还能降低不必要的成本浪费。圈
Bulldozer微架构之共享浮点单元
现代计冀鞭\2010 10 79