pci Express-USB迷|专注于互联网分享

2024年6月13日发(作者：性睿明)

pci Express

百科名片

PCI Express插槽（黄和绿色

PCI Express是新一代的总线接口。早在2001年的春季，英特尔公司就提出了要用新一代

的技术取代PCI总线和多种芯片的内部连接，并称之为第三代I/O总线技术。随后在2001

年底，包括Intel、AMD、DELL、IBM在内的20多家业界主导公司开始起草新技术的规范，

并在2002年完成，对其正式命名为PCI Express。它采用了目前业内流行的点对点串行连

接，比起PCI以及更早期的计算机总线一个很高的频率，达到PCI所不能提供的高带宽。

基本概念

PCI Express的接口根据总线位宽不同而有所差异，包括X1、X4、X8以及X1

6（X2模式将用于内部接口而非插槽模式）。较短的PCI Express卡可以插入较长

的PCI Express插槽中使用。PCI Express接口能够支持热拔插，这也是个不小的

飞跃。PCI Express卡支持的三种电压分别为+3.3V、3.3Vaux以及+12V。用于取代

AGP接口的PCI Express接口位宽为X16，将能够提供5GB/s的带宽，即便有编码

上的损耗但仍能够提4GB/s左右的实际带宽，远远超过AGP 8X的2.1GB/s的带宽。

PCI Express规格从1条通道连接到32条通道连接，有非常强的伸缩性，以满

足不同系统设备对数据传输带宽不同的需求。例如，PCI Express X1规格支持双向

数据传输，每向数据传输带宽250MB/s，PCI Express X1已经可以满足主流声效芯

片、网卡芯片和存储设备对数据传输带宽的需求，但是远远无法满足图形芯片对数据

传输带宽的需求。因此，必须采用PCI Express X16，即16条点对点数据传输通

道连接来取代传统的AGP总线。PCI Express X16也支持双向数据传输，每向数据

传输带宽高达4GB/s，双向数据传输带宽有8GB/s之多，相比之下，目前广泛采用

的AGP 8X数据传输只提供2.1GB/s的数据传输带宽。

尽管PCI Express技术规格允许实现X1（250MB/秒），X2，X4，X8，X12，X

16和X32通道规格，但是依目前形式来看，PCI Express X1和PCI Express X16

将成为PCI Express主流规格，同时芯片组厂商将在南桥芯片当中添加对PCI Expr

ess X1的支持，在北桥芯片当中添加对PCI Express X16的支持。除去提供极高数

据传输带宽之外，PCI Express因为采用串行数据包方式传递数据，所以PCI Expr

ess接口每个针脚可以获得比传统I/O标准更多的带宽，这样就可以降低PCI Expre

ss设备生产成本和体积。另外，PCI Express也支持高阶电源管理，支持热插拔，

支持数据同步传输，为优先传输数据进行带宽优化。

在兼容性方面，PCI Express在软件层面上兼容目前的PCI技术和设备，支持P

CI设备和内存模组的初始化，也就是说目前的驱动程序、操作系统无需推倒重来，就

可以支持PCI Express设备。PCI Express是新一代能够提供大量带宽和丰富功能

以实现令人激动的新式图形应用的全新架构。PCI Express可以为带宽渴求型应用分

配相应的带宽，大幅提高中央处理器（CPU）和图形处理器（GPU）之间的带宽。对

最终用户而言，他们可以感受影院级图象效果，并获得无缝多媒体体验。

PCI Express采用串行方式传输Data。它和原有的ISA、PCI和AGP总线不同。

这种传输方式，不必因为某个硬件的频率而影响到整个系统性能的发挥。当然了，整

个系统依然是一个整体，但是我们可以方便的提高某一频率低的硬件的频率，以便系

统在没有瓶颈的环境下使用。以串行方式提升频率增进效能，关键的限制在于采用什

么样的物理传输介质。目前人们普遍采用铜线路，而理论上铜这个材质可以提供的传

输极限是10 Gbps。这也就是为什么PCI Express的极限传输速度的答案。

因为PCI Express工作模式是一种称之为“电压差式传输”的方式。两条铜线，通

过相互间的电压差来表示逻辑符号0和1。以这种方式进行资料传输，可以支持极高

的运行频率。所以在速度达到10Gbps后，只需换用光纤（Fibre Channel）就可以

使之效能倍增。

PCI Express是下一阶段的主要传输总线带宽技术。然而，GPU对总线带宽的

需求是子系统中最高的，显而易见的是，视频在PCI Express应占有一定的分量。

显然，PCI Express的提出，并非是总线形式的一个结束。恰恰相反，其技术的成熟

仍旧需要这个时间。当然了，趁这个时间，那些芯片、主板、视频等厂家是否能出来

支持是PCI Express发展的关键。不过，至今依然被看好的AGP8X的性能与PCI

Express在性能上的差距虽然不是太明显，但是随着PCI Express的完善，其差距将

是不言而喻的。

PCI-Express是最新的总线和接口标准，它原来的名称为“3GIO”，是由英特尔提

出的，很明显英特尔的意思是它代表着下一代I/O接口标准。交由PCI-SIG（PCI特

殊兴趣组织）认证发布后才改名为“PCI-Express”。这个新标准将全面取代现行的PC

I和AGP，最终实现总线标准的统一。它的主要优势就是数据传输速率高，目前最高

可达到10GB/s以上，而且还有相当大的发展潜力。PCI Express也有多种规格，从

PCI Express 1X到PCI Express 16X，能满足现在和将来一定时间内出现的低速设

备和高速设备的需求。能支持PCI Express的主要是英特尔的i915和i925系列芯片

组。当然要实现全面取代PCI和AGP也需要一个相当长的过程，就象当初PCI取代

ISA一样，都会有个过渡的过程。

与其他传输规格比较

PCI Express x16 插槽 PCI Express x1 插槽

PCIe的规范主要是为了提升电脑内部所有总线的速度，因此频宽有多种不同规

格标准，其中PCIe x16是专为显卡所设计的部分。AGP的资料传输效率最高为2.1

GB／s，不过对上PCIe x16的8GB／s，很明显的就分出胜负，但8GB／s只有指

资料传输的理想值，并不是使用PCIe接口的显示卡，就能够有突飞猛进的效能表现，

实际的测试数据上并不会有这么大的差异存在。

传输通道数脚Pin总数主接口区Pin数总长度主接口区长

度

x16

规格

PCI 2.3

PCI-X 1.0

PCI-X 2.0（DDR）

PCI-X 2.0（QDR）

AGP 2X

AGP 4X

AGP 8X

PCI-E 1X

PCI-E 2X

PCI-E 4X

PCI-E 8X

PCI-E 16X

164

总线宽度

32 位元

64 位元

32 位元

8 位元

142

工作时脉

33/66 MHz

66/100/133 MHz

133 MHz

66 MHz

2.5 GHz

25 mm

39 mm

56 mm

89 mm

传输速率

133/266 MiB/s

533/800/1066 MiB/s

2.1 GiB/s

4.2 GiB/s

532 MiB/s

1.0 GiB/s

2.1 GiB/s

512 MiB/s（双工）

1.0 GiB/s（双工）

2.0 GiB/s（双工）

4.0 GiB/s（双工）

8.0 GiB/s（双工）

7.65 mm

21.65 mm

38.65 mm

71.65 mm

甚至对于某些 PCI-E 1X插槽，我们完全可以将其锯开（这样有可能会失去质保），

比如可以用来插上NVDIA的显卡做为物理加速卡与ATI显卡一同工作。

解决PCI Express协议一致性问题

在开发第一块基于PCI Express的SoC过程中，ClearSpeed公司为了在有限的

时间和预算条件下确保PCI Express协议一致性而面临重重困难。PCI Express是

一种复杂的协议，具有特别大的覆盖范围。从管理的角度看，保证协议一致性没有其

它更好的方法，只有采用标准驱动的验证过程。遗憾的是，即使做了上千次覆盖相关

场景的测试，仍留有相当大的覆盖漏洞，从而使得这个方法没有可预测性，成本也很

高。而另外一种普通的随机测试方法也没有足够的可预测性。

ClearSpeed公司开始意识到，理想的方法可以产生显著的好处：它能最小化技

术开发工作量，同时最大化测试应用控制。ClearSpeed公司率先采用Cadence公司

提供的商用化PCIe验证IP。这种验证IP被称为UVC，包含了一致性管理系统(CM

S)，该系统将覆盖空间划分和映射到了PCIe规范。CMS还提供受限随机测试(称为

测试序列)形式的一致性测试套件，用于自动取得针对每个PCIe规范部分的高功能性

覆盖。

ClearSpeed公司还在UVC基础上创建了自己的受限随机测试套件。相关覆盖在

每次测试组运行之后都会进行分析，从而能清楚地理解覆盖漏洞出现在什么地方，并

指导新的测试应在什么地方进行以到达未被覆盖的场景。这种方法还向ClearSpeed

提供了无价的项目管理工具，因为它能帮助理解和报告验证状态。ClearSpeed公司

目前能够在每个主要的规范领域正常地跟踪覆盖、缺陷统计和测试故障。

工程背景

ClearSpeed公司的产品范围包括芯片、加速器卡、机架模块、软件和支持。Cl

earSpeed公司的芯片、加速器卡和机架模块都可以与工业标准的x86系统一起使用。

ClearSpeed公司的芯片采用C语言进行编程，并且公司向用户提供可与所有标准软

件开发工具协同工作的完整IDE.

与以前的CXS600芯片相比，主要变化如下：

1. 一个芯片上有两个处理器内核(“MTAP”)

2. 芯片上有一个标准的PCIe接口(相对私有PCIx接口而言)

3. MTAP有多项的改进

总体验证需求和策略

图1给出了ClearSpeed产品的架构。为了确保这个复杂产品的质量，需要对以

下性能进行验证：

1. 驱动程序代码与芯片的紧密集成

2. 众多软件库和应用程序的集成

3. 与各种主机(操作系统和芯片组)环境的兼容性

4. 高性能和低功率

从芯片本身看，主要验证挑战是最新引入的PCIe接口。为了应对这些验证挑战，

ClearSpeed公司采用了一种适合待测复杂设计的先进验证策略。整个验证策略中有

一些要点是可以明确的：

1. 这种验证策略是以仿真为基础，并采用了覆盖驱动的伪随机方法。

2. 使用了分层仿真策略，从模块级开始，并逐渐向外扩展。

3. 与软件的协同仿真非常重要，它有助于展示产品的正确性，并在芯片回厂时

为硅片取得成功取得了良好开端。

4. 软件协同仿真也是分层执行的，从驱动程序开始，一直扩展到应用程序。

5. 模块和层次体系之间的验证再利用。

6. 使用验证IP。这样做有利于充分利用该领域专家的现有知识，并有利于加快

测试平台的开发速度。

总的验证指导原则是在芯片开发初期从商业和技术角度获得签字确认标准。这些

确认标准是客观性的，可以使用合适的准则进行测量。这样做具有很多优点，包括：

1. 能够使所有感兴趣方预先同意用于验证的对象。

2. 能够在项目执行中跟踪向验证签字确认方向发展的进程。

3. 能够建立流片时的信心。

为了与上述原则保持一致，预先对CSX700验证确认标准进行了定义。所选的关

键指标有：

1. 功能覆盖目标：

(1) 优先级1覆盖目标达到100%

(2) 所有其它覆盖目标至少达到95%，并检查所有未实现的覆盖目标。

2. 编写和支持的所有系统级测试。

3. 在所有可用PCIe服务器中工作的原型PCIe。

4. 检查缺陷发现率以确保(与功能覆盖一起)我们正在接近所有最重要缺陷已经

被发现的点。

5. 检查任何突出并已知未修复的问题，并评估它们的影响。

下面将在上文描述的总体验证策略框架下讨论PCIe验证策略。

模块级验证

PCIe模块级测试平台。ClearSpeed公司已经开发过图中所示的AVCI、PVCI

和私有协议，因此PCIe接口提出了主要的验证挑战。由于我们使用的IP来自不同的

管线PHY和端点内核供应商，因此这种挑战越发艰巨。

测试平台采用了许多UVC。除了PCIe UVC外，其它UVC都是ClearSpeed公

司自己开发的。测试平台的其它部分使用公司自己的UVC有利于建立同质的eRM一

致性系统(随后的uRM和现在的OVM)。

选用第三方VIP的原因是因为：PCIe协议的复杂性；验证任务的工作量以及缺

少内部资源；VIP的成熟度；独立的VIP可以由与内部开发小组不相干的外部PCIe

专家组开发。

系统级测试

系统级测试平台包括了芯片和软件驱动堆栈。实际的软件驱动程序基本原样投入

使用，除了在堆栈底部做了一些修改，即将调用做进了仿真环境中，并由软件驱动P

CIe UVC。更多细节请参考图4。在本例中，驱动程序完成与硬件对话要做的所有事

情，并且每个事务都要传送给仿真器。这样运行起来虽然比较慢，但确实能让我们测

试DMA引擎等。

驱动程序可以连接到PCIe层上面的仿真器。这样无需花费时间在完整仿真每个

PCI事务上面就可以实现对更高层单元的仿真。这对仿真在处理器上运行的程序来说

是非常有用的。

虽然通过使用UVC可以在测试规范允许的地方(例如在一些要写入的数据中，在

定义范围内的地址中)使用受限随机激励，但在系统级主要应用定向测试方法。在系

统级存在许多现成的定向测试，主要目标是用它们扩展测试这个芯片的变化(如前所

列出的)。许多vPlanning会话被保持以获得测试规范，然后我们就能跟踪这些测试的

实现。一旦驱动程序堆栈经验证能与RTL一起工作，就可以运行较高层的软件。

运行这些应用程序能给功能验证和性能验证带来高度的信心。

在CSX700的开发过程中，ClearSpeed公司生产了一种基于现有硅片(CSX600)

但用FPGA提供PCIe接口的产品，这样允许我们模拟PCIe接口并执行兼容性测试。

也就是说，我们能将被模拟的PCIe接口连接到运行各种OS的众多服务器上，从而

在流片前确定兼容性问题。它还能让我们更彻底地测试带PCIe的软件驱动程序堆栈

接口。

该方法可以识别主要位于PCIe堆栈物理层中的缺陷(FPGA中的PHY不同于我

们芯片中的PHY)，也让我们注意到我们连接的服务器中PCIe实现的变化数量，并

促使我们提升取得很高覆盖的重要性：我们对覆盖划分优先等级，并为最高优先级对

象设定100%的目标。然而，该方法不能识别通过仿真&覆盖也不能发现的PHY外的

任何缺陷。这使我们相信，PCIe仿真中的高覆盖将有助于取得很高的首次流片成功

率。

原型的其它优势还表现在软件开发方面。它能帮助PCIe软件驱动程序远早于C

SX700硅片开发出来，加快基于CSX700的产品的上市时间。

可配置的验证环境

用于PCI Express的Incisive UVC能让用户专注于设计的任何部分或整个设

计，并针对验证过程中每一阶段的特殊需要优化验证环境。Incisive UVC一般用于在

模块、芯片和系统级对PCI Express器件进行功能验证。它也可以通过配置有选择

地激活或关闭各个功能模块以及功能覆盖和检测机制来优化特殊任务的验证。这样可

以提供到验证收敛的最可预测路径，并最大化在仿真器和工作站方面做出的投资回

报。

自动激励产生

与使用上千次定向测试的其它解决方案不同，用于PCI Express的UVC采用自

动激励发生器来减少用户需要做的工作量。利用包含所供序列库在内的自动化情景产

生功能，用户可以覆盖主要协议功能以及难以到达的情景和边界案例。通过增加少量

测试，剩余的边界案例就能被一一验证。这种方法有助于用户更快地发现更多缺陷，

并让设计师有更多的时间进行DUT的私有功能测试。CMS可以实现整个过程的自动

化。

使用CMS实现覆盖驱动的验证

CMS向用户提供了可执行的验证计划(vPlan)。vPlan与Enterprise Manager以

及内置功能覆盖模型一起可以提供清晰地报告哪些被覆盖、还有哪些没被覆盖所需的

标准。这给用户提供了验证过程的路线图、收敛标准以及可预测的验证过程，并向项

目或管理方提供明晰的状态报告。这种方法被称为覆盖驱动的验证，可以帮助验证人

员方便地识别覆盖漏洞，并将资源集中用于DUT的有问题部分。

Cadence的再利用方法可以快速建立功能验证环境，确保在从模块级验证向芯片

级、系统级验证转移以及派生设计时能立即再利用基于UVC的环境。这种方法通过

消除重复工作而节省了时间与资源。

覆盖点的优先级划分

通过使用能用来屏蔽掉与DUT无关的覆盖区/条目的“透视图(perspective)”，Cle

arSpeed公司能够只考虑与实现有关的覆盖点。ClearSpeed使用以下这个透视图：

“端点, AER = On, VC 1-7 = Off, 完成器退出 = Off, 配置请求重试状态 =

Off, 抑制 = Off"

CMS允许由主要的PCIe模块TPL、TXN、DLL、PHY、PMG、SYS和CONFI

G报告覆盖，这有助于ClearSpeed公司根据技术风险划分验证工作的优先级。

我们认为物理层(PHY)存在较高的风险，因为物理层有两个不同的IP供应商，而

且FPGA原型测试中没有覆盖PHY(因为FPGA使用不同的PHY)；Power mgt是下

一个最高优先级对象，因为在FPGA原型中没有覆盖到它(由于技术限制的原因)；数

据链路层是下一优先等级，因为它靠近PHY。

我们还要求更细颗粒的优先级划分：模块内的优先级划分。虽然一般来说可以使

用透视图进行优先级划分，但这种方法不能满足所有需要和优先级划分的使用模型。

它缺少更细的颗粒和一些对CMS专业用户(如ClearSpeed和IP开发人员)来说更重

要的再利用因素。

一致性测试套件

CMS提供的一致性测试可以使你一开始就有一个很好的基本覆盖，并因此而快

速启动验证工作。ClearSpeed公司是比较早介入的，在整个项目中也在不断自我修

正(附加的覆盖项目和一致性测试)，因此一致性测试取得的覆盖在项目过程中会有变

化。据Cadence公司目前估计，用户通过使用现成的CMS测试套件能够达到约70%

的覆盖。

CMS测试也能经过配置进入PCIe协议的边界案例。然后，我们就可以写出许多

自己的测试来驱动UVC达到想要的覆盖水平。

[1]

[编辑本段]

PCI Express 1.0与PCI Express 2.0的区别

PCI Express 2.0是PCI Express总线家族中的第二代版本。其中第一代的PC

I Express 1.0标志于2002年正式发布，它采用高速串行工作原理，接口传输速率

达到2.5GHz，而PCI Express 2.0则在1.0版本基础上更进了一步，将接口速率提

升到了5GHz，传输性能也翻了一番。目前新一代芯片组产品均可支持PCI Express

2.0总线技术，X1模式的扩展口带宽总和可达到1GB/s，X16图形接口更可以达到

16GB/s的惊人带宽值。

[编辑本段]

PCI Express的硬件协议

PCIe的连接是建立在一个双向的序列的（1-bit）点对点连接基础之上，这称之

为“传输通道”。与PCI 连接形成鲜明对比的是PCI是基于总线控制，所有设备共同

分享的单向32位并行总线。PCIe是一个多层协议，由一个对话层，一个数据交换层

和一个物理层构成。物理层又可进一步分为逻辑子层和电气子层。逻辑子层又可分为

物理代码子层（PCS）和介质接入控制子层（MAC）。

物理层

各式不同的PCI Express插槽（由上而下：x4, x16, x1，与 x16），相较于传

统的32-bit PCI插槽（最下方），取自于DFI的LanParty nF4 Ultra-D机板

于使用电力方面，每组流水线使用两个单向的低电压差分信号（LVDS）合计达

到2.5兆波特。传送及接收不同数据会使用不同的传输通道，每一通道可运作四项资

料。两个PCIe设备之间的连接成为“链接”，这形成了1组或更多的传输通道。各个

设备最少支持1传输通道（x1）的链接。也可以有2，4，8，16，32个通道的链接。

这可以更好的提供双向兼容性。（x2模式将用于内部接口而非插槽模式）PCIe卡能

使用在至少与之传输通道相当的插槽上（例如x1接口的卡也能工作在x4或x16的插

槽上）。一个支持较多传输通道的插槽可以建立较少的传输通道（例如8个通道的插

槽能支持1个通道）。PCIe设备之间的链接将使用两设备中较少通道数的作为标准。

一个支持较多通道的设备不能在支持较少通道的插槽上正常工作，例如x4接口的卡

不能在x1的插槽上正常工作（插不入），但它能在x4的插槽上只建立1个传输通道

（x1）。PCIe卡能在同一数据传输通道内传输包括中断在内的全部控制信息。这也

方便了与PCI的兼容。多传输通道上的数据传输采取交叉存取，这意味着连续字节交

叉存取在不同的通道上。这一特性被称之为“数据条纹”，需要非常复杂的硬件支持连

续数据的同步存取，也对链接的数据吞吐量要求极高。由于数据填充的需求，数据交

叉存取不需要缩小数据包。与其它高速数传输协议一样，时钟信息必须嵌入信号中。

在物理层上，PCIe采用常见的8B/10B代码方式来确保连续的1和0字符串长度符

合标准，这样保证接收端不会误读。编码方案用10位编码比特代替8个未编码比特

来传输数据，占用20%的总带宽。有些协议（如SONET）使用另外的编码结构如“不

规则”在数据流中嵌入时钟信息。PCIe的特性也定义了一种“不规则化”的运算方法，

但这种方法与SONET完全不同，它的方法主要用来避免数据传输过程中的数据重复

而出现数据散射。第一代PCIe采用2.5兆位单信号传输率，PCI-SIG计划在未来版

本中增强到5~10兆位。

数据链接层

数据链接层采用按序的交换层信息包（Transaction Layer Packets,TLPs），是

由交换层生成，按32位循环冗余校验码（CRC，本文中用LCRC）进行数据保护，

采用著名的协议（Ack and Nak signaling）的信息包。TLPs能通过LCRC校验和

连续性校验的称为Ack（命令正确应答）；没有通过校验的称为Nak（没有应答）。

没有应答的TLPs或者等待超时的TLPs会被重新传输。这些内容存储在数据链接层

的缓存内。这样可以确保TLPs的传输不受电子噪音干扰。

Ack和Nak信号由低层的信息包传送，这些包被称为数据链接层信息包（Data

Link Layer Packet,DLLP）。DLLP也用来传送两个互连设备的交换层之间的流控制

信息和实现电源管理功能。

交换层

PCI Express采用分离交换（数据提交和应答在时间上分离），可保证传输通道

在目标端设备等待发送回应信息传送其它数据信息。它采用了可信性流控制。这一模

式下，一个设备广播它可接收缓存的初始可信信号量。链接另一方的设备会在发送数

据时统计每一发送的TLP所占用的可信信号量，直至达到接收端初始可信信号最高

值。接收端在处理完毕缓存中的TLP后，它会回送发送端一个比初始值更大的可信

信号量。可信信号统计是定制的标准计数器，这一算法的优势，相对于其他算法，如

握手传输协议等，在于可信信号的回传反应时间不会影响系统性能，因为如果双方设

备的缓存足够大的话，是不会出现达到可信信号最高值的情况，这样发送数据不会停

顿。第一代PCIe标称可支持每传输通道单向每秒250兆字节的数据传输率。这一数

字是根据物理信号率2500兆波特除以编码率（10位／每字节）计算而得。这意味着

一个16通道（x16）的PCIe卡理论上可以达到单向250*16=4000兆字节／秒（3.7

G字节／每秒）。实际的传输率要根据数据有效载荷率，即依赖于数据的本身特性，

这是由更高层（软件）应用程序和中间协议层决定。PCI Express与其它高速序列连

接系统相似，它依赖于传输的鲁棒性（CRC校验和Ack算法）。长时间连续的单向

数据传输（如高速存储设备）会造成>95%的PCIe通道数据占用率。这样的传输受益

于增加的传输通道，但大多数应用程序如USB或以太网络控制器会把传输内容拆成

小的数据包，同时还会强制加上确认信号。这类数据传输由于增加了数据包的解析和

强制中断，降低了传输通道的效率。这种效率的降低并非只出现在PCIe上。

[编辑本段]

提供PCI Express 插槽的主板介绍

冠盟推出的P55主板以陆续到货，作为国内顶级OEM/ODM主板大厂的冠盟，

其质量一向是毋庸至疑的。由于冠盟集中采购和强大的研发、生产实力，产品成本要

低于其他通路商和中小厂，因此，市场价格要比其它同类品牌型号的产品更有优势和

竞争力。该主板基于Intel P55单芯片设计，豪华5+1相供电设计搭配优质全固态电

容，目前该主板商家报价仅768元，号称为冠盟全球最低售价的P55主板，颇具性

价比，是一款非常值得选购的P55产品。

冠盟GMIP55UT这款主板采用ATX大板型设计，基于Intel P55单芯片芯片组，

支持刚上市的Intel LGA 1156接口的Core i5/i7系列处理器。

冠盟GMIP55UT主板

供电方面，冠盟GMIP55UT采用了扎实的5+1相供电设计，用料上搭配全固态电容

和全封闭式电感，同时MOS管全部有散热片覆盖，保证了主板的稳定运行。

主板的内存部分甚至也提供了独立的2相供电。标准的4条DDR3插槽，支持

双通道DDR3 1600(OC)/1333/1066内存，最大16GB容量。单边卡扣设计方便使用

长显卡的用户。扩展槽部分为我们提供了2条PCI Express X16独立显卡插槽，支

持最新的Nvidia SLI和ATI CrossFire多卡互连技术，同时还提供了2条PCI Expr

ess X1插槽和2条PCI插槽。

背板I/O接口方面，提供了一个PS/2接口，不可思意的10个USB接口，一个

同轴输出，千兆网卡接口和8声道音频接口。

[2]

[编辑本段]

采用pci Express技术的显卡

产品名称

影驰9600GT

中将版

详细参数

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:65纳米显存

类型:GDDR3 显存容量(MB):512 总线接口:PCI Express 2.0 16X 显存

速度(ns):1.0ns 显存位宽:256bit 核心频率:650MHz 显存频率:1800MHz

七彩虹逸彩96

00GT-GD3 C

F黄金版 512

M N1

七彩虹逸彩98

00GT-GD3 冰

封骑士3F 512

影驰9800GT+

中将版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Ex

press 2.0 16X 显存位宽:256bit 核心频率:600MHz 显存频率:1800MH

芯片厂商:NVIDIA 显卡芯片:GeForce 9800 GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Ex

press 2.0 16X 显存位宽:256bit 核心频率:600MHz 显存频率:1800MH

芯片厂商:NVIDIA 显卡芯片:GeForce 9800 GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度:0.8ns 总线接口:PCI Expre

ss 2.0 16X 显存位宽:256bit 核心频率:650MHz 显存频率:2200MHz

影驰GTX260+

上将

芯片厂商:NVIDIA 显卡芯片:GeForce GTX 260 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):896 显存速度:0.8ns 总线接口:PCI Expre

ss 2.0 16X 显存位宽:448bit 核心频率:625MHz 显存频率:2000MHz

影驰9600GT

节能加强版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 显存类型:GDDR3 显存

容量(MB):512 总线接口:PCI Express 2.0 16X 显存速度:1.0ns 显存位

宽:256bit 核心频率:600MHz 显存频率:1600MHz

影驰9600GT

加强版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Ex

press 2.0 16X 显存位宽:256bit 核心频率:650MHz 显存频率:1800MH

蓝宝石HD485

0 512M 海外

版 HDMI

nVIDIA Quadr

o NVS 290

蓝宝石HD385

0蓝曜天刃PR

O 512MB

芯片厂商:ATI 显卡芯片:Radeon HD 4850 制造工艺:55纳米显存类型:

GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Express

2.0 16X 显存位宽:256bit 核心频率:650MHz 显存频率:2000MHz

适用类型:工作站制造工艺:80纳米显存位宽:64bit 核心频率:300MHz

显卡接口:PCI Express x16或PCI Express x1 DirectX版本:10

芯片厂商:ATI 显卡芯片:Radeon HD 3850 显存类型:DDRIII 显存容量

(MB):512 显存位宽:256bit 总线接口:PCI Express 2.0 显存速度(ns):1.

0ns

影驰9600GTE

上将版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 显存类型:DDRIII 显存

容量(MB):512 显存位宽:256bit 总线接口:PCI Express 2.0 显存速度(n

s):1.0ns

[3]

[编辑本段]

PCI Express 4路采集卡

SVC404E是一款高性价比、高清晰度、质量稳定的PCI-E专业流媒体采集卡。

该产品主要针对流媒体领域的要求，采用通用的 DirectShow 驱动架构，具有高效率

的视频和声音采集能力。高性能的模拟视频前端滤波处理能力、高精度的音频采样能

力，大大提升了视音频采集的清晰度。

注释

PCI Express是新一代能够提供大量带宽和丰富功能的新式图形架构。PCI Exp

ress可以大幅提高中央处理器（CPU）和图形处理器（GPU）之间的带宽。它可以

给视频应用者更完美地享受影院级的图象效果，并获得无缝多媒体体验。

应用领域

基于互联网流媒体在线直播、视频会议系统、VOD点播、远程监控、教学、 D

VD制作，硬盘播出、广告截播、媒体资产管理。

技术特点

四路独立的视音频采集处理。

每路独立可以调成NTSC或PAL制。

四路视频输入和四路音频输入。

每路支持最大解晰度为NTSC：720x480；PAL：720X576。

支持大多数的视音频采集软件，如Media Encoder, Helix Real Producer等。

支持最大帧率30fps。

四路无压缩视音频数据DMA信道，使得四路视音频预览零CPU占用率。

高性能的模拟视频前端滤波处理能力，使原信号得到低码率高清晰的还原。

支持软件

支持国内大多数视频会议软件，例如： AVCON视频会议系统、V2 Conferenc

e视频会议系统、网动视频会议系统；

支持Media Encoder, Helix Real Producer

支持多种编码格式，包括：Wmv9，Rmvb,Rm，MPEG-4，DivX多格式视频编

码，混合不同码率、分辨率的视频同步流畅输出及播放

实时预览，全文互式与处理硬件参数能力

支持可编程时间触发(GPI，持续时调，自选键)

从现存文件中进行优化转码(AVI/Quicktime/Quicktime类型文件)到多格式编码

[4]

[编辑本段]

AMD和HP将改进PCI Express 3.0规范

AMD和惠普公司的专家日前为PCI Express 3.0开发了两个新的扩展功能规

范，藉由这两项新规范，除了可以降低相关微电路成本外还可以增加对多协议的支持，

并且可以降低设备对中央处理器的访问频率。

相关开发人员希望他们的提案能够被明年才发布的PCI-E 3.0规范所采纳。上述

两个扩展功能并不互相依赖，它们主要应用于内置系统或高速系统的图形应用。第一

个扩展功能被称为多路复用协议，它利用板卡上的一系列模块，实现PCI-E和其他7

种不同的协议之间的动态切换。利用该功能，我们可以构建这样一个解决方案：通过

PCI-E接口，处理器和显卡通过QPI（Quick Path Interconnect）或者HT（Hyper

Transport）连接。

第二个扩展功能被称为轻信息，它允许协处理器及外围设备在存储系统的支持

下，通过PCI-E接口互相通信，而不必再经过中央处理器。例如，以太网交换机可以

不通过中央处理器而独立的编码和解码数据。

另外，这两项扩展功能适用于工作频率为2.5GHz、5GHz和8GHz版本的PCI-

E规范。

PCI-E 3.0规范向下兼容PCI-E 2.0和PCI-E 1.0，最高传输速度可达32GB/s，

有望在2010年出现相关产品。

[5]

[编辑本段]

PCI Express 2.0和PCI Express16的区别

PCI-E 2.0相对于目前的1.0来说，的确是名副其实的双倍规格：

带宽翻倍：将单通道PCI-E X1的带宽提高到了500MB/s，也就是双向1GB/s；

通道翻倍：显卡接口标准升级到PCI-E X32，带宽可达32GB/s；

插槽翻倍：芯片组/主板默认应该拥有两条PCI-E X32插槽；

功率翻倍：目前PCI-E插槽所能提供的电力最高为75W，2.0版本可能会提高至

200W以上，目前还不确定。

PCI-Express是当前主流的总线和接口标准，它原来的名称为“3GIO”，是由Inte

l提出的，很明显Intel的意思是它代表着下一代I/O 接口标准。交由PCI-SIG（PCI

特殊兴趣组织）认证发布后才改名为“PCI-Express”。这个新标准将全面取代现行的P

CI和AGP，最终实现总线标准的统一。 1990年引进PCI总线接口时，由于其具有

处理器独立性、缓冲隔绝以及总线控制和随插即用等机制及特性，不久之后便一举统

一了包含ISA、VESA、VL BUS、EISA以及MCA等总线规格，成为个人计算机中

的总线插槽主流。

不过其运作频率的进步不若中央处理器那般突飞猛进，因此在面对新一代的扩充

卡及周边时，已经有力不从心的感觉，而共享式的设计，单一高速周边（如Gb以太

网络或IEEE 1394b）可能就会将PCI的所有频宽吃光。虽然针对特定用途也有高频

率或具备独立频宽的版本（如PCI-X和AGP）出现，但是成本的高昂以及使用上的

限制，这些特殊规格PCI并没有成为通用标准。

于2007年1月通过的PCI Express 2.0标准，除了在维持与目前PCI Expres

s 1.1版兼容性的前提下，对单一通道宽度倍增以外（由原先2.5Gbps提升至5Gbp

s），并且在原有的特性之下加入了几项先进的功能，以期更为符合未来的需求。

I/O Vitualization－可应用于包括设备共享、地址转换服务（ATS）以及单／多

处理器系统的单独规格。可提供给多部虚拟机器共享多种包含网卡等I/O设备，有助

于系统管理者在开发以及管理上的方便性。

更强的安全保护机制－可允许软件来看至互连的封包路由，以防止被不良意图人

士进行欺骗以及窃取封包数据，或者是对于数据进行假路由，在未来PCI Express

2.0规范中，这个特性将会被包含在芯片组、交换芯片以及多功能组件之中。

可自动调整的连结速度－当连结频宽或速率下降时，控制软件将会自动侦测并且

对硬件进行通报，而自动对连结速度进行调整，动态配置PCI Express总线的信道。

更高的供电规格－未来高阶显示卡将会更为耗电，比如说NVIDIA即将在11月

发表的G80（代号）绘图卡，其耗电量可能高达300W左右，目前1.1版的PCI Ex

press规范只能提供70W左右，完全不敷目前及未来高阶显示卡之用，因此在2.0版

规范中，将供电能力大幅提升至300W左右。

PCI Express缆线连接规范－这是属于新的应用，就如同目前SATA连接规范中

有一个eSATA的外部联机标准，缆线化的PCI Express可提供更为灵活的使用性，

比如说计算机的网络、储存或显示组件就不必连接至计算机主机板上，只要透过缆线

连结，显示周边与储存周边都可以拥有独立的电源以及配置空间。甚至也可以进行服

务器之间的互连，达到丛集的目的。

除了以上所提到的以外，更为高速的PCI Express也可以提供整合型图形芯片

对主存储器更高的读取速度，不过依照以往的经验，在这方面的改进对于整合型图形

芯片的效能增长可能并不会很大，影响效能的主要因素还是在于绘图芯片本身的设

计。

不过高速序列架构不仅只于PCI Express一家而已，类似架构的标准还有Hype

rTransport、Infiniband、RapidIO以及StarFabric等，这些竞争对手也都有各自庞大

势力在支撑。除了背后势力以外，在技术上也不见得会输给PCI Express，比如说I

nfiniband、StarFabric可藉软件追踪拓朴结构变化，以实现热插拔功能，而HyperTr

ansport及RapidIO则是可藉由减少封包大小来加快反应速度，相较起来，PCI Expr

ess则是显得较为中庸，延伸应用较少。

截至2006年底，PCI Express已经成为个人计算机主机板的标准，由于其完全

透明的软件层设计让软硬件开发者可以在利用最少资源的情况下得到最好的效能表

现，不仅成为高阶3D加速卡的指定连接方式，对消费者来说，也成为了效能表现的

代名词。至于PCI Express在笔记型计算机上的延伸标准ExpressCard，虽然面世

已有一段时间，但是在支持周边仍不够丰富的情况之下，目前仅少数笔记型计算机厂

商具有较全面的支持。

1990年引进PCI总线接口时，由于其具有处理器独立性、缓冲隔绝以及总线控

制和随插即用等机制及特性，不久之后便一举统一了包含ISA、VESA、VL BUS、E

ISA以及MCA等总线规格，成为个人计算机中的总线插槽主流。

不过其运作频率的进步不若中央处理器那般突飞猛进，因此在面对新一代的扩充

卡及周边时，已经有力不从心的感觉，而共享式的设计，单一高速周边（如Gb以太

网络或IEEE 1394b）可能就会将PCI的所有频宽吃光。虽然针对特定用途也有高频

率或具备独立频宽的版本（如PCI-X和AGP）出现，但是成本的高昂以及使用上的

限制，这些特殊规格PCI并没有成为通用标准。

为了因应下一代周边的I/O频宽需求，以及对于整体架构上的统一化设计，Intel

结合各大IT厂商，制订出PCI-Express规格。PCI-Express架构中，包含了五个堆

栈层，其中与过去PCI架构在软件层（加载储存架构以及平面地址空间）方面的兼容

性，确保了现存应用程序与驱动程序不需要做出任何变革即可正常运作。而由于PCI

-Express在设定组态上，也同样使用了过去应用在PCI上的随插即用标准机制。软

件层以封包为基础的设计，并且藉由分割执行的通讯协议，产生可由执行曾传送至I/

O装置的读取以及写入需求。而连结层则是为这些封包加入编号以及错误修正码，以

求达到可靠的数据传输结果。至于在传输实体层方面，则是实作了包含一传输对以及

一接收对的双重单通道，每个方向皆具备有2.5Gbps的初始速度，而且可以藉由增

加讯号对，以行成多路径来线性扩展。以一个信道2.5Gbps的速度为传输基础，在

实体曾提供了x1、x2、x4、x8、x16以及x32等代表信道数量以及路径宽度来表示

其实际传输速度。

[6]

[编辑本段]

PCI Express总线的诞生和概念

虽然，除了3D显示卡以外，直到现在还没有哪个计算机配件脱离PCI总线的束

缚另起炉灶，诸如千兆网卡、声卡、RAID卡等都还在循规蹈矩的奉行着PCI规范，

但，PC技术的快速发展已经让PCI总线越来越显现出不足，尤其是最近的千兆网络

以及视频应用等外设，会使PCI可怜的133MB/s带宽难以承受，当几个类似外设同

时满负荷运转，PCI总线几近瘫痪。不但如此，随着技术的不断进步，PCI电压难以

降低的缺陷越来越凸出出来，PCI规范已经成为现在PC系统的发展桎梏，彻底升级

换代迫在眉睫。

到了2001年，在Intel春季的IDF上，Intel正式公布了旨在取代PCI总线的第

三代I/O技术，该规范由Intel 支持的AWG(Arapahoe Working Group)负责制定，

并称之为第三代I/O总线技术(3rd Generation I/O，也就是3GIO)，也就是后来的P

CI Express总线规范。不过在公布之初，应用环境、配套设备还不是很完善，并不

为人们所关注。到了2002年4月17日，AWG正式宣布3GIO 1.0规范草稿制定完

毕，并移交PCI-SIG进行审核，该规范最终却被命名为PCI Express，而到了2003

年Intel春季IDF上，Intel正式公布了PCI Express的产品开发计划，PCI Express

最终走向应用。

[7]

[编辑本段]

PCI Express总线的特点和长处

PCI Express总线是一种完全不同于过去PCI总线的一种全新总线规范，与PC

I总线共享并行架构相比，PCI Express总线是一种点对点串行连接的设备连接方式，

点对点意味着每一个PCI Express设备都拥有自己独立的数据连接，各个设备之间

并发的数据传输互不影响，而对于过去PCI那种共享总线方式，PCI总线上只能有一

个设备进行通信，一旦PCI总线上挂接的设备增多，每个设备的实际传输速率就会下

降，性能得不到保证。现在，PCI Express以点对点的方式处理通信，每个设备在要

求传输数据的时候各自建立自己的传输通道，对于其他设备这个通道是封闭的，这样

的操作保证了通道的专有性，避免其他设备的干扰。

在传输速率方面，PCI Express总线利用串行的连接特点将能轻松将数据传输速

度提到一个很高的频率，达到远超出PCI总线的传输速率。PCI Express的接口根据

总线位宽不同而有所差异，包括x1、x4、x8以及x16(x2模式将用于内部接口而非插

槽模式)，其中X1的传输速度为250MB/s，而X16就是等于16倍于X1的速度，即

是4GB/s。与此同时，PCI Express总线支持双向传输模式，还可以运行全双工模式，

它的双单工连接能提供更高的传输速率和质量，它们之间的差异跟半双工和全双工类

似。因此连接的每个装置都可以使用最大带宽，PCI Express接口设备将有着比PCI

设备优越的多的资源可用。

除了这些，PCI Express设备能够支持热拔插以及热交换特性，支持的三种电压

分别为+3.3V、3.3Vaux以及+12V。考虑到现在显卡功耗的日益上涨，PCI Express

而后在规范中改善了直接从插槽中取电的功率限制，16x的最大提供功率达到了70

W，比AGP 8X接口有了很大的提高。基本可以满足未来中高端显卡的需求。这一点

可以从AGP、PCI Express两个不同版本的6600GT上就能明显地看到，后者并不

需要外接电源。

可以看到PCI Express只是南桥的扩展总线，它与操作系统无关，所以也保证了

它与原有PCI的兼容性，也就是说在很长一段时间内在主板上PCI Express接口将和

PCI接口共存，这也给用户的升级带来了方便。由此可见，PCI Express最大的意义

在于它的通用性，不仅可以让它用于南桥和其他设备的连接，也可以延伸到芯片组间

的连接，甚至也可以用于连接图形芯片，这样，整个I/O系统将重新统一起来，将更

进一步简化计算机系统，增加计算机的可移植性和模块化。PCI Express已经为PC

的未来发展重新铺设好了路基，下面就要看PCI Express产品的应用情况了。

2024年6月13日发(作者：性睿明)

pci Express

百科名片

PCI Express插槽（黄和绿色

PCI Express是新一代的总线接口。早在2001年的春季，英特尔公司就提出了要用新一代

的技术取代PCI总线和多种芯片的内部连接，并称之为第三代I/O总线技术。随后在2001

年底，包括Intel、AMD、DELL、IBM在内的20多家业界主导公司开始起草新技术的规范，

并在2002年完成，对其正式命名为PCI Express。它采用了目前业内流行的点对点串行连

接，比起PCI以及更早期的计算机总线一个很高的频率，达到PCI所不能提供的高带宽。

基本概念

PCI Express的接口根据总线位宽不同而有所差异，包括X1、X4、X8以及X1

6（X2模式将用于内部接口而非插槽模式）。较短的PCI Express卡可以插入较长

的PCI Express插槽中使用。PCI Express接口能够支持热拔插，这也是个不小的

飞跃。PCI Express卡支持的三种电压分别为+3.3V、3.3Vaux以及+12V。用于取代

AGP接口的PCI Express接口位宽为X16，将能够提供5GB/s的带宽，即便有编码

上的损耗但仍能够提4GB/s左右的实际带宽，远远超过AGP 8X的2.1GB/s的带宽。

PCI Express规格从1条通道连接到32条通道连接，有非常强的伸缩性，以满

足不同系统设备对数据传输带宽不同的需求。例如，PCI Express X1规格支持双向

数据传输，每向数据传输带宽250MB/s，PCI Express X1已经可以满足主流声效芯

片、网卡芯片和存储设备对数据传输带宽的需求，但是远远无法满足图形芯片对数据

传输带宽的需求。因此，必须采用PCI Express X16，即16条点对点数据传输通

道连接来取代传统的AGP总线。PCI Express X16也支持双向数据传输，每向数据

传输带宽高达4GB/s，双向数据传输带宽有8GB/s之多，相比之下，目前广泛采用

的AGP 8X数据传输只提供2.1GB/s的数据传输带宽。

尽管PCI Express技术规格允许实现X1（250MB/秒），X2，X4，X8，X12，X

16和X32通道规格，但是依目前形式来看，PCI Express X1和PCI Express X16

将成为PCI Express主流规格，同时芯片组厂商将在南桥芯片当中添加对PCI Expr

ess X1的支持，在北桥芯片当中添加对PCI Express X16的支持。除去提供极高数

据传输带宽之外，PCI Express因为采用串行数据包方式传递数据，所以PCI Expr

ess接口每个针脚可以获得比传统I/O标准更多的带宽，这样就可以降低PCI Expre

ss设备生产成本和体积。另外，PCI Express也支持高阶电源管理，支持热插拔，

支持数据同步传输，为优先传输数据进行带宽优化。

在兼容性方面，PCI Express在软件层面上兼容目前的PCI技术和设备，支持P

CI设备和内存模组的初始化，也就是说目前的驱动程序、操作系统无需推倒重来，就

可以支持PCI Express设备。PCI Express是新一代能够提供大量带宽和丰富功能

以实现令人激动的新式图形应用的全新架构。PCI Express可以为带宽渴求型应用分

配相应的带宽，大幅提高中央处理器（CPU）和图形处理器（GPU）之间的带宽。对

最终用户而言，他们可以感受影院级图象效果，并获得无缝多媒体体验。

PCI Express采用串行方式传输Data。它和原有的ISA、PCI和AGP总线不同。

这种传输方式，不必因为某个硬件的频率而影响到整个系统性能的发挥。当然了，整

个系统依然是一个整体，但是我们可以方便的提高某一频率低的硬件的频率，以便系

统在没有瓶颈的环境下使用。以串行方式提升频率增进效能，关键的限制在于采用什

么样的物理传输介质。目前人们普遍采用铜线路，而理论上铜这个材质可以提供的传

输极限是10 Gbps。这也就是为什么PCI Express的极限传输速度的答案。

因为PCI Express工作模式是一种称之为“电压差式传输”的方式。两条铜线，通

过相互间的电压差来表示逻辑符号0和1。以这种方式进行资料传输，可以支持极高

的运行频率。所以在速度达到10Gbps后，只需换用光纤（Fibre Channel）就可以

使之效能倍增。

PCI Express是下一阶段的主要传输总线带宽技术。然而，GPU对总线带宽的

需求是子系统中最高的，显而易见的是，视频在PCI Express应占有一定的分量。

显然，PCI Express的提出，并非是总线形式的一个结束。恰恰相反，其技术的成熟

仍旧需要这个时间。当然了，趁这个时间，那些芯片、主板、视频等厂家是否能出来

支持是PCI Express发展的关键。不过，至今依然被看好的AGP8X的性能与PCI

Express在性能上的差距虽然不是太明显，但是随着PCI Express的完善，其差距将

是不言而喻的。

PCI-Express是最新的总线和接口标准，它原来的名称为“3GIO”，是由英特尔提

出的，很明显英特尔的意思是它代表着下一代I/O接口标准。交由PCI-SIG（PCI特

殊兴趣组织）认证发布后才改名为“PCI-Express”。这个新标准将全面取代现行的PC

I和AGP，最终实现总线标准的统一。它的主要优势就是数据传输速率高，目前最高

可达到10GB/s以上，而且还有相当大的发展潜力。PCI Express也有多种规格，从

PCI Express 1X到PCI Express 16X，能满足现在和将来一定时间内出现的低速设

备和高速设备的需求。能支持PCI Express的主要是英特尔的i915和i925系列芯片

组。当然要实现全面取代PCI和AGP也需要一个相当长的过程，就象当初PCI取代

ISA一样，都会有个过渡的过程。

与其他传输规格比较

PCI Express x16 插槽 PCI Express x1 插槽

PCIe的规范主要是为了提升电脑内部所有总线的速度，因此频宽有多种不同规

格标准，其中PCIe x16是专为显卡所设计的部分。AGP的资料传输效率最高为2.1

GB／s，不过对上PCIe x16的8GB／s，很明显的就分出胜负，但8GB／s只有指

资料传输的理想值，并不是使用PCIe接口的显示卡，就能够有突飞猛进的效能表现，

实际的测试数据上并不会有这么大的差异存在。

传输通道数脚Pin总数主接口区Pin数总长度主接口区长

度

x16

规格

PCI 2.3

PCI-X 1.0

PCI-X 2.0（DDR）

PCI-X 2.0（QDR）

AGP 2X

AGP 4X

AGP 8X

PCI-E 1X

PCI-E 2X

PCI-E 4X

PCI-E 8X

PCI-E 16X

164

总线宽度

32 位元

64 位元

32 位元

8 位元

142

工作时脉

33/66 MHz

66/100/133 MHz

133 MHz

66 MHz

2.5 GHz

25 mm

39 mm

56 mm

89 mm

传输速率

133/266 MiB/s

533/800/1066 MiB/s

2.1 GiB/s

4.2 GiB/s

532 MiB/s

1.0 GiB/s

2.1 GiB/s

512 MiB/s（双工）

1.0 GiB/s（双工）

2.0 GiB/s（双工）

4.0 GiB/s（双工）

8.0 GiB/s（双工）

7.65 mm

21.65 mm

38.65 mm

71.65 mm

甚至对于某些 PCI-E 1X插槽，我们完全可以将其锯开（这样有可能会失去质保），

比如可以用来插上NVDIA的显卡做为物理加速卡与ATI显卡一同工作。

解决PCI Express协议一致性问题

在开发第一块基于PCI Express的SoC过程中，ClearSpeed公司为了在有限的

时间和预算条件下确保PCI Express协议一致性而面临重重困难。PCI Express是

一种复杂的协议，具有特别大的覆盖范围。从管理的角度看，保证协议一致性没有其

它更好的方法，只有采用标准驱动的验证过程。遗憾的是，即使做了上千次覆盖相关

场景的测试，仍留有相当大的覆盖漏洞，从而使得这个方法没有可预测性，成本也很

高。而另外一种普通的随机测试方法也没有足够的可预测性。

ClearSpeed公司开始意识到，理想的方法可以产生显著的好处：它能最小化技

术开发工作量，同时最大化测试应用控制。ClearSpeed公司率先采用Cadence公司

提供的商用化PCIe验证IP。这种验证IP被称为UVC，包含了一致性管理系统(CM

S)，该系统将覆盖空间划分和映射到了PCIe规范。CMS还提供受限随机测试(称为

测试序列)形式的一致性测试套件，用于自动取得针对每个PCIe规范部分的高功能性

覆盖。

ClearSpeed公司还在UVC基础上创建了自己的受限随机测试套件。相关覆盖在

每次测试组运行之后都会进行分析，从而能清楚地理解覆盖漏洞出现在什么地方，并

指导新的测试应在什么地方进行以到达未被覆盖的场景。这种方法还向ClearSpeed

提供了无价的项目管理工具，因为它能帮助理解和报告验证状态。ClearSpeed公司

目前能够在每个主要的规范领域正常地跟踪覆盖、缺陷统计和测试故障。

工程背景

ClearSpeed公司的产品范围包括芯片、加速器卡、机架模块、软件和支持。Cl

earSpeed公司的芯片、加速器卡和机架模块都可以与工业标准的x86系统一起使用。

ClearSpeed公司的芯片采用C语言进行编程，并且公司向用户提供可与所有标准软

件开发工具协同工作的完整IDE.

与以前的CXS600芯片相比，主要变化如下：

1. 一个芯片上有两个处理器内核(“MTAP”)

2. 芯片上有一个标准的PCIe接口(相对私有PCIx接口而言)

3. MTAP有多项的改进

总体验证需求和策略

图1给出了ClearSpeed产品的架构。为了确保这个复杂产品的质量，需要对以

下性能进行验证：

1. 驱动程序代码与芯片的紧密集成

2. 众多软件库和应用程序的集成

3. 与各种主机(操作系统和芯片组)环境的兼容性

4. 高性能和低功率

从芯片本身看，主要验证挑战是最新引入的PCIe接口。为了应对这些验证挑战，

ClearSpeed公司采用了一种适合待测复杂设计的先进验证策略。整个验证策略中有

一些要点是可以明确的：

1. 这种验证策略是以仿真为基础，并采用了覆盖驱动的伪随机方法。

2. 使用了分层仿真策略，从模块级开始，并逐渐向外扩展。

3. 与软件的协同仿真非常重要，它有助于展示产品的正确性，并在芯片回厂时

为硅片取得成功取得了良好开端。

4. 软件协同仿真也是分层执行的，从驱动程序开始，一直扩展到应用程序。

5. 模块和层次体系之间的验证再利用。

6. 使用验证IP。这样做有利于充分利用该领域专家的现有知识，并有利于加快

测试平台的开发速度。

总的验证指导原则是在芯片开发初期从商业和技术角度获得签字确认标准。这些

确认标准是客观性的，可以使用合适的准则进行测量。这样做具有很多优点，包括：

1. 能够使所有感兴趣方预先同意用于验证的对象。

2. 能够在项目执行中跟踪向验证签字确认方向发展的进程。

3. 能够建立流片时的信心。

为了与上述原则保持一致，预先对CSX700验证确认标准进行了定义。所选的关

键指标有：

1. 功能覆盖目标：

(1) 优先级1覆盖目标达到100%

(2) 所有其它覆盖目标至少达到95%，并检查所有未实现的覆盖目标。

2. 编写和支持的所有系统级测试。

3. 在所有可用PCIe服务器中工作的原型PCIe。

4. 检查缺陷发现率以确保(与功能覆盖一起)我们正在接近所有最重要缺陷已经

被发现的点。

5. 检查任何突出并已知未修复的问题，并评估它们的影响。

下面将在上文描述的总体验证策略框架下讨论PCIe验证策略。

模块级验证

PCIe模块级测试平台。ClearSpeed公司已经开发过图中所示的AVCI、PVCI

和私有协议，因此PCIe接口提出了主要的验证挑战。由于我们使用的IP来自不同的

管线PHY和端点内核供应商，因此这种挑战越发艰巨。

测试平台采用了许多UVC。除了PCIe UVC外，其它UVC都是ClearSpeed公

司自己开发的。测试平台的其它部分使用公司自己的UVC有利于建立同质的eRM一

致性系统(随后的uRM和现在的OVM)。

选用第三方VIP的原因是因为：PCIe协议的复杂性；验证任务的工作量以及缺

少内部资源；VIP的成熟度；独立的VIP可以由与内部开发小组不相干的外部PCIe

专家组开发。

系统级测试

系统级测试平台包括了芯片和软件驱动堆栈。实际的软件驱动程序基本原样投入

使用，除了在堆栈底部做了一些修改，即将调用做进了仿真环境中，并由软件驱动P

CIe UVC。更多细节请参考图4。在本例中，驱动程序完成与硬件对话要做的所有事

情，并且每个事务都要传送给仿真器。这样运行起来虽然比较慢，但确实能让我们测

试DMA引擎等。

驱动程序可以连接到PCIe层上面的仿真器。这样无需花费时间在完整仿真每个

PCI事务上面就可以实现对更高层单元的仿真。这对仿真在处理器上运行的程序来说

是非常有用的。

虽然通过使用UVC可以在测试规范允许的地方(例如在一些要写入的数据中，在

定义范围内的地址中)使用受限随机激励，但在系统级主要应用定向测试方法。在系

统级存在许多现成的定向测试，主要目标是用它们扩展测试这个芯片的变化(如前所

列出的)。许多vPlanning会话被保持以获得测试规范，然后我们就能跟踪这些测试的

实现。一旦驱动程序堆栈经验证能与RTL一起工作，就可以运行较高层的软件。

运行这些应用程序能给功能验证和性能验证带来高度的信心。

在CSX700的开发过程中，ClearSpeed公司生产了一种基于现有硅片(CSX600)

但用FPGA提供PCIe接口的产品，这样允许我们模拟PCIe接口并执行兼容性测试。

也就是说，我们能将被模拟的PCIe接口连接到运行各种OS的众多服务器上，从而

在流片前确定兼容性问题。它还能让我们更彻底地测试带PCIe的软件驱动程序堆栈

接口。

该方法可以识别主要位于PCIe堆栈物理层中的缺陷(FPGA中的PHY不同于我

们芯片中的PHY)，也让我们注意到我们连接的服务器中PCIe实现的变化数量，并

促使我们提升取得很高覆盖的重要性：我们对覆盖划分优先等级，并为最高优先级对

象设定100%的目标。然而，该方法不能识别通过仿真&覆盖也不能发现的PHY外的

任何缺陷。这使我们相信，PCIe仿真中的高覆盖将有助于取得很高的首次流片成功

率。

原型的其它优势还表现在软件开发方面。它能帮助PCIe软件驱动程序远早于C

SX700硅片开发出来，加快基于CSX700的产品的上市时间。

可配置的验证环境

用于PCI Express的Incisive UVC能让用户专注于设计的任何部分或整个设

计，并针对验证过程中每一阶段的特殊需要优化验证环境。Incisive UVC一般用于在

模块、芯片和系统级对PCI Express器件进行功能验证。它也可以通过配置有选择

地激活或关闭各个功能模块以及功能覆盖和检测机制来优化特殊任务的验证。这样可

以提供到验证收敛的最可预测路径，并最大化在仿真器和工作站方面做出的投资回

报。

自动激励产生

与使用上千次定向测试的其它解决方案不同，用于PCI Express的UVC采用自

动激励发生器来减少用户需要做的工作量。利用包含所供序列库在内的自动化情景产

生功能，用户可以覆盖主要协议功能以及难以到达的情景和边界案例。通过增加少量

测试，剩余的边界案例就能被一一验证。这种方法有助于用户更快地发现更多缺陷，

并让设计师有更多的时间进行DUT的私有功能测试。CMS可以实现整个过程的自动

化。

使用CMS实现覆盖驱动的验证

CMS向用户提供了可执行的验证计划(vPlan)。vPlan与Enterprise Manager以

及内置功能覆盖模型一起可以提供清晰地报告哪些被覆盖、还有哪些没被覆盖所需的

标准。这给用户提供了验证过程的路线图、收敛标准以及可预测的验证过程，并向项

目或管理方提供明晰的状态报告。这种方法被称为覆盖驱动的验证，可以帮助验证人

员方便地识别覆盖漏洞，并将资源集中用于DUT的有问题部分。

Cadence的再利用方法可以快速建立功能验证环境，确保在从模块级验证向芯片

级、系统级验证转移以及派生设计时能立即再利用基于UVC的环境。这种方法通过

消除重复工作而节省了时间与资源。

覆盖点的优先级划分

通过使用能用来屏蔽掉与DUT无关的覆盖区/条目的“透视图(perspective)”，Cle

arSpeed公司能够只考虑与实现有关的覆盖点。ClearSpeed使用以下这个透视图：

“端点, AER = On, VC 1-7 = Off, 完成器退出 = Off, 配置请求重试状态 =

Off, 抑制 = Off"

CMS允许由主要的PCIe模块TPL、TXN、DLL、PHY、PMG、SYS和CONFI

G报告覆盖，这有助于ClearSpeed公司根据技术风险划分验证工作的优先级。

我们认为物理层(PHY)存在较高的风险，因为物理层有两个不同的IP供应商，而

且FPGA原型测试中没有覆盖PHY(因为FPGA使用不同的PHY)；Power mgt是下

一个最高优先级对象，因为在FPGA原型中没有覆盖到它(由于技术限制的原因)；数

据链路层是下一优先等级，因为它靠近PHY。

我们还要求更细颗粒的优先级划分：模块内的优先级划分。虽然一般来说可以使

用透视图进行优先级划分，但这种方法不能满足所有需要和优先级划分的使用模型。

它缺少更细的颗粒和一些对CMS专业用户(如ClearSpeed和IP开发人员)来说更重

要的再利用因素。

一致性测试套件

CMS提供的一致性测试可以使你一开始就有一个很好的基本覆盖，并因此而快

速启动验证工作。ClearSpeed公司是比较早介入的，在整个项目中也在不断自我修

正(附加的覆盖项目和一致性测试)，因此一致性测试取得的覆盖在项目过程中会有变

化。据Cadence公司目前估计，用户通过使用现成的CMS测试套件能够达到约70%

的覆盖。

CMS测试也能经过配置进入PCIe协议的边界案例。然后，我们就可以写出许多

自己的测试来驱动UVC达到想要的覆盖水平。

[1]

[编辑本段]

PCI Express 1.0与PCI Express 2.0的区别

PCI Express 2.0是PCI Express总线家族中的第二代版本。其中第一代的PC

I Express 1.0标志于2002年正式发布，它采用高速串行工作原理，接口传输速率

达到2.5GHz，而PCI Express 2.0则在1.0版本基础上更进了一步，将接口速率提

升到了5GHz，传输性能也翻了一番。目前新一代芯片组产品均可支持PCI Express

2.0总线技术，X1模式的扩展口带宽总和可达到1GB/s，X16图形接口更可以达到

16GB/s的惊人带宽值。

[编辑本段]

PCI Express的硬件协议

PCIe的连接是建立在一个双向的序列的（1-bit）点对点连接基础之上，这称之

为“传输通道”。与PCI 连接形成鲜明对比的是PCI是基于总线控制，所有设备共同

分享的单向32位并行总线。PCIe是一个多层协议，由一个对话层，一个数据交换层

和一个物理层构成。物理层又可进一步分为逻辑子层和电气子层。逻辑子层又可分为

物理代码子层（PCS）和介质接入控制子层（MAC）。

物理层

各式不同的PCI Express插槽（由上而下：x4, x16, x1，与 x16），相较于传

统的32-bit PCI插槽（最下方），取自于DFI的LanParty nF4 Ultra-D机板

于使用电力方面，每组流水线使用两个单向的低电压差分信号（LVDS）合计达

到2.5兆波特。传送及接收不同数据会使用不同的传输通道，每一通道可运作四项资

料。两个PCIe设备之间的连接成为“链接”，这形成了1组或更多的传输通道。各个

设备最少支持1传输通道（x1）的链接。也可以有2，4，8，16，32个通道的链接。

这可以更好的提供双向兼容性。（x2模式将用于内部接口而非插槽模式）PCIe卡能

使用在至少与之传输通道相当的插槽上（例如x1接口的卡也能工作在x4或x16的插

槽上）。一个支持较多传输通道的插槽可以建立较少的传输通道（例如8个通道的插

槽能支持1个通道）。PCIe设备之间的链接将使用两设备中较少通道数的作为标准。

一个支持较多通道的设备不能在支持较少通道的插槽上正常工作，例如x4接口的卡

不能在x1的插槽上正常工作（插不入），但它能在x4的插槽上只建立1个传输通道

（x1）。PCIe卡能在同一数据传输通道内传输包括中断在内的全部控制信息。这也

方便了与PCI的兼容。多传输通道上的数据传输采取交叉存取，这意味着连续字节交

叉存取在不同的通道上。这一特性被称之为“数据条纹”，需要非常复杂的硬件支持连

续数据的同步存取，也对链接的数据吞吐量要求极高。由于数据填充的需求，数据交

叉存取不需要缩小数据包。与其它高速数传输协议一样，时钟信息必须嵌入信号中。

在物理层上，PCIe采用常见的8B/10B代码方式来确保连续的1和0字符串长度符

合标准，这样保证接收端不会误读。编码方案用10位编码比特代替8个未编码比特

来传输数据，占用20%的总带宽。有些协议（如SONET）使用另外的编码结构如“不

规则”在数据流中嵌入时钟信息。PCIe的特性也定义了一种“不规则化”的运算方法，

但这种方法与SONET完全不同，它的方法主要用来避免数据传输过程中的数据重复

而出现数据散射。第一代PCIe采用2.5兆位单信号传输率，PCI-SIG计划在未来版

本中增强到5~10兆位。

数据链接层

数据链接层采用按序的交换层信息包（Transaction Layer Packets,TLPs），是

由交换层生成，按32位循环冗余校验码（CRC，本文中用LCRC）进行数据保护，

采用著名的协议（Ack and Nak signaling）的信息包。TLPs能通过LCRC校验和

连续性校验的称为Ack（命令正确应答）；没有通过校验的称为Nak（没有应答）。

没有应答的TLPs或者等待超时的TLPs会被重新传输。这些内容存储在数据链接层

的缓存内。这样可以确保TLPs的传输不受电子噪音干扰。

Ack和Nak信号由低层的信息包传送，这些包被称为数据链接层信息包（Data

Link Layer Packet,DLLP）。DLLP也用来传送两个互连设备的交换层之间的流控制

信息和实现电源管理功能。

交换层

PCI Express采用分离交换（数据提交和应答在时间上分离），可保证传输通道

在目标端设备等待发送回应信息传送其它数据信息。它采用了可信性流控制。这一模

式下，一个设备广播它可接收缓存的初始可信信号量。链接另一方的设备会在发送数

据时统计每一发送的TLP所占用的可信信号量，直至达到接收端初始可信信号最高

值。接收端在处理完毕缓存中的TLP后，它会回送发送端一个比初始值更大的可信

信号量。可信信号统计是定制的标准计数器，这一算法的优势，相对于其他算法，如

握手传输协议等，在于可信信号的回传反应时间不会影响系统性能，因为如果双方设

备的缓存足够大的话，是不会出现达到可信信号最高值的情况，这样发送数据不会停

顿。第一代PCIe标称可支持每传输通道单向每秒250兆字节的数据传输率。这一数

字是根据物理信号率2500兆波特除以编码率（10位／每字节）计算而得。这意味着

一个16通道（x16）的PCIe卡理论上可以达到单向250*16=4000兆字节／秒（3.7

G字节／每秒）。实际的传输率要根据数据有效载荷率，即依赖于数据的本身特性，

这是由更高层（软件）应用程序和中间协议层决定。PCI Express与其它高速序列连

接系统相似，它依赖于传输的鲁棒性（CRC校验和Ack算法）。长时间连续的单向

数据传输（如高速存储设备）会造成>95%的PCIe通道数据占用率。这样的传输受益

于增加的传输通道，但大多数应用程序如USB或以太网络控制器会把传输内容拆成

小的数据包，同时还会强制加上确认信号。这类数据传输由于增加了数据包的解析和

强制中断，降低了传输通道的效率。这种效率的降低并非只出现在PCIe上。

[编辑本段]

提供PCI Express 插槽的主板介绍

冠盟推出的P55主板以陆续到货，作为国内顶级OEM/ODM主板大厂的冠盟，

其质量一向是毋庸至疑的。由于冠盟集中采购和强大的研发、生产实力，产品成本要

低于其他通路商和中小厂，因此，市场价格要比其它同类品牌型号的产品更有优势和

竞争力。该主板基于Intel P55单芯片设计，豪华5+1相供电设计搭配优质全固态电

容，目前该主板商家报价仅768元，号称为冠盟全球最低售价的P55主板，颇具性

价比，是一款非常值得选购的P55产品。

冠盟GMIP55UT这款主板采用ATX大板型设计，基于Intel P55单芯片芯片组，

支持刚上市的Intel LGA 1156接口的Core i5/i7系列处理器。

冠盟GMIP55UT主板

供电方面，冠盟GMIP55UT采用了扎实的5+1相供电设计，用料上搭配全固态电容

和全封闭式电感，同时MOS管全部有散热片覆盖，保证了主板的稳定运行。

主板的内存部分甚至也提供了独立的2相供电。标准的4条DDR3插槽，支持

双通道DDR3 1600(OC)/1333/1066内存，最大16GB容量。单边卡扣设计方便使用

长显卡的用户。扩展槽部分为我们提供了2条PCI Express X16独立显卡插槽，支

持最新的Nvidia SLI和ATI CrossFire多卡互连技术，同时还提供了2条PCI Expr

ess X1插槽和2条PCI插槽。

背板I/O接口方面，提供了一个PS/2接口，不可思意的10个USB接口，一个

同轴输出，千兆网卡接口和8声道音频接口。

[2]

[编辑本段]

采用pci Express技术的显卡

产品名称

影驰9600GT

中将版

详细参数

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:65纳米显存

类型:GDDR3 显存容量(MB):512 总线接口:PCI Express 2.0 16X 显存

速度(ns):1.0ns 显存位宽:256bit 核心频率:650MHz 显存频率:1800MHz

七彩虹逸彩96

00GT-GD3 C

F黄金版 512

M N1

七彩虹逸彩98

00GT-GD3 冰

封骑士3F 512

影驰9800GT+

中将版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Ex

press 2.0 16X 显存位宽:256bit 核心频率:600MHz 显存频率:1800MH

芯片厂商:NVIDIA 显卡芯片:GeForce 9800 GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Ex

press 2.0 16X 显存位宽:256bit 核心频率:600MHz 显存频率:1800MH

芯片厂商:NVIDIA 显卡芯片:GeForce 9800 GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度:0.8ns 总线接口:PCI Expre

ss 2.0 16X 显存位宽:256bit 核心频率:650MHz 显存频率:2200MHz

影驰GTX260+

上将

芯片厂商:NVIDIA 显卡芯片:GeForce GTX 260 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):896 显存速度:0.8ns 总线接口:PCI Expre

ss 2.0 16X 显存位宽:448bit 核心频率:625MHz 显存频率:2000MHz

影驰9600GT

节能加强版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 显存类型:GDDR3 显存

容量(MB):512 总线接口:PCI Express 2.0 16X 显存速度:1.0ns 显存位

宽:256bit 核心频率:600MHz 显存频率:1600MHz

影驰9600GT

加强版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 制造工艺:55纳米显存

类型:GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Ex

press 2.0 16X 显存位宽:256bit 核心频率:650MHz 显存频率:1800MH

蓝宝石HD485

0 512M 海外

版 HDMI

nVIDIA Quadr

o NVS 290

蓝宝石HD385

0蓝曜天刃PR

O 512MB

芯片厂商:ATI 显卡芯片:Radeon HD 4850 制造工艺:55纳米显存类型:

GDDR3 显存容量(MB):512 显存速度(ns):1.0ns 总线接口:PCI Express

2.0 16X 显存位宽:256bit 核心频率:650MHz 显存频率:2000MHz

适用类型:工作站制造工艺:80纳米显存位宽:64bit 核心频率:300MHz

显卡接口:PCI Express x16或PCI Express x1 DirectX版本:10

芯片厂商:ATI 显卡芯片:Radeon HD 3850 显存类型:DDRIII 显存容量

(MB):512 显存位宽:256bit 总线接口:PCI Express 2.0 显存速度(ns):1.

0ns

影驰9600GTE

上将版

芯片厂商:NVIDIA 显卡芯片:GeForce 9600GT 显存类型:DDRIII 显存

容量(MB):512 显存位宽:256bit 总线接口:PCI Express 2.0 显存速度(n

s):1.0ns

[3]

[编辑本段]

PCI Express 4路采集卡

SVC404E是一款高性价比、高清晰度、质量稳定的PCI-E专业流媒体采集卡。

该产品主要针对流媒体领域的要求，采用通用的 DirectShow 驱动架构，具有高效率

的视频和声音采集能力。高性能的模拟视频前端滤波处理能力、高精度的音频采样能

力，大大提升了视音频采集的清晰度。

注释

PCI Express是新一代能够提供大量带宽和丰富功能的新式图形架构。PCI Exp

ress可以大幅提高中央处理器（CPU）和图形处理器（GPU）之间的带宽。它可以

给视频应用者更完美地享受影院级的图象效果，并获得无缝多媒体体验。

应用领域

基于互联网流媒体在线直播、视频会议系统、VOD点播、远程监控、教学、 D

VD制作，硬盘播出、广告截播、媒体资产管理。

技术特点

四路独立的视音频采集处理。

每路独立可以调成NTSC或PAL制。

四路视频输入和四路音频输入。

每路支持最大解晰度为NTSC：720x480；PAL：720X576。

支持大多数的视音频采集软件，如Media Encoder, Helix Real Producer等。

支持最大帧率30fps。

四路无压缩视音频数据DMA信道，使得四路视音频预览零CPU占用率。

高性能的模拟视频前端滤波处理能力，使原信号得到低码率高清晰的还原。

支持软件

支持国内大多数视频会议软件，例如： AVCON视频会议系统、V2 Conferenc

e视频会议系统、网动视频会议系统；

支持Media Encoder, Helix Real Producer

支持多种编码格式，包括：Wmv9，Rmvb,Rm，MPEG-4，DivX多格式视频编

码，混合不同码率、分辨率的视频同步流畅输出及播放

实时预览，全文互式与处理硬件参数能力

支持可编程时间触发(GPI，持续时调，自选键)

从现存文件中进行优化转码(AVI/Quicktime/Quicktime类型文件)到多格式编码

[4]

[编辑本段]

AMD和HP将改进PCI Express 3.0规范

AMD和惠普公司的专家日前为PCI Express 3.0开发了两个新的扩展功能规

范，藉由这两项新规范，除了可以降低相关微电路成本外还可以增加对多协议的支持，

并且可以降低设备对中央处理器的访问频率。

相关开发人员希望他们的提案能够被明年才发布的PCI-E 3.0规范所采纳。上述

两个扩展功能并不互相依赖，它们主要应用于内置系统或高速系统的图形应用。第一

个扩展功能被称为多路复用协议，它利用板卡上的一系列模块，实现PCI-E和其他7

种不同的协议之间的动态切换。利用该功能，我们可以构建这样一个解决方案：通过

PCI-E接口，处理器和显卡通过QPI（Quick Path Interconnect）或者HT（Hyper

Transport）连接。

第二个扩展功能被称为轻信息，它允许协处理器及外围设备在存储系统的支持

下，通过PCI-E接口互相通信，而不必再经过中央处理器。例如，以太网交换机可以

不通过中央处理器而独立的编码和解码数据。

另外，这两项扩展功能适用于工作频率为2.5GHz、5GHz和8GHz版本的PCI-

E规范。

PCI-E 3.0规范向下兼容PCI-E 2.0和PCI-E 1.0，最高传输速度可达32GB/s，

有望在2010年出现相关产品。

[5]

[编辑本段]

PCI Express 2.0和PCI Express16的区别

PCI-E 2.0相对于目前的1.0来说，的确是名副其实的双倍规格：

带宽翻倍：将单通道PCI-E X1的带宽提高到了500MB/s，也就是双向1GB/s；

通道翻倍：显卡接口标准升级到PCI-E X32，带宽可达32GB/s；

插槽翻倍：芯片组/主板默认应该拥有两条PCI-E X32插槽；

功率翻倍：目前PCI-E插槽所能提供的电力最高为75W，2.0版本可能会提高至

200W以上，目前还不确定。

PCI-Express是当前主流的总线和接口标准，它原来的名称为“3GIO”，是由Inte

l提出的，很明显Intel的意思是它代表着下一代I/O 接口标准。交由PCI-SIG（PCI

特殊兴趣组织）认证发布后才改名为“PCI-Express”。这个新标准将全面取代现行的P

CI和AGP，最终实现总线标准的统一。 1990年引进PCI总线接口时，由于其具有

处理器独立性、缓冲隔绝以及总线控制和随插即用等机制及特性，不久之后便一举统

一了包含ISA、VESA、VL BUS、EISA以及MCA等总线规格，成为个人计算机中

的总线插槽主流。

不过其运作频率的进步不若中央处理器那般突飞猛进，因此在面对新一代的扩充

卡及周边时，已经有力不从心的感觉，而共享式的设计，单一高速周边（如Gb以太

网络或IEEE 1394b）可能就会将PCI的所有频宽吃光。虽然针对特定用途也有高频

率或具备独立频宽的版本（如PCI-X和AGP）出现，但是成本的高昂以及使用上的

限制，这些特殊规格PCI并没有成为通用标准。

于2007年1月通过的PCI Express 2.0标准，除了在维持与目前PCI Expres

s 1.1版兼容性的前提下，对单一通道宽度倍增以外（由原先2.5Gbps提升至5Gbp

s），并且在原有的特性之下加入了几项先进的功能，以期更为符合未来的需求。

I/O Vitualization－可应用于包括设备共享、地址转换服务（ATS）以及单／多

处理器系统的单独规格。可提供给多部虚拟机器共享多种包含网卡等I/O设备，有助

于系统管理者在开发以及管理上的方便性。

更强的安全保护机制－可允许软件来看至互连的封包路由，以防止被不良意图人

士进行欺骗以及窃取封包数据，或者是对于数据进行假路由，在未来PCI Express

2.0规范中，这个特性将会被包含在芯片组、交换芯片以及多功能组件之中。

可自动调整的连结速度－当连结频宽或速率下降时，控制软件将会自动侦测并且

对硬件进行通报，而自动对连结速度进行调整，动态配置PCI Express总线的信道。

更高的供电规格－未来高阶显示卡将会更为耗电，比如说NVIDIA即将在11月

发表的G80（代号）绘图卡，其耗电量可能高达300W左右，目前1.1版的PCI Ex

press规范只能提供70W左右，完全不敷目前及未来高阶显示卡之用，因此在2.0版

规范中，将供电能力大幅提升至300W左右。

PCI Express缆线连接规范－这是属于新的应用，就如同目前SATA连接规范中

有一个eSATA的外部联机标准，缆线化的PCI Express可提供更为灵活的使用性，

比如说计算机的网络、储存或显示组件就不必连接至计算机主机板上，只要透过缆线

连结，显示周边与储存周边都可以拥有独立的电源以及配置空间。甚至也可以进行服

务器之间的互连，达到丛集的目的。

除了以上所提到的以外，更为高速的PCI Express也可以提供整合型图形芯片

对主存储器更高的读取速度，不过依照以往的经验，在这方面的改进对于整合型图形

芯片的效能增长可能并不会很大，影响效能的主要因素还是在于绘图芯片本身的设

计。

不过高速序列架构不仅只于PCI Express一家而已，类似架构的标准还有Hype

rTransport、Infiniband、RapidIO以及StarFabric等，这些竞争对手也都有各自庞大

势力在支撑。除了背后势力以外，在技术上也不见得会输给PCI Express，比如说I

nfiniband、StarFabric可藉软件追踪拓朴结构变化，以实现热插拔功能，而HyperTr

ansport及RapidIO则是可藉由减少封包大小来加快反应速度，相较起来，PCI Expr

ess则是显得较为中庸，延伸应用较少。

截至2006年底，PCI Express已经成为个人计算机主机板的标准，由于其完全

透明的软件层设计让软硬件开发者可以在利用最少资源的情况下得到最好的效能表

现，不仅成为高阶3D加速卡的指定连接方式，对消费者来说，也成为了效能表现的

代名词。至于PCI Express在笔记型计算机上的延伸标准ExpressCard，虽然面世

已有一段时间，但是在支持周边仍不够丰富的情况之下，目前仅少数笔记型计算机厂

商具有较全面的支持。

1990年引进PCI总线接口时，由于其具有处理器独立性、缓冲隔绝以及总线控

制和随插即用等机制及特性，不久之后便一举统一了包含ISA、VESA、VL BUS、E

ISA以及MCA等总线规格，成为个人计算机中的总线插槽主流。

不过其运作频率的进步不若中央处理器那般突飞猛进，因此在面对新一代的扩充

卡及周边时，已经有力不从心的感觉，而共享式的设计，单一高速周边（如Gb以太

网络或IEEE 1394b）可能就会将PCI的所有频宽吃光。虽然针对特定用途也有高频

率或具备独立频宽的版本（如PCI-X和AGP）出现，但是成本的高昂以及使用上的

限制，这些特殊规格PCI并没有成为通用标准。

为了因应下一代周边的I/O频宽需求，以及对于整体架构上的统一化设计，Intel

结合各大IT厂商，制订出PCI-Express规格。PCI-Express架构中，包含了五个堆

栈层，其中与过去PCI架构在软件层（加载储存架构以及平面地址空间）方面的兼容

性，确保了现存应用程序与驱动程序不需要做出任何变革即可正常运作。而由于PCI

-Express在设定组态上，也同样使用了过去应用在PCI上的随插即用标准机制。软

件层以封包为基础的设计，并且藉由分割执行的通讯协议，产生可由执行曾传送至I/

O装置的读取以及写入需求。而连结层则是为这些封包加入编号以及错误修正码，以

求达到可靠的数据传输结果。至于在传输实体层方面，则是实作了包含一传输对以及

一接收对的双重单通道，每个方向皆具备有2.5Gbps的初始速度，而且可以藉由增

加讯号对，以行成多路径来线性扩展。以一个信道2.5Gbps的速度为传输基础，在

实体曾提供了x1、x2、x4、x8、x16以及x32等代表信道数量以及路径宽度来表示

其实际传输速度。

[6]

[编辑本段]

PCI Express总线的诞生和概念

虽然，除了3D显示卡以外，直到现在还没有哪个计算机配件脱离PCI总线的束

缚另起炉灶，诸如千兆网卡、声卡、RAID卡等都还在循规蹈矩的奉行着PCI规范，

但，PC技术的快速发展已经让PCI总线越来越显现出不足，尤其是最近的千兆网络

以及视频应用等外设，会使PCI可怜的133MB/s带宽难以承受，当几个类似外设同

时满负荷运转，PCI总线几近瘫痪。不但如此，随着技术的不断进步，PCI电压难以

降低的缺陷越来越凸出出来，PCI规范已经成为现在PC系统的发展桎梏，彻底升级

换代迫在眉睫。

到了2001年，在Intel春季的IDF上，Intel正式公布了旨在取代PCI总线的第

三代I/O技术，该规范由Intel 支持的AWG(Arapahoe Working Group)负责制定，

并称之为第三代I/O总线技术(3rd Generation I/O，也就是3GIO)，也就是后来的P

CI Express总线规范。不过在公布之初，应用环境、配套设备还不是很完善，并不

为人们所关注。到了2002年4月17日，AWG正式宣布3GIO 1.0规范草稿制定完

毕，并移交PCI-SIG进行审核，该规范最终却被命名为PCI Express，而到了2003

年Intel春季IDF上，Intel正式公布了PCI Express的产品开发计划，PCI Express

最终走向应用。

[7]

[编辑本段]

PCI Express总线的特点和长处

PCI Express总线是一种完全不同于过去PCI总线的一种全新总线规范，与PC

I总线共享并行架构相比，PCI Express总线是一种点对点串行连接的设备连接方式，

点对点意味着每一个PCI Express设备都拥有自己独立的数据连接，各个设备之间

并发的数据传输互不影响，而对于过去PCI那种共享总线方式，PCI总线上只能有一

个设备进行通信，一旦PCI总线上挂接的设备增多，每个设备的实际传输速率就会下

降，性能得不到保证。现在，PCI Express以点对点的方式处理通信，每个设备在要

求传输数据的时候各自建立自己的传输通道，对于其他设备这个通道是封闭的，这样

的操作保证了通道的专有性，避免其他设备的干扰。

在传输速率方面，PCI Express总线利用串行的连接特点将能轻松将数据传输速

度提到一个很高的频率，达到远超出PCI总线的传输速率。PCI Express的接口根据

总线位宽不同而有所差异，包括x1、x4、x8以及x16(x2模式将用于内部接口而非插

槽模式)，其中X1的传输速度为250MB/s，而X16就是等于16倍于X1的速度，即

是4GB/s。与此同时，PCI Express总线支持双向传输模式，还可以运行全双工模式，

它的双单工连接能提供更高的传输速率和质量，它们之间的差异跟半双工和全双工类

似。因此连接的每个装置都可以使用最大带宽，PCI Express接口设备将有着比PCI

设备优越的多的资源可用。

除了这些，PCI Express设备能够支持热拔插以及热交换特性，支持的三种电压

分别为+3.3V、3.3Vaux以及+12V。考虑到现在显卡功耗的日益上涨，PCI Express

而后在规范中改善了直接从插槽中取电的功率限制，16x的最大提供功率达到了70

W，比AGP 8X接口有了很大的提高。基本可以满足未来中高端显卡的需求。这一点

可以从AGP、PCI Express两个不同版本的6600GT上就能明显地看到，后者并不

需要外接电源。

可以看到PCI Express只是南桥的扩展总线，它与操作系统无关，所以也保证了

它与原有PCI的兼容性，也就是说在很长一段时间内在主板上PCI Express接口将和

PCI接口共存，这也给用户的升级带来了方便。由此可见，PCI Express最大的意义

在于它的通用性，不仅可以让它用于南桥和其他设备的连接，也可以延伸到芯片组间

的连接，甚至也可以用于连接图形芯片，这样，整个I/O系统将重新统一起来，将更

进一步简化计算机系统，增加计算机的可移植性和模块化。PCI Express已经为PC

的未来发展重新铺设好了路基，下面就要看PCI Express产品的应用情况了。

USB迷 | 专注于互联网分享

pci Express

与本文相关的文章

评论列表 (0)