2024年1月23日发(作者:禾文心)
多数购买平板的消费者都希望在平板上玩2D/3D游戏。较好的游戏图形显示性能与平板内置的图形显示核心密切相关。正如我们常用”显存“、”位宽“以及"工作频率"来衡量PC机上的显卡性能一样,平板中采用的低功耗的图形处理器GPU也有其评价指标。一般来说主要是三角形输出率(单位Mtri/s,即每秒输出百万个三角形)和像素填充率(单位MPixel/s,即每秒填充百万个像素)。当然还与其工作频率,制程工艺和功耗等息息相关。平板产品之所以能战胜上网本成为目前除了手机之外,最热门的手持终端设备,一个比较重要的性能就是其低功耗带来的长时间的续航。所以,一般GPU都不会有较高的工作频率,提高频率纵然会带来较大的图形处理性能,但是带来的却是较大的功耗。
平板GPU知识扫盲
大家可别小看平板上的GPU,其性能可能远远超乎你的想象,由于下面的文章中我们将会引入许多概念,所以在此先给大家补充一些小知识,以便大家能更好地跟我们一起领略GPU的风采,欣赏平板上的GPU大战。
GPU面积: 和工艺以及架构有关,GPU制程越高,其封装体积越小,功耗和发热也会进一步降低。
图形和通用运算标准: 各主流厂商和技术组织发布的统一渲染标准,支持的越多,GPU的通用性就越好。
高速L2缓存: GPU与内存之间的临时存储器,它的容量比内存小但交换速度快。缓存对GPU的性能影响很大,因此L2缓存当然是越大越好。
GPU频率:跟桌面显卡类似,频率提升,显卡核心就会运行在更高的频率从而带来更强大的性能,因此PC界有了超频一说。
三角形输出率:单位是兆/秒,三角形输出率越高,输出率越大,在大型3D应用中越流畅。
像素输出率:单位同样是兆/秒,像素填充率则决定了GPU解码视频、拍照录像的能力,肯定也是越高越好。
目前来说,主流的平板上常见的图形处理器主要有:NVIDIA的Tegra2,Imigation的PowerVR SGX系列、ARM的Mali系列和高通的Adreno系列。以下主要基于三角形填充率和像素填充率概括目前热门平板的GPU规格。(参数来自网络,如有错误欢迎指正)
Tegra2
NVIDIA的图睿,采用ULP Geforce架构,含有8个核心,其但核心三角形输出率 最大可达90M/s,像素填充率可达1200M/s。代表产品主要有Xoom和Eee pad。目前来说,应该是最强劲的图形处理器,主要源于强大的NVIDIA的图形处理技术。
PowerVR SGX
PowerVR SGX系列
PowerVR SGX535 PowerVR SGX540 PowerVR SGX543MP
三角形输出率
像素填充率
代表产品
28M/s
400M/s
ipad、iphone4
90M/s
1000M/s
133M/s
4000M/s
GalaxyTab、PlayBook
ipad2
Imagination的PowerVR SGX530/535/540等属于第五代PowerVR产品,采用统一架构,支持DX9,SM3.0,OpenGL 2.0的API标准,依然采用TBR渲染模式,支持H264解码。
高通Adreno
高通Adreno系列
Adreno200 Adreno205
三角形输出率
像素填充率
代表产品
22M/s
133M/s
41M/s
245M/s
Adreno220
88M/s
532M/s
Dell Streak
乐Pad、HTC Flyer
HP Touch Pad
高通收购AMD一部分图形技术之后,发展成自有GPU品牌——Adreno。高通的Adreno产品大部分集成在高通自家的芯片组中,其他公司的产品中应用并不广泛。Adreno220主要是在其自家的双核处理器芯片中,最新一代的Adreno300尚未有终端产品问世。
ARM Mali
ARM Mali系Mali200
列
三角形输出16M/s
率
像素填充率
275M/s 275M/275M/s
30M/s 30M/s
0
Mali30Mali400
s
智器R10、酷比魔方代表产品
U6
T770
三星Galaxy S2、蓝魔W10/W12、台电ARM的Mali系列的平板产品主要是国内的基于瑞芯微RK2918/2818系列的产品,相对而言性价比较高。
孤独求败Geforce ULP:
芯片方案:Tegra2
代表机型:万利达T2、DellStreak10
Tegra2的GPU与上一代Tegra的GPU架构相似,都支持OpenGLES2.0技术,但性能是
上一代的2至3倍,且拥有更高的内存带宽和更高的时钟频率。Tegra2的峰值填充率与Z缓冲过滤可以达到1200万像素/秒。强大的多边形生成能力完美秒杀市售所有方案,并由此独领风骚近半年。同时,Tegra2还具备高级可编程的像素着色引擎,采用了可编程的顶点和光照引擎,支持CSAA覆盖采样抗锯齿能力。这样就能够在平板设备上体验电脑游戏才拥有的抗锯齿功能,游戏应用画面更加精细。GPU的纹理分辨率支持4K×4K和2K×2K像素。具备高级2D和矢量引擎。最高可以实现1680×1050分辨率的输出,支持HDMI1.3规范,所以能够在android平板上体验到1080P高清影音的魅力。Tegra2能够完成1080pH.264格式的视频编码工作。这意味着在采用Tegra2芯片的智能手机和平板上,用户能够以720p或1080p规格进行高清摄像,甚至随时随地进行高清视频通话或视频会议。
强劲高手PowerVRSGX系列
芯片方案:三星蜂鸟系列(SPV110、210),苹果A4、A5
代表机型:ItoosI7/I7Pro、三星GalaxysTab系列
Imagination新一代掌上图形芯片PowerVRSGX530/535/540等属于第五代PowerVR产品,采用统一架构,支持DX9,能够利用GPU芯片强大的运算能力演算出高质量贴图。支持SM3.0,在使用中你会发现图形效果更佳的贴近电脑,使得5系GPU能够拥有更加真实的动态光影效果。拥有OpenGL2.0支持,图形渲染高效。并且由于IOS设备多采用该系列GPU,游戏支持度好,每当android出现IOS移植大作游戏时,530/535/540总是会第一时间获得数据包支持。SGX540同时也是被大量的应用在三星的产品里,早期的三星WaveS8500和国产神器魅族M9以及三星I9000,甚至当年旗舰机NexusS也有配备,这也是目前已经量产的最高型号的Imagination公司的PowerVRSGX系列3D图形加速器。实际的性能方面,能够比PowerVRSGX535提升2倍以上,加上链火神器GPU纹理补丁,能够更加流畅的跨平台体验Tegra2平台专属游戏,卖点再次提升。
采用SGX540核心在游戏中支持SM3.0光影特效,阳光照射到车身的玻璃、风景晃过钢琴烤漆反光效果十分接近于PC游戏
中流砥柱VivanteGraphicsGC800:
芯片方案:RK2918
代表机型:台电T760
RK2918方案的GPU为Vivante的GC800,在40nm的LP工艺下的GC800频率为315MHZ,能够提供31.5Mtri/s的三角形生成率和315Mpix/s的像素填充率。相比于Mali-400,GC800能够提供更高的3D图形生成率,所以在很多新近大3D大作游戏中,GC800能够拥有稍好的表现。GC800采用40nmLP工艺,相对于MAli-400的65nn制程来说,在实际使用时,GC800会拥有更低的功耗和更低的发热。同时强劲的3D渲染效能大幅的提升RK2918主控的应用范围,在实际测试《都市赛车5》的过程中,流畅性略高于Mali-400,而且真个游戏画面更加清晰,贴图质量优于前者。得益于更高的3D性能,GC800甚至借助链火神器GPU纹理补丁,体验一把Tegra2平台的专属游戏。
全能霸王Mali-400:
芯片方案:AML8726-M、三星猎户座
代表机型:世酷MINI7、蓝魔W12、艾诺NOVO8、三星I9100(4核版Mali-400)
Mali-400MP是世界上第一个符合OpenGLES2.0的多核GPU,可提供卓越的二维和三维加速性能,同时对于数据包格式的兼容性也异常地优秀。在提供最高1080P分辨率输出的同时,ARM?在能耗和带宽效率方面保持领先地位。MP是“MPCore”的缩写,代表可扩展性,简单的认为就是可以实现多核,拥有8KB~256KB二级高速缓存,在很多复杂场景更能够从容处理。因此三星新一代双核主控猎户座也选定Mali-400作为其图形显卡发布。在使用搭
载了Mali-400MP作为图形加速器的平板时,能够在较低的功耗前提下实现更多的图形性能。支持高清编码能够通杀国内主流格式高清视频。对于游戏,android系统大作《都市赛车5》、《实况足球》等都表现出优异的水准。作为一款入门级的GPU芯片,支持1080P高清解码,绝对是实用主义者的首选。
总结:一分钱一分货的道理大家还是懂的。Tegra2那高高在上的售价加上强大的GPU,运行在Android3.0以上系统。在配合GeForceULP强大的3D能力,以及Nvidia自身强势的资源布控,在很多Tegra2平台游戏的图形效果表现上反而反超苹果IPAD,无疑可以令乔帮主汗颜。当然,4核Mali-400也不是吃素的,虽然在像素输出率上不能够超越Tegra2,但是4核带来的性能提升也非常明显。况且拥有I9100旗舰机皇作为强力后盾,就连GAMELOFT也为三星及其搭载的Mali-400(4核)专门发布了游戏数据包。
反观SGX540显卡,性能在当今双核时代已然不算过时,同样能够玩爽《都市赛车6》、《混乱与秩序》等超级大作。同样拥有GSX535这一iOS选用GPU,SGX系列无疑是Android平板当中兼容性最牛的。GC800则在性能上稍压Mali-400单核一头,大多数主流3D大作玩起来同样毫不含糊,而且贴图效果要优于Mali-400单核(差异很小)。Mali-400强大之处有时候也可以算沾了I9100的光,兼容性在有了专用数据包的支持后全都解决,只是单核性能稍弱使得部分应用在实际表现中令人不太满意
平板gpu对比:
GPU类型
出品公司
Mali系列
ARM
adreno系列
Qualcomm(高通)
adreno220
88M/s
PowerVR SGX系列
英国Imagination
Technologies
PowerVR
SGX540
90M/s
Nvidia GPU
Nvidia(英伟达)
Vivante
美国图芯
GC800
60M/s
代表型号
三角形输出率(可体现在图像细腻程度上)
像素填充率(可体现在视频播放帧率上)
代表芯片
Mali-400
30M/秒(单核)
ULP-Geforce
71M/s
275M/秒(单核)
532M/s 1000M/s 1200M/s 600M/s
晶晨AML8726 高通MSN全志A10 系列(高通三星S5PV310MSM8260(PV310是)
Mali400MP四核)
理论上性能四核心的Mali-400MP最强,兼容性尚可
兼容性尚可,3D性能优秀
TI OMAP4430
苹果A5采用的是SGX543MP2(双核)
Tegra2 RK2918
特点 兼容性最强,性能也非常强劲
综合性能强。不过阉割了neon加速模块,所以软解flash和视频性能不强。
兼容性尚可,综合性能一般
笔记本显卡天阶图:
认识笔记本GPU
gpu
GPU是显示卡的“心脏”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,称为“软加速”。3D显示芯片是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。显示芯片通常是显示卡上最大的芯片(也是引脚最多的)。现在市场上的显卡大多采用NVIDIA和AMD两家公司的图形处理芯片。
NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。
GPU能够从硬件上支持T&L(TransformandLighting,多边形转换与光源处理)的显示芯片,因为T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。一个好的T&L单元,可以提供细致的3D物体和高级的光线特效;只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓的软件T&L),由于CPU的任务繁多,除了T&L之外,还要做内存管理、输入响应等非3D图形处理工作,因此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远跟不上今天复杂三维游戏的要求。即使CPU的工作频率超过1GHz或更高,对它的帮助也不大,由于这是PC本身设计造成的问题,与CPU的速度无太大关系。
主要作用
GPU是显示卡的“大脑”,它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,称为“软加速”。3D显示芯片是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。显示芯片通常是显示卡上最大的芯片(也是引脚最多的)。现在市场上的显卡大多采用NVIDIA和 AMD-ATI两家公司的图形处理芯片。 今天,GPU已经不
再局限于3D图形处理了,GPU通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算、并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性
GPU
能,如此强悍的“新星”难免会让CPU厂商老大英特尔为未来而紧张, NVIDIA和英特尔也经常为CPU和GPU谁更重要而展开口水战。GPU通用计算方面的标准目前有 OPEN CL、CUDA、ATI STREAM。其中,OpenCL(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景,AMD-ATI、NVIDIA现在的产品都支持OPEN CL。 1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年 4月 ATi发布了
Mach32 图形卡集成了图形加速功能,1998年 4月 ATi被IDC评选为图形芯片工业的市场领导者,但那时候这种芯片还没有GPU的称号,很长的一段时间ATI都是把图形处理器称为VPU,直到AMD收购ATI之后其图形芯片才正式采用GPU的名字。 NVIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出GPU的概念。从此NV显卡的芯就用这个新名字GPU来称呼。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。
工作原理
简单说GPU就是能够从硬件上支持T&L(Transform and Lighting,
gpu
多边形转换与光源处理)的显示芯片,因为T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。一个好的T&L单元,可以提供细致的3D物体和高级的光线特效;只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓的软件T&L),由于CPU的任务繁多,除了T&L之外,还
要做内存管理、输入响应等非3D图形处理工作,因此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远跟不上今天复杂三维游戏的要求。即使CPU的工作频率超过1GHz或更高,对它的帮助也不大,由于这是PC本身设计造成的问题,与CPU的速度无太大关系。
与DSP区别
GPU在几个主要方面有别于DSP(Digital Signal Processing,简称DSP(数字信号处理)架构。其所有计算均使用浮点算法,而且目前还没有位或整数运算指令。此外,由于GPU专为图像处理设计,因此存储系统实际上是一个二维的分段存储空间,包括一个区段号(从中读取图像)和二维地址(图像中的X、Y坐标)。此外,没有任何间接写指令。输出写地址由光栅处理器确定,而且不能由程序改变。这对于自然分布在存储器之中的算法而言是极大的挑战。最后一点,不同碎片的处理过程间不允许通信。实际上,碎片处理器是一个SIMD数据并行执行单元,在所有碎片中独立执行代码
GPU
。 尽管有上述约束,但是GPU还是可以有效地执行多种运算,从线性代数和信号处理到数值仿真。虽然概念简单,但新用户在使用GPU计算时还是会感到迷惑,因为GPU需要专有的图形知识。这种情况下,一些软件工具可以提供帮助。两种高级描影语言CG和HLSL能够让用户编写类似C的代码,随后编译成碎片程序汇编语言。Brook是专为GPU计算设计,且不需要图形知识的高级语言。因此对第一次使用GPU进行开发的工作人员而言,它可以算是一个很好的起点。Brook是C语言的延伸,整合了可以直接映射到GPU的简单数据并行编程构造。经 GPU存储和操作的数据被形象地比喻成“流”(stream),类似于标准C中的数组。核心(Kernel)是在流上操作的函数。在一系列输入流上调用一个核心函数意味着在流元素上实施了隐含的循环,即对每一个流元素调用核心体。Brook还提供了约简机制,例如对一个流中所有的元素进行和、最大值或乘积计算。Brook还完全隐藏了图形API的所有细节,并把GPU中类似二维存储器系统这样许多用户不熟悉的部分进行了虚拟化处理。用Brook编写的应用程序包括线性代数子程序、快速傅立叶转换、光线追踪和图像处理。利用ATI的X800XT和Nvidia的GeForce 6800 Ultra型GPU,在相同高速缓存、SSE汇编优化Pentium 4执行条件下,许多此类应用的速度提升高达7倍之多。 对GPU计算感兴趣的用户努力将算法映射到图形基本元素。类似Brook这样的高级编程语言的问世使编程新手也能够很容易就掌握GPU的性能优势。访问GPU计算功能的便利性也使得GPU的演变将继续下去,不仅仅作为绘制引擎,而是会成为个人电脑的主要计算引擎。
2024年1月23日发(作者:禾文心)
多数购买平板的消费者都希望在平板上玩2D/3D游戏。较好的游戏图形显示性能与平板内置的图形显示核心密切相关。正如我们常用”显存“、”位宽“以及"工作频率"来衡量PC机上的显卡性能一样,平板中采用的低功耗的图形处理器GPU也有其评价指标。一般来说主要是三角形输出率(单位Mtri/s,即每秒输出百万个三角形)和像素填充率(单位MPixel/s,即每秒填充百万个像素)。当然还与其工作频率,制程工艺和功耗等息息相关。平板产品之所以能战胜上网本成为目前除了手机之外,最热门的手持终端设备,一个比较重要的性能就是其低功耗带来的长时间的续航。所以,一般GPU都不会有较高的工作频率,提高频率纵然会带来较大的图形处理性能,但是带来的却是较大的功耗。
平板GPU知识扫盲
大家可别小看平板上的GPU,其性能可能远远超乎你的想象,由于下面的文章中我们将会引入许多概念,所以在此先给大家补充一些小知识,以便大家能更好地跟我们一起领略GPU的风采,欣赏平板上的GPU大战。
GPU面积: 和工艺以及架构有关,GPU制程越高,其封装体积越小,功耗和发热也会进一步降低。
图形和通用运算标准: 各主流厂商和技术组织发布的统一渲染标准,支持的越多,GPU的通用性就越好。
高速L2缓存: GPU与内存之间的临时存储器,它的容量比内存小但交换速度快。缓存对GPU的性能影响很大,因此L2缓存当然是越大越好。
GPU频率:跟桌面显卡类似,频率提升,显卡核心就会运行在更高的频率从而带来更强大的性能,因此PC界有了超频一说。
三角形输出率:单位是兆/秒,三角形输出率越高,输出率越大,在大型3D应用中越流畅。
像素输出率:单位同样是兆/秒,像素填充率则决定了GPU解码视频、拍照录像的能力,肯定也是越高越好。
目前来说,主流的平板上常见的图形处理器主要有:NVIDIA的Tegra2,Imigation的PowerVR SGX系列、ARM的Mali系列和高通的Adreno系列。以下主要基于三角形填充率和像素填充率概括目前热门平板的GPU规格。(参数来自网络,如有错误欢迎指正)
Tegra2
NVIDIA的图睿,采用ULP Geforce架构,含有8个核心,其但核心三角形输出率 最大可达90M/s,像素填充率可达1200M/s。代表产品主要有Xoom和Eee pad。目前来说,应该是最强劲的图形处理器,主要源于强大的NVIDIA的图形处理技术。
PowerVR SGX
PowerVR SGX系列
PowerVR SGX535 PowerVR SGX540 PowerVR SGX543MP
三角形输出率
像素填充率
代表产品
28M/s
400M/s
ipad、iphone4
90M/s
1000M/s
133M/s
4000M/s
GalaxyTab、PlayBook
ipad2
Imagination的PowerVR SGX530/535/540等属于第五代PowerVR产品,采用统一架构,支持DX9,SM3.0,OpenGL 2.0的API标准,依然采用TBR渲染模式,支持H264解码。
高通Adreno
高通Adreno系列
Adreno200 Adreno205
三角形输出率
像素填充率
代表产品
22M/s
133M/s
41M/s
245M/s
Adreno220
88M/s
532M/s
Dell Streak
乐Pad、HTC Flyer
HP Touch Pad
高通收购AMD一部分图形技术之后,发展成自有GPU品牌——Adreno。高通的Adreno产品大部分集成在高通自家的芯片组中,其他公司的产品中应用并不广泛。Adreno220主要是在其自家的双核处理器芯片中,最新一代的Adreno300尚未有终端产品问世。
ARM Mali
ARM Mali系Mali200
列
三角形输出16M/s
率
像素填充率
275M/s 275M/275M/s
30M/s 30M/s
0
Mali30Mali400
s
智器R10、酷比魔方代表产品
U6
T770
三星Galaxy S2、蓝魔W10/W12、台电ARM的Mali系列的平板产品主要是国内的基于瑞芯微RK2918/2818系列的产品,相对而言性价比较高。
孤独求败Geforce ULP:
芯片方案:Tegra2
代表机型:万利达T2、DellStreak10
Tegra2的GPU与上一代Tegra的GPU架构相似,都支持OpenGLES2.0技术,但性能是
上一代的2至3倍,且拥有更高的内存带宽和更高的时钟频率。Tegra2的峰值填充率与Z缓冲过滤可以达到1200万像素/秒。强大的多边形生成能力完美秒杀市售所有方案,并由此独领风骚近半年。同时,Tegra2还具备高级可编程的像素着色引擎,采用了可编程的顶点和光照引擎,支持CSAA覆盖采样抗锯齿能力。这样就能够在平板设备上体验电脑游戏才拥有的抗锯齿功能,游戏应用画面更加精细。GPU的纹理分辨率支持4K×4K和2K×2K像素。具备高级2D和矢量引擎。最高可以实现1680×1050分辨率的输出,支持HDMI1.3规范,所以能够在android平板上体验到1080P高清影音的魅力。Tegra2能够完成1080pH.264格式的视频编码工作。这意味着在采用Tegra2芯片的智能手机和平板上,用户能够以720p或1080p规格进行高清摄像,甚至随时随地进行高清视频通话或视频会议。
强劲高手PowerVRSGX系列
芯片方案:三星蜂鸟系列(SPV110、210),苹果A4、A5
代表机型:ItoosI7/I7Pro、三星GalaxysTab系列
Imagination新一代掌上图形芯片PowerVRSGX530/535/540等属于第五代PowerVR产品,采用统一架构,支持DX9,能够利用GPU芯片强大的运算能力演算出高质量贴图。支持SM3.0,在使用中你会发现图形效果更佳的贴近电脑,使得5系GPU能够拥有更加真实的动态光影效果。拥有OpenGL2.0支持,图形渲染高效。并且由于IOS设备多采用该系列GPU,游戏支持度好,每当android出现IOS移植大作游戏时,530/535/540总是会第一时间获得数据包支持。SGX540同时也是被大量的应用在三星的产品里,早期的三星WaveS8500和国产神器魅族M9以及三星I9000,甚至当年旗舰机NexusS也有配备,这也是目前已经量产的最高型号的Imagination公司的PowerVRSGX系列3D图形加速器。实际的性能方面,能够比PowerVRSGX535提升2倍以上,加上链火神器GPU纹理补丁,能够更加流畅的跨平台体验Tegra2平台专属游戏,卖点再次提升。
采用SGX540核心在游戏中支持SM3.0光影特效,阳光照射到车身的玻璃、风景晃过钢琴烤漆反光效果十分接近于PC游戏
中流砥柱VivanteGraphicsGC800:
芯片方案:RK2918
代表机型:台电T760
RK2918方案的GPU为Vivante的GC800,在40nm的LP工艺下的GC800频率为315MHZ,能够提供31.5Mtri/s的三角形生成率和315Mpix/s的像素填充率。相比于Mali-400,GC800能够提供更高的3D图形生成率,所以在很多新近大3D大作游戏中,GC800能够拥有稍好的表现。GC800采用40nmLP工艺,相对于MAli-400的65nn制程来说,在实际使用时,GC800会拥有更低的功耗和更低的发热。同时强劲的3D渲染效能大幅的提升RK2918主控的应用范围,在实际测试《都市赛车5》的过程中,流畅性略高于Mali-400,而且真个游戏画面更加清晰,贴图质量优于前者。得益于更高的3D性能,GC800甚至借助链火神器GPU纹理补丁,体验一把Tegra2平台的专属游戏。
全能霸王Mali-400:
芯片方案:AML8726-M、三星猎户座
代表机型:世酷MINI7、蓝魔W12、艾诺NOVO8、三星I9100(4核版Mali-400)
Mali-400MP是世界上第一个符合OpenGLES2.0的多核GPU,可提供卓越的二维和三维加速性能,同时对于数据包格式的兼容性也异常地优秀。在提供最高1080P分辨率输出的同时,ARM?在能耗和带宽效率方面保持领先地位。MP是“MPCore”的缩写,代表可扩展性,简单的认为就是可以实现多核,拥有8KB~256KB二级高速缓存,在很多复杂场景更能够从容处理。因此三星新一代双核主控猎户座也选定Mali-400作为其图形显卡发布。在使用搭
载了Mali-400MP作为图形加速器的平板时,能够在较低的功耗前提下实现更多的图形性能。支持高清编码能够通杀国内主流格式高清视频。对于游戏,android系统大作《都市赛车5》、《实况足球》等都表现出优异的水准。作为一款入门级的GPU芯片,支持1080P高清解码,绝对是实用主义者的首选。
总结:一分钱一分货的道理大家还是懂的。Tegra2那高高在上的售价加上强大的GPU,运行在Android3.0以上系统。在配合GeForceULP强大的3D能力,以及Nvidia自身强势的资源布控,在很多Tegra2平台游戏的图形效果表现上反而反超苹果IPAD,无疑可以令乔帮主汗颜。当然,4核Mali-400也不是吃素的,虽然在像素输出率上不能够超越Tegra2,但是4核带来的性能提升也非常明显。况且拥有I9100旗舰机皇作为强力后盾,就连GAMELOFT也为三星及其搭载的Mali-400(4核)专门发布了游戏数据包。
反观SGX540显卡,性能在当今双核时代已然不算过时,同样能够玩爽《都市赛车6》、《混乱与秩序》等超级大作。同样拥有GSX535这一iOS选用GPU,SGX系列无疑是Android平板当中兼容性最牛的。GC800则在性能上稍压Mali-400单核一头,大多数主流3D大作玩起来同样毫不含糊,而且贴图效果要优于Mali-400单核(差异很小)。Mali-400强大之处有时候也可以算沾了I9100的光,兼容性在有了专用数据包的支持后全都解决,只是单核性能稍弱使得部分应用在实际表现中令人不太满意
平板gpu对比:
GPU类型
出品公司
Mali系列
ARM
adreno系列
Qualcomm(高通)
adreno220
88M/s
PowerVR SGX系列
英国Imagination
Technologies
PowerVR
SGX540
90M/s
Nvidia GPU
Nvidia(英伟达)
Vivante
美国图芯
GC800
60M/s
代表型号
三角形输出率(可体现在图像细腻程度上)
像素填充率(可体现在视频播放帧率上)
代表芯片
Mali-400
30M/秒(单核)
ULP-Geforce
71M/s
275M/秒(单核)
532M/s 1000M/s 1200M/s 600M/s
晶晨AML8726 高通MSN全志A10 系列(高通三星S5PV310MSM8260(PV310是)
Mali400MP四核)
理论上性能四核心的Mali-400MP最强,兼容性尚可
兼容性尚可,3D性能优秀
TI OMAP4430
苹果A5采用的是SGX543MP2(双核)
Tegra2 RK2918
特点 兼容性最强,性能也非常强劲
综合性能强。不过阉割了neon加速模块,所以软解flash和视频性能不强。
兼容性尚可,综合性能一般
笔记本显卡天阶图:
认识笔记本GPU
gpu
GPU是显示卡的“心脏”,也就相当于CPU在电脑中的作用,它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,称为“软加速”。3D显示芯片是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。显示芯片通常是显示卡上最大的芯片(也是引脚最多的)。现在市场上的显卡大多采用NVIDIA和AMD两家公司的图形处理芯片。
NVIDIA公司在1999年发布GeForce256图形处理芯片时首先提出GPU的概念。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。
GPU能够从硬件上支持T&L(TransformandLighting,多边形转换与光源处理)的显示芯片,因为T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。一个好的T&L单元,可以提供细致的3D物体和高级的光线特效;只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓的软件T&L),由于CPU的任务繁多,除了T&L之外,还要做内存管理、输入响应等非3D图形处理工作,因此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远跟不上今天复杂三维游戏的要求。即使CPU的工作频率超过1GHz或更高,对它的帮助也不大,由于这是PC本身设计造成的问题,与CPU的速度无太大关系。
主要作用
GPU是显示卡的“大脑”,它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。2D显示芯片在处理3D图像和特效时主要依赖CPU的处理能力,称为“软加速”。3D显示芯片是将三维图像和特效处理功能集中在显示芯片内,也即所谓的“硬件加速”功能。显示芯片通常是显示卡上最大的芯片(也是引脚最多的)。现在市场上的显卡大多采用NVIDIA和 AMD-ATI两家公司的图形处理芯片。 今天,GPU已经不
再局限于3D图形处理了,GPU通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算、并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性
GPU
能,如此强悍的“新星”难免会让CPU厂商老大英特尔为未来而紧张, NVIDIA和英特尔也经常为CPU和GPU谁更重要而展开口水战。GPU通用计算方面的标准目前有 OPEN CL、CUDA、ATI STREAM。其中,OpenCL(全称Open Computing Language,开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景,AMD-ATI、NVIDIA现在的产品都支持OPEN CL。 1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡,1992年 4月 ATi发布了
Mach32 图形卡集成了图形加速功能,1998年 4月 ATi被IDC评选为图形芯片工业的市场领导者,但那时候这种芯片还没有GPU的称号,很长的一段时间ATI都是把图形处理器称为VPU,直到AMD收购ATI之后其图形芯片才正式采用GPU的名字。 NVIDIA公司在1999年发布GeForce 256图形处理芯片时首先提出GPU的概念。从此NV显卡的芯就用这个新名字GPU来称呼。GPU使显卡减少了对CPU的依赖,并进行部分原本CPU的工作,尤其是在3D图形处理时。GPU所采用的核心技术有硬体T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬体T&L技术可以说是GPU的标志。
工作原理
简单说GPU就是能够从硬件上支持T&L(Transform and Lighting,
gpu
多边形转换与光源处理)的显示芯片,因为T&L是3D渲染中的一个重要部分,其作用是计算多边形的3D位置和处理动态光线效果,也可以称为“几何处理”。一个好的T&L单元,可以提供细致的3D物体和高级的光线特效;只不过大多数PC中,T&L的大部分运算是交由CPU处理的(这就也就是所谓的软件T&L),由于CPU的任务繁多,除了T&L之外,还
要做内存管理、输入响应等非3D图形处理工作,因此在实际运算的时候性能会大打折扣,常常出现显卡等待CPU数据的情况,其运算速度远跟不上今天复杂三维游戏的要求。即使CPU的工作频率超过1GHz或更高,对它的帮助也不大,由于这是PC本身设计造成的问题,与CPU的速度无太大关系。
与DSP区别
GPU在几个主要方面有别于DSP(Digital Signal Processing,简称DSP(数字信号处理)架构。其所有计算均使用浮点算法,而且目前还没有位或整数运算指令。此外,由于GPU专为图像处理设计,因此存储系统实际上是一个二维的分段存储空间,包括一个区段号(从中读取图像)和二维地址(图像中的X、Y坐标)。此外,没有任何间接写指令。输出写地址由光栅处理器确定,而且不能由程序改变。这对于自然分布在存储器之中的算法而言是极大的挑战。最后一点,不同碎片的处理过程间不允许通信。实际上,碎片处理器是一个SIMD数据并行执行单元,在所有碎片中独立执行代码
GPU
。 尽管有上述约束,但是GPU还是可以有效地执行多种运算,从线性代数和信号处理到数值仿真。虽然概念简单,但新用户在使用GPU计算时还是会感到迷惑,因为GPU需要专有的图形知识。这种情况下,一些软件工具可以提供帮助。两种高级描影语言CG和HLSL能够让用户编写类似C的代码,随后编译成碎片程序汇编语言。Brook是专为GPU计算设计,且不需要图形知识的高级语言。因此对第一次使用GPU进行开发的工作人员而言,它可以算是一个很好的起点。Brook是C语言的延伸,整合了可以直接映射到GPU的简单数据并行编程构造。经 GPU存储和操作的数据被形象地比喻成“流”(stream),类似于标准C中的数组。核心(Kernel)是在流上操作的函数。在一系列输入流上调用一个核心函数意味着在流元素上实施了隐含的循环,即对每一个流元素调用核心体。Brook还提供了约简机制,例如对一个流中所有的元素进行和、最大值或乘积计算。Brook还完全隐藏了图形API的所有细节,并把GPU中类似二维存储器系统这样许多用户不熟悉的部分进行了虚拟化处理。用Brook编写的应用程序包括线性代数子程序、快速傅立叶转换、光线追踪和图像处理。利用ATI的X800XT和Nvidia的GeForce 6800 Ultra型GPU,在相同高速缓存、SSE汇编优化Pentium 4执行条件下,许多此类应用的速度提升高达7倍之多。 对GPU计算感兴趣的用户努力将算法映射到图形基本元素。类似Brook这样的高级编程语言的问世使编程新手也能够很容易就掌握GPU的性能优势。访问GPU计算功能的便利性也使得GPU的演变将继续下去,不仅仅作为绘制引擎,而是会成为个人电脑的主要计算引擎。