第1页:AMD史上最大重量级的R600发布 第2页:Radeon HD 2900XT:第二代统一渲染架构 第3页:Radeon HD 2900XT:TSMC 80HS工艺 第4页:微软DX10 API颠覆传统渲染模式 第5页:Shader Model 4.0新特性 第6页:R600的架构深入解析 第7页:全面支持DirectX 10规范/特性 第8页:R600与G80架构设计分歧:源于SIMD的指令并行性问题 第9页:分道扬镳:R600让指令适应硬件 第10页:多执行诸架构Multi-Threading:释放管线的能量 第11页:R600的Multi-Threading工作方式(一) 第12页:R600的Multi-Threading工作方式(二) 第13页:解除外围束缚:512-Bit RingBus设计 第14页:可编程滤镜抗锯齿:Custom Filter Anti-Aliasing 第15页:绝不止是GPU:R600更像是一款GPGPU 第16页:Radeon HD 2900XT显卡实物 第17页:Radeon HD 2900XT显卡散热系统 第18页:Radeon HD 2900XT显卡输出接口 第19页:搭建测试平台 第20页:Futuremark benchmark测试:3Dmark05 第21页:Futuremark benchmark测试:3Dmark06 第22页:D3D游戏测试:Company of Heroes中等画质 第23页:D3D游戏测试:Company of Heroes高画质 第24页:D3D游戏测试:潜行者:切尔诺贝利阴影 第25页:D3D游戏测试:Ghost Recon:Advanced Warfighter 第26页:经典潜入式FPS游戏测试:彩虹六号:维加斯 第27页:D3D竞速类游戏测试:极品飞车:卡本峡谷 第28页:D3D游戏测试:上古卷轴:湮没 第29页:D3D游戏测试:BattleField 2142 第30页:D3D游戏测试:Command & Conquer 3 Tiberium Wars 第31页:测试回顾总结 第32页:未来市场展望
作为新一代GPU,R600提供对新一代API的支持是理所当然的事。R6XX全系列都支持DX10和Shader Model 4.0版本着色器。相比原先的Shader Model 3.0,Shader Model 4.0最大指令数从512条增加到了64000条;Shader Modle 4.0的临时寄存器激增到4096个,Constant寄存器采用16×4096阵列。input寄存器采用16/32规格,上述指标都比以前的DirectX有重大改进。Shader Modle 4.0允许程序员在渲染物体时使用128个纹理,而DirectX 9只提供4/16规格,更多的纹理意味着物体表面精度更真实,游戏开发者拥有更广泛的选择。小熊在线www.beareyes.com.cn
Shader Modle 4.0的材质texture格式也变为硬件支持的RGBE格式,其中的"E"是Exponent的省略,是RGB共同的说明,这在HDR的处理上有很大的作用,摒弃了以往需要专门decoding处理HDR渲染的流程。 另外,Shader Model4.0在纹理尺寸方面也有惊人的提升,R600最大支持8192x8192的纹理分辩率,比原先最高2048x2048的分辩率要高出16倍。所有这些跟我们看似无关的特效升级其实都是下一代游戏提升画面真实度的基础。小熊在线www.beareyes.com.cn
DirectX 10另一个重大革新就是统一渲染架构(Unified Shader Architecture)。以前的GPU架构还是沿用的分离式渲染架构,目前NVIDIA的G71和ATI的R580都是采用这样的架构,顶点渲染和像素渲染各自独立进行,而且一旦当架构确定下来,顶点和像素shader单元的比例就会固定下来。微软认为这种分离渲染架构不够灵活,不同的GPU,其像素渲染单元和顶点渲染单元的比例不一样,大大限制了开发人员自由发挥的空间。不同的应用程序和游戏对像素渲染和顶点渲染的需求不一样,导致GPU的运算资源得不到充分利用。小熊在线www.beareyes.com.cn
微软在DirectX 10中提出了统一渲染架构,在通用和独立的shader单元中可以执行不同的shader程序,包括vertex、pixel和在DirectX 10中首次提出的Geomery Shader。而且随着这些通用独立的shader单元功能的不断完善,日后有望执行更多的shader程序,例如物理效果。小熊在线www.beareyes.com.cn
Geomery Shader(几何着色器)是DirectX 10中最重要的新功能之一。它能使开发人员能够控制GPU装配顶点构成多边形的方式,并向它们分配参数,实现多种全新的视觉效果。Geomery Shader可以批量进行几何处理,快速的把模型类似的顶点结合起来进行运算。换句话说,它可以生成新的三角形。小熊在线www.beareyes.com.cn
R600除了对GS提供完善的支持外,还支持一个独立的名为Tessellation(镶嵌)的几何单元。Tessellation与Geomery Shader的操作有些类似,都是几个控制点来描述曲面。不同的是,Tessellation只能把三角形进行“细化”,它的工作范围在三角形内部,而GS可以生成新的三角形。不过,Tessellation的速度要快得多,如果程序专门为R600的Tessellation单元优化,那么R600就能获得非常满意的性能。小熊在线www.beareyes.com.cn
接下来,在遵从微软DirectX 10 API规范下,AMD R600在底层单元的设计思路上,与竞争对手有何不同,它们的分歧又是源于哪里呢?下页我们来深入讨论一下: