在上一轮的3D图形处理器竞争中,nVidia的Geforce 4 Ti 4600一直处于领跑地位,ATi在Radeon
8500只能在少数路段领先。但是在今年的E3大展上,R300在Doom 3上显示出了强大的优势,到正式发布时,R300起了一个勇敢而大胆的名字Radeon
9700,同时发布的还有一款ATi的针对低端市场的DX8 GPU,它的内部代码的RV250,现在也有了一个正式的名字Radeon
9000。ATi有些像3DLabs,喜欢VPU,但是ATi使用了一个标准的虚拟处理单元(visual processing unit,和3DLabs的VPU不一样)。Radeon
9000的本质其实是Radon 8500的优化,只有Radeon 9700才有大幅的改进,在最初的测试过程中,Radeon 9700看上去相当不错,假如之前nVidia没有感到紧张的话,现在他们应该紧张了。
ATi Radeon 9700
Radeon 9700的新特性,浮点像素处理单元(FPPU),AGP 8X接口,256位的内存接口,4个顶点处理引擎,8条像素管线架构和Hyper-Z
III
第一个浮点像素单元,包括浮点纹理单元,浮点纹理寻址处理器和浮点色彩和Alpha处理器
Radeon 9700是第三款具有256位的显存接口的图形处理器,前两个是3DLabs和Matrox的P10和Parhelia。今后采用更高的数据带宽是不可避免的事,ATi和nVidia都对显存控制器进行了优化,在图形处理器中使用更大的高速缓存器提高命中率,这有助于缓解内存瓶颈,满足3D图形处理对像素的纹理和数据贪婪的需求。使用256位的显存带宽也使GPU在管脚上和以前的产品有所不同,需要重新设计线路板以适应更宽的内存总线。
R9700具有8条像素处理管线,这是目前也知GPU像素处理管线的两倍,增加的管线会从256位的显存接口上得到好处,显存的峰值带宽达到了20.8GB/s,这要比nVidia的Geforce
4 Ti4600高两倍。ATi新的显存控制器看上去类似于Geforce 4的光速内存架构(LMA2),它对3D性能会有多大的好处。
从图中可以看出,ATi新的显存控制器有具四路控制单元,很象Geforce 4 GPU中的LMA2,但是ATi宣称它们的显存控制器要好于四路交错式控制器,另外它还有一个控制器用来连接AGP端口,所有五个结点通过一个开关(switch)进行互联,通过显存接口和I/O接口的队列排序和总线仲裁,可以隐藏掉DDR内存内部的访问延时。在ATi的控制器和nVidia的LMA2之前有两个重要的区别,首先是,有四个控制器分别连接64位的显存带宽(LMA2每条为32位带宽),Radeon
9700的256位内存带宽接口使这成为现实。第二是ATi的控制器第5个I/O节点来连接8速的AGP总线,AGP
8X的峰值数据传输率达到了2.2GB/s,它使用0.8V工作电压也使功耗更低。
R9700的内存控制器直接操作四个子控制器(sub-controllers),它们可以同时写数据到内存或者从GPU读回数据。R9700的显存峰值带宽达到了20.8GB/s,它的有效带宽大约是15GB/s,经验告诉我们DDR内存只有70-75%的时钟效率(clock-efficient)。Radeon
9700的8条像素渲染管线也受到内存带宽的限制,让我们面向未来,9700的内存控制器支持DDR-II内存,到2003年会R9700会转向使用DDR-II,使用DDR-II的好处是不言而喻的。DDR-II不但具有更高的带宽而且把终结电阻都集成在内存颗粒内部,因此可以减化PCB板设计。DDR-II的初始时钟频率是400MHz,DDR-II比当前的266MHz
DDR的带宽提高了50%,尽管目前的ATi Radeon 9700的显存频率工作在325MHz下,但是使用DDR-II还是可以获得23%的显存带宽提升,那时R9700的峰值显存数据传输率可以达到25.6GB/s(大约有18GB/s的有效显存带宽)。
ATi开始支持AGP 8X,这应该是AGP发展的终点。目前Intel还没有芯片组支持AGP 8X,但是VIA已经推出两款P4X333和P4X400支持AGP
8X,SiS针对Pentium 4推出的SiS648和针对Athlon XP推出的SiS746都提供了8带AGP总线的支持。一直以来AGP的数据传输率一直低于显存的数据传输率而成为瓶颈,可以通过优化游戏的纹理缓存算法来缓解带宽的不足。
Hyper-Z III
ATi和nVidia都在寻找解决显存带宽不足的方法,ATi使用Hyper-Z有三个方面组成,分层的Z,Z压缩和Z轴快速清除,根据ATi的说法,Hyper-Z能够节省20%的显存带宽。Radeon
9700引入了Hyper-Z III ,具有更好的Z轴压缩率,压缩率可以从2倍一直到24倍。
ATi在Radeon 8500中首次引入了TruForm,Radeon 9700使用的TruForm 2.0支持displacement
mapping(是否可以译成替换映射),最初是在一个月前的Matrox Parhelia中首次见到,displacement
mapping能够使用动态几何变形,或者能够通过几个演化的步骤生成复杂的多变形表面,提高表面的细节而减少AGP总线传送的额外顶点数量。TruForm是为游戏设计的,它可以提高现有游戏的图像品质。
SmartShader 2.0是下一代的可编程像素技术,可以实时生成电影品质的图像。它完全兼容DircetX
9.0特征,支持顶点渲染2.0、像素渲染2.0,128位的浮点数据格式,可精度的32bpp(10:10:10:2)帧缓存模式,改善多头和FSAA的性能,高序曲面增强。
SmartSharder 2.0实现的图像品质
Radeon 9700的每个色彩通道(RGRA)需要一个单精度的浮点,ATi考虑过每通道64位的实现,但是最后ATi使用了一个更高的128位浮点实现,Radeon
9700的所有渲染管线都保持了128位的精度,直到RAMDAC输出时,才通过抖动算法降为32位,因此RGB每个通道有10位精度,可以实现数以亿计的色彩和极高的动态范围,这有些类似于Matrox的GigaColor技术,这个特征首先在DirectX
9上实现。
全屏抗锯齿
Radeon 8500的SmoothVision 4倍抗锯齿的性能只有原来的80%,在SmoothVision 2.0,ATI接受了SmoothVision的教训,首先是设置的用户介面十分的简单,去掉了一些复杂的选项,对于最终用户来说只需选择2X,4X和6X,此外SmoothVision保留了可编程的特征。SmoothVision的采样模式是完全可编程的,DirectX
9允许应用程序指定多种采样模式。SmoothVision能够在4X甚至在6X抗锯齿下保持可以接受的性能。
另一个是ATi吹捧的各向异性过滤(anisotropic filtering ),它可以提高纹理图像的品质,Radeon
9700支持16位的各向异性过滤,Radeon可以在4倍抗锯齿和16倍各向异性向保持流畅的速度。这使得Radeon
9700在保持高图像品质的前提下,又不用过多牺牲速度。
Radeon 9700具有MPEG和MPEG 2的视频解码,可以在原有视频帧的尺寸上扩大2倍或4倍,通过VideoShader可以提高视频品质。Radeon
9700采用前置视频覆盖方式,上图显示了两种不同的视频覆盖方式。
ATi的集成开发环境
为两个新登场的VPU,ATi特地准备了一个新的集成开环境(IDE),它可以通过多种语言进行可视化编程,直接处理像素渲染和顶点渲染代码,它向下兼容Dircet3D的像素/顶点渲染汇编码,也可以使用OpenGL的渲染语言。另一个大的挑战是渲染编程语言,就好象nVidia的CG。ATi的是RenderMonkey,这是一个开放的用XML(扩展标记语言)进行渲染描述,RenderMonkey可以设定像素渲染和顶点渲染的效果,可以让艺本家或程序员实时的观察到效果。RenderMonkey有能力成为DX9的高级渲染语言。ATi的IDE开发环境可以使用彩色字符标识关键代码,编译器可以追踪有问题的代码,有了这个集成开发环境可以方便程序员发挥出显卡的硬件效能。
Radeon 9700和目前的王者Geforce 4 Ti 4600进行比较,ATi Radeon
9700的核心工作频率达到了325MHz,它的显存频率为650MHz DDR可以提供15GB/s的有效显存带宽,测试使用了3DMark
2001SE,和多款3D游戏进行测试,包括Jedi Knight 2, Dungeon Siege, NHL 2002, Serious Sam SE,
NASCAR 2002和Comanche 4。测试平台如下:
Pentium 4 2.53GHz
512MB of PC1066 RDRAM system memory
Intel 850e chipset
Sound Blaster Audigy Gamer
Intel Pro/100 VE network card
Windows XP Pro
DirectX 8.1
3DMark 2001SE 1280X1024X32位色,4倍全屏抗锯齿,此时Radeon 9700的性能超过Geforce 4 Ti4600的两倍
在基于DX8的测试中,Radeon 9700的性能大约要好两倍,在先进像素渲染测试中的速度要快三倍,在3DMark
2001SE中的自然场景(Nature)测试中,Radeon 9700的性能差不多是Geofrce 4 Ti 4600的2.5倍。可见在DX8下,Radeon
9700的性能明显比Ti 4600强。
这里测试了四款游戏,在UT 2003中和表现的3DMark 2001SE相近,太约领先了两倍的性能
在Comanche 4(这是使用像素渲染的游戏)和NASCAR 2002(需处理多纹理)测试中,Radeon 9700小幅领先,在Serious Sam
SE游戏测试中,ATi大约领先了两倍的性能。Jedi Knight 2(它使用了Quake 3的引擎),ATi大约领先46%。
在1600x1200x32位色4X FSAA中,Radeon 9700的性能仍然大幅领先
ATi Radeon 9700很快就要在国内正式发布了,上面文章是根据extremetech和PC Watch的相关资料编译而成,写的匆忙,难免有些疏漏。Radeon
9700的性能的确让人期待,当然nVidia肯定会不甘示弱,新一轮的3D图形处理器大战就此拉开帷幕。
【作者:小熊在线-Neo编译 北京 】 版权作品
未经许可 请勿转载