|
GT200/RV770 6月蓄势待发

继去年G92与RV670的圣诞大战后,今年的夏天显卡行业又将迎来一场巨大的盛宴,这次的对决主角更为引人关注,NVIDIA、AMD都将拿出自家的新一代旗舰产品,众多玩家期待已久的GT200 vs R700顶级图形芯片大战,即将在6月份一触即发,而结果呢,其实只有一个,“There Can Only Be One”!

07~08 NBA总决赛6月开打
首先可以确认的是,NVIDIA代号为GT200/D10U锁定在6月某一天发布,AMD Radon HD 4800系列也铁定在台湾电脑展会后发布。在GT200、R700这两款重量级的产品发布之前,网上已经到处是各种泄露出的产品规格,和各家Fans争论不休的声音,编辑搜集了网上流传的有关资料,这里整理出来跟大家分享一下:
图形王座之争的4大全新看点
非全新架构
从现在已经得知的消息判断,GT200、RV770都算不上真正意义上的革新,仍然是在原有统一渲染架构基础上的改良。下一代偏重光线追踪渲染的全新图形芯片架构,估计要等到DirectX 11 API发布,而那时将会是Geforce、Radeon、Larrabee三家的竞争局面。

GT200是在G80的基础上改进了工艺制程,在有限的晶圆内增加了更多的管线单元数量,是否会支持DrectX10.1还尚未确定,RV770同样支持DirectX 10.1,但工艺制程没有变化,流处理器数量和管线规模也得到空前全面提升。
512bit显存位宽
GT200、RV770管线单元阵列,光栅单元数量规模增加后,256bit显存位宽显然已经不能满足数据吞吐的需要,NVIDIA、AMD两家顶级显卡都会采用512bit设计。

R600是第一款512bit位宽的桌面显卡
NVIDIA的GT200显存配备上相当保守,仍采用GDDR3颗粒,但ROPs单元数量比G80/G92翻倍,增加到了32个,因此NVIDIA特意设计了512bit的位宽规格,以保证为显卡数据吞吐提供足够的显存带宽。而据称Geforce 9900系列还有一款性能稍低的9900GTS的显存带宽为特别的448bit,有点类似8800GTX和8800GTS的规格。
GDDR5显存出现
RV770XT将成为世界上第一款采用GDDR5显存颗粒的3D显卡,AMD这次将直接跳过GDDR4,将奇梦达最新量产的GDDR5显存使用在自家顶级显卡上。GDDR5是专门面向娱乐和游戏系统的显存芯片,主要有512 Mb (16 Mb x 32),1 Gb (32 Mb x 32)2Gb (64 Mb x 32)三种版本,今年都将出现在市场上。

对比目前的GDDR3,GDDR5显存理论上可以提供现有的3倍性能,并提供更小的芯片外形和功耗,每针脚5Gb/s,最大提供20GB/s的传输能力。
PhysX物理加速
现在业界一致认同物理加速技术将成为未来图形发展的大势所趋,不可或缺的一项重要技术。PhysX物理加速技术顺应了3D图形的发展趋势,将成为继DX10之后的又一3D图形制高点,。

PhysX本身就是一个跨平台物理引擎,而且得到了140多款游戏的应用,注册开发人员也超过了25000人,Nvidia收购Ageia最重要的就是看重了其PHYsX物理引擎,而目前基于PhysX物理引擎同NVIDIA CUDA架构的转换连接已经接近完成,并且效率颇高。

虽然GeForce 8/9均支持PhysX和CUDA,但实际上没有很高浮点运算能力,将无法获得很好的物理加速表现,而每颗GT200的浮点运算能力将达到1T FLOPS,物理加速的性能非常值得期待。
除了高端产品线的变化外,NVIDIA产品线上55nm的G92b、以及曝光许久的9500GT,AMD的Radeon HD 4850都会在6~7月陆续登场,下面我们来具体说说每款产品:
Geforce 10顶级=9900GTX!?
GT200/D10U是一个单芯片,究竟会采用55nm还是现有的65nm尚无准确消息,不过可以肯定的是,由于内部晶体管数量预计将超过10亿个,因此核心die Size也将超越以往的产品,散热是GT200面临的一个大问题。
综合目前的消息,GT200很大程度将命名为Geforce 9900GTX,PCB板代号P651,板载16颗GDDR3显存,前后各8颗,位宽512-bit,最大容量1GB。核心内部拥有240个流处理器、32个ROP单元,相当于G80、G92的两倍。这些ROP单元每8个一组构成32-bit位宽,总计512-bit,240个流处理器则分成10个阵列。

PCB正面模型图
前段时间,VR-Zone网站放出的9900GTX模型图,PCB板代号P651,板载16颗GDDR3显存,前后各8颗,位宽512-bit,最大容量1GB。
从模型图上看,GT200的布局和G80差不多,也是核心芯片面积很大,NVIO芯片被分离出来放在挡板和核心之间,接口是两个DVI和一个S-Video,没有DisplayPort,拥有两个SLI桥接口,支持三路SLI,辅助供电接口是一个六针和一个八针+12V电源口。GT200的热设计功耗至少有240W。

PCB背面模型图
NVIO独立芯片再度出现在GT200 PCB上,我想,这个模型图如果是真的话,那么我们将可以判断出两点,一是NVIDIA受现有TSMC 65nm或者55nm工艺的制约,无法在GT200核心塞下更多的晶体管而被迫采用GPU与输出模块分离式设计的做法(像上代的G80);二是NVIDIA希望GPU与NVIO分离式设计能够降低芯片复杂度、提高良品率、更有利于散热。总而言之,G200的设计难度又将达到一个新的高度。毕竟以现在G92的TSMC 65nm工艺,将NVIO集成进去根本不成问题,这种做法似乎没有必要。
GT200将支持512bit显存位宽,与RV770XT看齐,单卡性能超越RV770XT对NVIDIA而言应该不是什么难事,能否超越自家的双芯旗舰Geforce 9800GX2应该才是很多人更感兴趣的地方。
98GT 7月上市G92核心 65/55nm两种核心
下个月与GT200可能同期发布的还有一款以”GT“后缀名的主流型号,Geforce 9800GT,它将并是一款沿用G92核心规格的产品,与8800GT的区别在于前者将会采用55nm工艺制程,也就是之前传闻的“G92b“核心。

这款55nm的”G92b“芯片的9800GT,在频率设定上将与8800GT保持一致,核心为600MHz,GPU电压在1.05~1.1V之间,采用G3-256封装,采用512MB GDDR3 1.0ns显存,频率设定在1800MHz,Shader频率设定在1500MHz。
国外某网站已经通过Forceware驱动的信息,证实了Geforce 9800GT型号两个版本的存在。
NVIDIA_G92.DEV_0605.1 = "NVIDIA GeForce 9800 GT" : 55nm
NVIDIA_G92.DEV_0614.1 = "NVIDIA GeForce 9800 GT" : 65nm
如果未来市面上销售的9800GT存在65nm、55nm两个版本的话,玩家们一定不要惊奇。出现这种局面的原因,可能是65nm的G92还有大量的库存,也或者是55nm的G92产能不足。G92-150直接换个型号变成Geforce 9600GSO,就已经是一个先例了。
看得出来,NVIDIA并不希望新制程的G92芯片在3D性能上并不会高出多少,。否则会给旧制程G92芯片的销售带来困难。新工艺制程最大的好处就是改善G92居高不下的发热量问题,将旧制程的G92芯片供货特定地区或者专供OEM市场,或许是NVIDIA市场部正在考虑的问题。
话说回来,NVIDIA在工艺上一向采取保守稳健的态度,即使在工艺制程落后与对手的情况下,GPU凭借架构上的先进性,3D性能依然可以做到完胜,是一个值得称道的地方。
9500GT取代86GT/低端9500GS八月露面
本页顺便说以下NVIDIA入门级产品线的情况,代号为G96的9500GT其实已经做好准备发布了。GeForce 9500 GT属于NVIDIA的新款主流显卡型号,产品定位将逐步取代现有的GeForce 8600 GT。
9500GT核心代号D9M/G96,采用台积电65nm工艺生产,首颗桌面版本型号G96-300,公版PCB编号P727和P729——前者6层板,搭配GDDR3显存,并提供DisplayPort接口;后者减为4层PCB板,只搭配GDDR2显存,且不提供DisplayPort接口。

9500 GT核心频率650MHz,Shader单元频率1650MHz,搭配128-bit 256MB显存,使用GDDR2时频率设定为900MHz,使用奇梦达、海力士GDDR3显存时设定为1600MHz、1800MHz。由于核心支持,显卡厂商也可能会推出512MB容量或更高频率版本。
9500 GT也支持PCI-E 2.0规范,但和9600 GT一样只支持DX10.0和SM4.0,依然无缘DX10.1,不过还集成了VP3视频解码单元,相比上一代VP2能更好地处理VC-1格式高清视频。另外该卡还拥有新一代“Hybrid Power”功能,在2D模式下GPU供电将为单项模式,以达到节能省电目的。
目前国内已经有不少网站放出了9500GT的测试,引用某网站评测编辑的话,“秉承了G9x核心的特性,9500GT也没有什么特别出色的地方,也可以初略的将它理解为65nm版本的8600GT。”
9500GT如何定价,现在一定让NVIDIA头痛不已。在现有的Forceware驱动下,3D性能完全不是HD 3690的对手。目前国内通路下那颗厂商的HD 3690(HD 3830)已经全线降至599元,与AIB产品共同捍卫599~699元价位市场。编辑预测,9500GT价格要在599元附近的话,才会有一定的市场竞争力。
此外,G96家族还有更低端的型号,9500GS,这款显卡将使用GDDR2显存颗粒,预计要到8月以后才能见到。
RV7X0管线/位宽翻倍、超低功耗是卖点
前面汇总介绍了NVIDIA在今年第三季度高、中、低端产品线的规划,下面来说说AMD的情况。
在上个月底,德国硬件网站Hartware.de放出了据称是Radeon HD 4000系列的抢先资料, Radoen HD 4000系列将包括代号RV770的Radeon HD 4800系列、代号RV740的Radeon HD 4600系列和代号RV710的Radoen HD 4400系列。
核心代号 |
流处理单元 |
纹理贴图单元 |
光栅化处理器 |
显存位宽 |
RV770 |
480 |
32 |
16 |
512/256-bit |
RV740 |
240 |
24 |
12 |
256-bit |
RV710 |
40 |
8 |
4 |
128-bit |
最受大家关注的RV770将拥有高达480个流处理单元、32个纹理贴图单元、16个光栅化处理器,显存位宽根据型号区分为512-bit和256-bit;
而面向中端主流用户的RV740,流处理器数量将达到240个、24个纹理单元、12个光栅单元,位宽上升为256bit;面向HTPC和OEM出货的RV710,核心规格与上代RV610基本一致,位宽由上代的64-bit提升为128-bit。
|
流处理单元 |
核心 |
显存 |
浮点FLOPS |
核心/显存频率(MHz) |
4870X2 |
2x480 |
2xRV770 |
1GB GDDR5 |
2016 |
1050/1800 |
4870 |
480 |
RV770 |
1GB GDDR5 |
1008 |
1050/2200 |
4850 |
480 |
RV770 |
512MB GDDR5 |
816 |
850/1800 |
4670 |
240 |
RV740 |
512MB GDDR4 |
480 |
1000/1200 |
4650 |
240 |
RV740 |
256MB GDDR4 |
384 |
800/1000 |
4470 |
40 |
RV710 |
256MB GDDR3 |
- |
900/800 |
4450 |
40 |
RV710 |
128MB GDDR2 |
- |
700/500 |
即将发布的HD 4850(RV770Pro)搭配GDDR3显存,HD 4870和4870 X2RV770XT将搭配GDDR5显存。具体产品线与Radeon HD 3000系列非常类似,高端的Radeon HD 4870 X2也就是此前盛传的R700,拥有480×2个流处理单元,配备GDDR5显存,容量1GB,浮点运算能力可达2016GFLOPS,而核心频率也将达到惊人的1050MHz。
Radeon HD 4870也将凭借1050MHz的核心频率拥有超过1000GFLOPS的浮点运算能力,同样配备1GB GDDR5显存。
Radeon HD 4850核心频率设定在850MHz(目前已经得到证实),公版显存可能会采用Hartware.de所预测的GDDR5颗粒,但显卡厂商大面积出货的产品将是采用成熟的512MB GDDR3颗粒。
4600系列也是一款全新的产品,流处理单元数量翻倍至240个,网上给出的产品规格称4670和4650将采用GDDR4显存,这似乎又重演了上代的HD 2600XT GDDR4的一幕,不出意外,这样的硬件规格会完胜Geforce 9500GT GDDR3,即使9500GT将SP单元翻倍至32个,但成本控制上不具备任何优势。
4400系列则会配备GDDR3、GDDR2显存,从成本和发热量控制角度考虑,显卡厂商应该更愿意采用GDDR2显存。
Radeon HD |
核心 |
空闲功耗 |
满载功耗 |
定价 |
4870X2 |
2xRV770 |
<25W |
250W |
<$499 |
4870 |
RV770 |
<10W |
150W |
<$299 |
4850 |
RV770 |
<10W |
120W |
<$249 |
4670 |
RV740 |
<10W |
100W |
<$149 |
4650 |
RV740 |
<10W |
80W |
<$129 |
4470 |
RV710 |
<10W |
50W |
<$79 |
4450 |
RV710 |
<10W |
30W |
<$59 |
AMD会在这一代产品上将PowerPlay动态节能技术再度升级,超低的功耗控制将是Radeon HD 4000一代的显卡又一大卖点,Radeon HD 4000系列的空闲功耗都相当低,除了4870 X2可达25W之外,其余一律低于10W,而满载功耗4870 X2最高250W,最低的4450只有30W。
HD 4000系列对Hybrid Crossfire的支持情况目前还不得而知,但如果这一代产品功耗控制相当出色的话,这项不成熟的技术似乎也没有必要。
定价方面,Radeon HD 4870 X2价格为499美元,直接与NVIDIA单芯的Geforce 9900GTX展开竞争,主流的HD 4850 512M设定在249美元,低端的RV740定价在50美元附近。
480个US+512bit能否让4870翻盘
RV770XT也就是HD 4870,拥有480个流处理器、32个纹理贴图单元和16组Rops通道,512MB/1GB GDDR5显存和512bit显存位宽,如此强大的规格能否让”镭“卡重获芯生(套用AMD的一句话),给A卡一个扬眉吐气的机会,还是继续像R600一样是屈居GT200之下?我想,这对于提升A卡的口碑,和拉动Radeon HD 4000系列整体销量都有着不言而喻的重要性。

《HD4870 3Dmark06和Crysis测试成绩曝光》
网上现在已经有不少RV770测试的成绩,称Radeon HD 4870显卡的性能相比上代Radeon HD 3870快了1.5倍,编辑认为这个说法应该计算出来的:RV770=480个US单元,RV670=320个US单元,前者处理器数量刚好是后者的1.5倍。
RV770这个核心还将推出FireStream流处理器版本,不过要等到8月份,另外还有FireGL专业图形显卡版本。
HD 4870会晚于HD 3850上市,最有可能的发布日期是6月底,据传闻说这是因为目前GDDR5颗粒只有奇梦达一家供货,而且产量不足,HD 4870显卡大批量出货要到今年第3季度,即7月份以后。
4850主打性价比 升级512M显存
Radeon HD 4850理论上会是我们见到的第一款HD 4000系列显卡,它也是今年第三季度千元价位显卡厂商重点推的一款产品,目前不少代理商手里已经拿到了HD 4850显卡,只等AMD宣布RV770正式发布而已。

同时,HD 4850的核心频率达到850MHz已经得到确认,至于3850为什么不会搭配512bit的显存位宽,AMD表示GDDR3显存并不能发挥512bit显存位宽的带宽优势,因此没有什么必要。

RV770Pro核心频率设计得相对合理,而且只采用了256bit显存位宽的GDDR3显存,在55纳米制造工艺的支持下,发热量控制比较出色,公版设计将采用小风扇设计。
公版HD 4850显存容量将会提升到512MB,至于256MB的版本,则会面向注重成本控制的OEM市场。另外在价格上,AMD方面也透露了一个大致的范围,RV770 PRO显卡的上市价格将保证在200美元以下,编辑预测公版在国内定价将是1499元。
目前128bit的RV670可以很好的填补中低端市场的区间,猜测中的RV740和RV710在3D性能上不会有太多突破,而且AMD应该不会急于让这两款芯片提枪上阵。如果这两款芯片真的存在的话,发布日期至少要到第三季度末或第四季度,这里就不做过多讨论了。
好戏在后头:65nm GT200对抗55nm R700
RV770在台北ComputeX展会上亮相是铁板钉钉的事,至于GT200是否会展示还不确定,但距正式发布日期也不会太远了。

当然,这一代顶级显卡的功耗表现也将是一个重要看点。一款能够称得上优秀的GPU产品,必须在性能和功耗两端都有上佳的表现。AMD已经跳出了一味堆砌晶体管数量的做法,HD 4000系列除了集成两颗RV770的R700将达到250W外,Radeon HD 4000系列其它幸好无一例外都是超级省电的类型。

NVIDIA方面,晶体管数量超过10亿的GT200TDP功耗预计也会达到250W。我想,即时发烧级玩家不在乎电费,但高功耗带来的高发热量和噪音是没人欢迎的。在节能降耗方面,NVIDIA未来走的是Hybrid SLI道路,目前的Forceware驱动已经可以实现”Save Power“的效果。GT200将是NVIDIA挑战自身技术实力、平衡性能和功耗的一个绝佳的宣示机会。
值得一提的是,这次NVIDIA、AMD两家高端产品发布日期的顺序也很有意思,时间先后依次会是RV770——GT200——R700,届时会有连台龙争虎斗的好戏在等着大家。究竟GT200能否继续捍卫NVIDIA图形老大的尊严,还是被双芯的R700成功翻盘,一切只在6月揭晓!。
|