无标题文档
黄金分割点
评测工程师:孤竹の子、zZ
鸣谢:九猫、@^@^@、P2MM
元前4世纪,古希腊数学家欧多克索斯系统研究了黄金分割的问题,并建立起比例理论,公元前300年前后,著名几何学家欧几里得在撰写《几何原本》时,吸收了欧多克索斯的研究成果,进一步系统论述了黄金分割,成为最早的有关黄金分割的论著。至此这个本就无处不在黄金分割有了正式的理论依据,人们对于的黄金分割的追求遍布各个领域。
“把一条线段分割为两部分,使其中一部分与全长之比等于另一部分与这部分之比。其比值是[5^(1/2)-1]/2,取其前三位数字的近似值是0.618。”达·芬奇的《维特鲁威人》符合黄金矩形,《蒙娜丽莎》的脸也符合黄金矩形,《最后的晚餐》同样也应用了该比例布局。

当NVIDIA(英伟达)发布全球首款DirectX 10显卡G80时候,我们对于中端产品的期待就是希望可以落在其黄金分割点上——一半的旗舰产品管线、略微缩减的显存位宽。然而,NVIDIA(英伟达)却让我们等的太久,64个流处理器、256位宽的黄金管线架构我们期待了一年,错过了G84我们期待G92,错过了G92我们之后继续着期待G94。终于,在再次错过了情人节的玫瑰之后,NVIDIA(英伟达)终结了我们一次又一次的失望,GeForce 9600GT带着完美的黄金分割的管线架构正式入主中端市场!

处于黄金分割点的GeForce 9600GT
作为NVIDIA(英伟达)2008年春节后的第一款主力产品,GeForce 9600GT赚足了我们关注的目光,随着官方NDA的解放,我们小熊在线评测室在第一时间为广大网友准备这篇2008年显卡饕餮盛宴,全面而深入的解析GeForce 9600GT——黄金分割点上的完美。
超越中端更迭规则
历届中端产品的更迭总是有着这样一条规律,就是新一代的中端产品性能大概是上一代产品的1.3~1.5倍,例如从GeForce 6600GT到GeForce 7600GT,从GeForce 7600GT到GeForce 8600GTS,AMD-ATI方面也保持着同样的性能基调进行更新。
到了GeForce 9600GT之后,我们从其强劲的管线及位宽规格就可以看出,即使不计算NVIDIA(英伟达)在GeForce 9600GT中技术部分的改进,其性能也应该可以全面的超越GeForce 8600GTS两倍左右,甚至可以对比G92核心的GeForce 8800GS。

GeForce 9600GT除了担当接替GeForce 8600GTS的使命之外,更是担负着对抗AMD-ATI中端产品的重担,不过此次GeForce 9600GT的狙击对象将不再是Radeon HD 3650及Radeon HD 3690,而是AMD-ATI的中高端产品Radeon HD 3850,甚至是Radeon HD 3870。另外根据NVIDIA(英伟达)所提供的数据显示,GeForce 9600GT在SLI模式下将会或者更好的性能提升幅度,GeForce 9600GT SLI的性能将赶超GeForce 8800GTX。

另外GeForce 9600GT还是全球首款支持全部格式高清影片解码的芯片,我们将在后文做详细的讲解。
乱世英雄
2008年初此时奥运圣火尚未点燃,不过在显卡届的熊熊战火早已无法扑灭:随着年前Radeon HD 3800与G92核心GeForce 8800系列的发布,双方的出招拆招愈演愈烈,之后NVIDIA(英伟达)发布的GeForce 8800GS与AMD-ATI旗舰的Radeon HD 3870 x2也先后加入战斗。不过我们也看到,双方的厮杀主要是集中在高端市场上,中端市场虽然也有Radeon HD 3600系列的加入,但是少了NVIDIA(英伟达)新中端的参战略显孤寂。
|
AMD-ATI |
NVIDIA(英伟达) |
高端 |
Radeon HD 3870 X2 1GB |
Geforce 9800X2 1GB |
|
|
Geforce 8800GTS |
中高端 |
|
Geforce 8800GT 512M |
|
Radeon HD 3870 512M |
Geforce 8800GT 256M |
|
Radeon HD 3850 512M |
GeForce 8800GS/Geforce 9600GT |
中端 |
Radeon HD 3690 256M |
|
Radeon HD 3650 256M |
从上图的产品对比中可以看出,AMD-ATI的产品主要集中在中端到中高端,而NVIDIA(英伟达)的则盘踞在中高端以上的市场。不过随着下游品牌厂商们推出的各种版本的产品参战,其实在实际的市场定位中,何谓中端,何谓中高端的定义已经十分的模糊。总体来说,虽然两家的产品都比较丰富,对抗阵势也非常混乱,但是两家也都巧妙的根据自己的产品性能给出了合理的价格定位,这种定价格局从AMD-ATI田忌赛马式的用Radeon HD 2600XT对抗GeForce 8600GT时便已形成。
然而,如果从一个角度考虑这个问题,就会引出一个更深层次的结论。拥有着320个SPU 256Bit规格的Radeon HD 3850也只能定位在中端,而320个SPU 128Bit规格的Radeon HD 3690也只敢面对NVIDIA(英伟达)只有GeForce 8800GTX 1/4管线规格的GeForce 8600GTS,除去价格上的因素,我们也可以清醒的看到,AMD-ATI这种田忌赛马的做法其实已经宣告了R6×0架构的失败。

正是因为这样,NVIDIA GeForce 9600GT才可以凭借64个流处理器与256Bit的规格,直接挑战拥有320个SPU单元的Radeon HD 3850/3870。NVIDIA(英伟达)通过GeForce 9600GT告诉我们,优秀的管线架构不一定要以量取胜,尽管AMD-ATI在其中端市场布置了多款产品,不过英雄处于乱世,GeForce 9600GT足以在混乱中一统江湖。
GeForce 8800GS本只针对OEM领域,后为衔接GeForce 9600GT发布前GeForce 8600GTS与GeForce 8000GT之间的中端空白而转移零售市场,在GeForce 9600GT发布后,GeForce 8800GS也将功成身退。
“软硬兼施”
不可否认,NVIDIA(英伟达)的“The way it's meant to be played”计划已经得到众多的游戏厂商所支持,在2007年发布的游戏中,“The way”游戏已经占据9成,这些游戏有些是基于NVIDIA(英伟达)的GPU为开发平台,例如著名的《Crysis》等,有些则在不同程度上为NVIDIA(英伟达)的显卡做出了优化,例如《BIOSHOCK》等。而目前,这个计划中又多了重量级的一员,那就是原本属于AMD-ATI阵营的Valve,这个成功的发行了《Portal: First Slice》、《半条命2:DeathMatch》、《半条命2:遗失海岸》和《Peggle Extreme》等游戏的公司将会让“The way it's meant to be played”计划更加完整。

Intel耗资1.1亿美元闪电收购物理引擎厂商Havok后,NVIDIA(英伟达)考虑到自身的发展,在不久前收购了同样优秀的AGEIA团队,AGEIA公司的PhysX物理引擎目前被140款游戏所采纳,能够提供超乎寻常真实而又复杂的物理效果,除了PC上的PhysX物理卡外,PS3、Xbox 360和Wii上也有应用其物理引擎进行游戏开发。目前,使用PhysX物理引擎SDK的开发者超过一万人。

正如NVIDIA(英伟达)创始人首席执行官所说:"AGEIA团队是世界级的,他们拥有和我们同样的激情,创造最令人惊叹和最有魅力的游戏体验。通过创造世界上最深入人心的GPU和物理引擎品牌的强强联手,我们可以将GeForoce加速的PhysX技术带给全世界数以百万计的游戏玩家。"而我们也相信,凭借出色的“The way it's meant to be played”计划与AGEIA团队团队的加入,NVIDIA(英伟达)今后将在GPU领域拥有更高的建树。
黄金规格
GeForce 9600GT核心代号G94,仍旧采用65nm工艺制造,目前显存容量为512MB,后期将逐渐有256MB的产品面市。G94拥有5.05亿晶体管,远低于G92的7.54亿,因此虽然制程上没有更新,发热量及功耗方面都要显著的低于G92核心,额定TDP只有95W,与Radeon HD 3850 512M持平。
|
ATI Radeon HD
3850 512M |
NVIDIA Geforce 9600GT 512M |
NVIDIA Geforce 8800GS 384MB |
NVIDIA Geforce 8600GTS 256MB |
核心代号 |
RV670Pro |
G94 |
G92-xxx |
G84-400 |
工艺制程 |
55nm |
65nm |
65nm |
80nm |
晶体管数量 |
666 million |
505 million |
7.54 million |
289 million |
核心频率 |
669MHz |
650 MHz |
600 MHz |
675 MHz |
SP流处理器
(标量单元) |
320 |
64 |
96 |
32 |
Shader频率 |
669MHz |
1.625 GHz |
1.5 GHz |
1.45 GHz |
纹理单元 |
16 |
32 |
48 |
16 |
光栅单元 |
8 |
16 |
12 |
8 |
显存类型 |
GDDR3 |
GDDR3 |
GDDR3 |
GDDR3 |
显存带宽 |
256 bit |
256 bit |
194 bit |
128 bit |
显存频率 |
1.66GHz DDR |
1.8GHz DDR |
1.8GHz DDR |
2.0GHz DDR |
输出接口 |
DVI+DVI+S-Video |
DVI+DVI+S-Video |
DVI+DVI+S-Video |
DVI+DVI+S-Video |
高清技术 |
Avivo HD |
PureVideo HD 3 |
PureVideo HD 2 |
PureVideo HD 2 |
PCIe版本 |
2.0 |
2.0 |
2.0 |
1.0 |
DirectX版本 |
10.1 |
10.0 |
10.0 |
10.0 |
GeForce 9600GT仍旧不支持DirectX 10.1规范,虽然Windows Vista SP1发布在即,但是如果DirectX 10.1今后仍旧不能得到NVIDIA(英伟达)的支持,那么DirectX 10.1可能会如DirectX 8.1一样无法在游戏界普及。另外根据NVIDIA(英伟达)表示,虽然G9×和G8×系列没有明确支持DirectX 10.1,但是实际上除了一项以外其余G9×和G8×都可以提供支持。
PCI-E 2.0、Display Port、HDMI、HDCP在GeForce 9600GT上都得到了支持,Display Port规格的强大是毋庸置疑的,10.8Gb/s的传输带宽是HDMI 1.3规范也不能比拟的,另外最重要的是Display Port是免费的,因此Display Port得到了诸如Intel、NVIDIA(英伟达)、AMD等硬件厂商的支持,不过HDMI接口在家电领域已经得到广大家电厂商的支持,付费的公司早已不再少数,所以Display Port接口能否接替HDMI目前来看仍不明了。

DVI-TO-HDMI
在规格的比较上,对比GeForce 8800GS,GeForce 9600GT在流处理器上有一定缩减,另外由于G94架构仍然采用流处理单元绑定纹理单元的做法,因此,纹理单元也只有32个,不过16个ROP单元与256Bit的位宽是GeForce 8800GS所不具备的,在抗锯齿模式下GeForce 9600GT将拥有更好的性能。
纹理双寻址引擎
关于管线与纹理单元的匹配问题,NVIDIA(英伟达)与AMD-ATI的争议由来已久,AMD-ATI认为现在的游戏更多的是需要像素的运算,纹理单元的作用越来越不明显。例如,在R300时期AMD-ATI就率先引进了1:1(像素着色单元:纹理处理单元)的设计,而当时的NV30还是基于1:2的设计;到了RV530时,AMD-ATI更是大胆的引进了3:1的架构,而NVIDIA(英伟达)则一直保留在1:1状态。

GeForce 7900GTX仍旧保持1:1的像素:纹理
到了DirectX 10显卡时期,两家的设计思路仍旧没有改变,并在的像素了纹理的绑定关系上都发生了变化。NVIDIA(英伟达)仍旧采用传统的流处理器后端绑定纹理单元的做法,而AMD-ATI则将流处理器与纹理单元完全分离,并且在数量上NVIDIA(英伟达)保持着2:1(流处理器:纹理单元)的关系。而AMD-ATI由于流处理器与纹理单元之间都可以独立的缩减,因此在不同产品上比值不同,不过在纹理数量上还是普遍的低于NVIDIA(英伟达)。

到了G92时期,NVIDIA(英伟达)为了加强纹理的运算能力,更是将原来的2组Shader阵列对应的8个纹理过滤单元增加到16个,与纹理寻址单元相同,而到了G94时期,为了和shader性能提升匹配,GeForce 9600GT纹理引擎内建双寻址能力,每时钟周期可以进行8次双线性寻址计算,8个纹理过滤计算。

在NVIDIA(英伟达)把G80屏蔽为64SP、256Bit规格后与G94同频对比中,G94在多数游戏中都有一定幅度的性能提升。
覆盖压缩技术
像素光栅处理器NVIDIA(英伟达)与AMD-ATI又着不同的叫法,NVIDIA(英伟达)成为ROP(Raster Operation Processor光栅操作处理器),而AMD-ATI则称之为Render Back End(后期渲染),其作用作用就是像素输出,同时还担负了Z轴(深度)操作、抗锯齿取样等重任务。

GPU处理完3D画面后,得到的是一组组的“矢量数据”比如,一条矢量线(图A),描述它的量就是起始和终结的两个坐标点(起始点坐标(方向,长度)。但我们知道,最终到显示器进行数字显示时是以“像素”为单位的,这样,就要把这种矢量数据转换成为一个一个的像素数据,这个过程就是“光栅化”,处理这一过程的就是显卡的ROP单元。

图A
打个比方,比如,在显卡中描述一条线是从3D坐标(a,b,c)到(x,y,z),首先,经过显卡的计算转换成当前视点下的平面2D坐标(A,B)到(C,D),这两个坐标指得是内部图像的坐标,而不是最终成像的像素坐标。然后,ROP就将这条矢量线转化成一系列的对应屏幕像素的点(a1,b1)(a2,b2)(a3,b3)......(ax,bx)如图B。

图B
GeForce 9600GT在ROP(Raster Operon Processor光栅操作处理器)单元的算法中也进行了改进,在高分辨率下提升了压缩覆盖性能。另外通过光栅处理器的规模对比我们可以看出,Radeon HD 3850是8个Render Back End对应256Bit位宽,而GeForce 9600GT是16个ROP对应256Bit位宽,可以预见GeForce 9600GT在高分辨率及抗锯齿模式下将大幅领先于Radeon HD 3850。
最完美的高清功能
当NVIDIA(英伟达)首次在G84加入高清专用解码单元BPS和VP2时,就注定了2007年是一个显卡届的高清年。高清电影的编码格式分为3种:H.264、VC-1、MPEG-II。在这3种中,H.264的解码方式最为复杂,占用CPU的资源也最多,因此NVIDIA(英伟达)在G84中加入了专门硬件解码CAVLC/CABAC解码的BPS单元,但是对于VC-1格式的影片则只能使用VP2单元处理后面的3步,相对于AMD-ATI的可以全程支持H.264与VC-1不免有些逊色。

G84无法全程硬解码VC-1
到了NVIDIA G98核心的GeForce 8400GS,NVIDIA(英伟达)也终于弥补了之前的遗憾,可以全程硬件解码VC-1格式的影片。而GeForce 9600GT的高清解码处理器已经升级为更新的VP3单元,凭借VP3单元的优秀高清能力,NVIDIA首次实现了H.264、VC-1、MPEG-II三种格式影片的全程硬解码。之前的UVD及PureVideo HD都只是征服了H.264及VC-1,而对占据高清编码格式1/3的MPEG-II则做不到全程的硬件解码。

G98已经可以全程解码VC-1
也许很多认为MPEG-II对于处理器的性能要求不高,但是峰值达到40MBPS码流以上的MPEG-II对处理器的性能要求并不低,另外花费很少的晶体管数量就可以做到3种格式的全程硬解码,投入产出比很高,再有既然已经做了高清硬件解码,为了不做到完美呢?至此,完解高清硬件之战始于G84,终于G94。
动态对比度增强
在最新的PureVideo HD中,NVIDIA(英伟达)作出了多项增强画质的功能,如动态对比、色彩增强、画中画等等。下面我们先来关注一下PureVideo HD中的动态对比技术。其实动态对比这词我们最多听说的是在显示器领域,并且目前已经成为显示器的一种主流技术。其中与LG的DFC锐比技术及三星的动态对比技术DCR最为著名。

LG DFC锐比对比技术
以LG的DFC技术为例,该技术主要由三部分组成,分别是ACR(Auto Contents Recognition,即自动识别),DCE(Digital Contrast Enhancer,即数字增强对比度)和DCM(Digital Contrast Mapper,即数字对比映射)。ACR能够自动检测从PC主机输入的显示信号的各项参数,进而调节和优化液晶显示器的对比度,DCE可大幅降低最黑亮度,并有效调节中间色阶的鲜艳程度,从而达到优化显示的效果。
无动态对比度,画面发灰

打开动态对比度,画面层次增强
然而实际使用过动态对比显示器的用户都知道,打开动态对比度的意义并不明显,因为动态对比度会根据画面的颜色进行调整,例如如果一帧画面大部分为深颜色,那么动态对比度技术会自动降低画面的亮度,而当一帧画面大部分为线色时亮度又会增强,这就势必会导致黑画面中浅色部分更不明显,浅色亦同理。而PureVideo HD中的动态对比度功能则仅对那些不完美的曝光的帧进行校正。我们来看上图中对视频中每秒30帧进行柱状图分析,PureVideo HD可以找到对比低的帧进行完美的曲线校正,这样就不会导致整体视频亮度降低,使画面层次更为丰富,与显示器的实现方法不同。
动态三原色及肤色还原
人眼的视网膜上的杆状细胞对光的亮度很敏感,感受光的亮度,而锥型细胞则对光的颜色很敏感,感受光的颜色,人眼视网膜上有三种锥型纤维细胞,分别对红色、绿、蓝光敏感,人眼所看到的任一颜色,都是光引起这三种锥形细胞一定程度的兴奋所合成的。目前,使用大屏幕显示器观看高清影片的人也不在少数,甚至已经超越了坐在高清电视前观看影片的用户。

液晶电视的优点在于兼容性和颜色处理能力
对比液晶电视,显示器最直观的优点就是分辨率及画面的细腻程度,这点是目前FULL HD的高清电视也不能比拟的。但是液晶电视的优点则在于信号的兼容性及对颜色的处理能力,液晶电视内置的图形处理器可以适当的根据人眼敏感度来优化色彩,例如可以通过控制芯片来增加绿色、蓝色等,这些功能是显示器所不具备的,所谓术业有专攻正是这个道理。

绿色增强

蓝色增强

肤色增强
在实际的高清电影观看中,肤色也是我们所关注的一种颜色,如果我们使用显示器来观看高清电影,PureVideo HD可以从一个图像中分离出这蓝,绿,肤色三种颜色来进行处理,使画面的颜色更加生动。动态蓝,绿,肤色增强器能对这三种颜色进行曲线校正,提升画面的平衡和清晰度,而不会造成饱和度过高。
内建双视频流解码器 支持画中画
不久前,随着东芝的退出HD DVD阵营,长达数年的蓝光与HD DVD格式之战终于尘埃落定,蓝光目前已经毫无疑问的胜出。在蓝光1.1规范中对于画中画(PIP,Picture in Picture)明确给予了支持,近期发行的《太阳浩劫》、《生化危机3》中都提供了画中画功能。画中画兴起于80年代初,后由于实现成本太高及画面画无法满足观看需求而被人们遗忘。
在现在的高清影片中,其分辨率已经打到了1080P(1920×1080),而蓝光1.1中提供的画中画则是以DVD标清《720×540(4:3)或者960×540(16:9)》显示,那么画中画就完全可以满足我们的观看要求,剩下的就是硬件上的解码能力及实现成本了。

画中画
在之前的A-VIVO HD(UVD)及PureVideo HD均只能硬件解码一组视频流,这样画中画的实现就只能依靠CPU来完成。在GeForce 9600GT中,NVIDIA(英伟达)特意加入了双流解码加速(Dual stream decode acceleration)单元在PureVideo HD中,从而实现双视频流硬件解码。这样片中拍摄花絮及导演介绍等资料,我们就可以打开画中画功能一边观看正片一边观看这些内容。
另外,Windows Aero模式下播放HD视频,如果没有PureVideo HD,在Aero模式下播放HD视频就会出错,然后使系统恢复到普通模式。
P545公版设计
GeForce 9600GT称得上目前为止NVIDIA(英伟达)最强的中端显卡,因为其做工影料丝毫不逊于高端的GeForce 8800GT。公版GeForce 9600GT采用P545的PCB设计,尺寸和公版8800GT所用的P393 PCB同为229mm X 99mm,不过由于G94的针脚与G92并不兼容,因此,可以肯定GeForce 9600GT为一款采用全新布线设计的显卡。




公版GeForce 9600GT只提供了双DVI+S-Video接口,不过附送的DVI-TO-HDMI转接头可以实现HDMI输出,至于Display Port的解决方案则由具体的下游厂商自行决定。
细节定成败

精致的做工,符合RoHS工艺

PCB棱角特写

一直觉得这个LOGO是一种艺术

6PIN供电接口

散热器风道设计

SPDIF音频接口
又见45度角核心
GeForce 9600GT采用了与GeForce 8800GT相同的环形显存设计,显存这样排列的益处是可以尽量的保证每条显存信号线的长度尽量等同,使信号更为稳定,与大量采用蛇形走线有异曲同工之妙。



核心特写
首批公版GeForce 9600GT采用G94-300-A1核心,不排除今后NVIDIA(英伟达)升级核心代号的可能,GeForce 9600GT的核心与PCB成45度角,与环形显存一样可以保证信号的等同性。

G94核心与5角硬币大小比较 略小于硬币


8颗三星16MB×16Bit GDDR3显存构成了512MB/256Bit的规格,1.0ns的颗粒速度为GeForce 9600GT运行在1800MHz提供了保障。
豪华两相供电
GeForce 9600GT虽然采用了与GeForce 8800GT相同的两相供电设计,不过却有不同,GeForce 9600GT的PCB Layout就只有两相,因为作为中端只有95W功耗的GeForce 9600GT来说也已足够,不过P393在设计之初就考虑到除了满足GeForce 8800GT的供电外,还要为接踵而来的GeForce 8800GTS 512M做准备,因此P393的设计难度大于P545,不过P545则能更好的控制成本。



GeForce 9600GT供电用料为历届中端显卡之最,品质象征的钽电容及三洋SVP豪华固态贴片电容都可以看到,电感方面采用的是全封闭式陶瓷电感,MOSFET则更是采用了贴片式四引脚高端产品。可见GeForce 9600GT从做工到用料都在向高端的GeForce 8800GT看齐。
显卡采用一体式单槽散热器设计,覆盖于整个PCB正面,兼顾显存与供电部分的散热。虽然GeForce 9600GT的发热量并不大,不过NVIDIA(英伟达)仍旧给GeForce 9600GT配备了铜块散热,这份细心非常值得我们肯定。




测试平台详细规格
本次的测试平台使用了Intel四核处理器QX9650,(采用45nm工艺、1333MHz总线频率、实际主频3.0G、L2 cache为12M),Crossfire平台主板为华硕自家的 Maximus Formula Special Edition,采用X38北桥+ICH9R南桥,通过华硕自家的CrossLink技术,可以支持PCI-E X8+X8的双卡模式,SLI平台主板来自讯景XFX的nForce 680i主板(X38+ICH9R,支持PCI-E X8+X8+X16),内存选用了两条金士顿Kinston PC-2 6400 DDR2 800MHz,单条容量为1GB,内存时序:5-5-5-16。
硬 件 测 试 平 台
|
处理器 |
Intel Core 2 Duo QX9650处理器(45nm、1333MHz FSB、主频3.0G、L2 cache为12M) |
主板 |
ASUS Maximus Fomula Special Edition(Intel X38+ICH9R,支持PCI-E X8+X8)
XFX nForce 680i主板(680i SPP+680i MCP,支持PCI-E X8+X8+X16) |
散热器 |
Tt 大台风Big Typhoon VX CL-P0310 |
显示器 |
|
内存 |
金士顿Kinston PC-2 6400 DDR2 800MHz 1GB x2
(内存时序:5-5-5-16) |
硬盘 |
WD Raptor 150G SATA HardDisk Driver
Samsung HD160HJ金宝 7200转 160G SATA HardDisk Driver |
电源 |
TT ToughPower 650W |
|
系 统 平 台 及 驱 动 信 息 |
操作系统 |
Microsoft Windows Vista Ultimate |
显示驱动 |
HD 3850 512M:Catalyst 8.1 for Vista-32bit
8800GS 384M:NVIDIA forceware 169.32 for vista-32bit
9600GT 512M:NVIDIA forceware 174.12 for vista-32bit
|
主板驱动 |
Intel Chipset Software Installation Utility驱动8.3.0.1013 |
DirectX版本 |
DirectX 10.0 API |
CPU-Z信息一览:




操作系统选择上,我们使用了Windows Vista Ultimate。
|
测试项目及测试方法 |
DX9理论测试 |
3Dmark06 v1.1.0 |
全部 |
DX9游戏 |
使命召唤4:现代战争
|
Fraps |
DX9游戏 |
虚幻竞技场3 |
外挂测试(WAR-Torlan-fly场景) |
DX10游戏 |
生化骑兵 |
Fraps |
DX10游戏 |
战争机器 |
Fraps |
DX10游戏 |
英雄连:抵抗前线 |
自带测试BenchMark |
DX10游戏 |
失落星球:极限状态 |
自带测试BenchMark |
DX10游戏 |
冲突世界 |
自带测试BenchMark |
DX10游戏 |
狂野西部 |
自带测试BenchMark |
DX10游戏 |
孤岛危机 |
外挂(GPU_test) |
游戏方面,我们选择了13款主流游戏大作,包括《极品飞车:专业街道赛》、《使命召唤4:现代战争》、《虚幻竞技场3》3款DX9游戏,《生化骑兵》、《英雄连:抵抗前线》、《失落星球:极限状态》、《冲突世界》、《孤岛危机》6款DX10游戏和《狂野西部》一款DX10 Benchmark。

3Dmark06
自1998年发布第一款3DMARK图形测试软件至今,3DMARK已经逐渐成为一款最为普及的3D图形卡性能基准测试软件。3DMark06主要使用最新一代游戏技术衡量DirectX 9级别的3D硬件,比起前作3DMark05更为复杂,包括重新设计的Canyon Flight测试,以及全新Deep Freeze测试单元,严酷考验系统的Shader Model 3.0、HDR渲染能力。

测试分辨率:1280x1024@32bit No AA/AF、 1920x1200@32bit


3Dmark06 AA测试


3Dmark06尽管仅是一款DX9.0c的Benchmark,但测试的结果已经能够充分的诠释全新G94在纹理压缩方面的优势,9600GT 512M在8AA/16AF的高负载模式下全面超越了同价位的8800GS 384M。
孤岛危机
Crysis具有诸多的先进而独有的DX10特性,才让其成为FPS游戏中最瞩目的焦点。回顾一下几乎历代游戏图形引擎的大幅度跨步前进,都同DirectX的发展离不开,而Crysis也正是主要因为采用DirectX 10的CryENGINE 2引擎才成为当前游戏图像质量革命的引领者。


测试方法:使用Crysis Benchmarking软件记录平均帧数。
测试分辨率:1024x768/1280X1024/1680X1050@32bit / 画质:中等 /No AA.AF

Crysis不愧是检阅DX10显卡的硬件杀手,8800GS 384M借助Forcewware 169.32驱动和96个SP管线单元的优势,以大幅度领先NV中端新贵9600GT 512M,9600GT仅64个SP标量管线单元,成为不敌8800GS的主要原因。对手HD 3850 512M的性能也不弱,帧数基本与9600GT 512M持平。
冲突世界
《冲突世界》(World in Conflict)是一款以虚拟全球冷战为故事背景的RTS游戏,PC版游戏画面真正达到高清大片的水准。游戏以发生于21世纪的虚拟全球战争为背景,是Vivendi旗下著名的Massive Entertainment公司(代表作有《地面控制》系列)最新开发的产品。

《冲突世界》设定在一个虚拟历史的世界中,并没有像我们知道的那样结束,而是一直持续,苏联也并没有解体,而且苏联开始进攻美国。该作中没有资源采集的过程,一切资源补给全部依靠战略支援。《冲突世界》的一大特点是拥有第一人称视角。



测试方法:采用游戏Video菜单自带GPU Benchmark工具记录平均/最大/最小帧数。
测试分辨率:1024x768/1680X1050/1920x1200/2560x1600@32bit / 画质:中等 /No AA.AF



冲突世界 AA测试



打开AA抗锯齿后GeForce 9600GT的成绩更加突出,此时GeForce 8800GS的位宽弱势及Radeon HD 3850的后端渲染弱势显现出来,GeForce 9600GT抗锯齿性能优秀。
失落星球
PC版《失落的星球》用增强的画面与游戏性来弥补没有新增内容的遗憾。游戏支持DirectX 9与DirectX 10,所以游戏可以运行在Windows XP与Windows Vista系统上。游戏光影效果与各种其他效果看起来都美轮美奂,较Xbox 360版本游戏有大幅度提升。

作为NVIDIA“The Way It's Meant To Be Played”列表中的一个,Capcom的游戏开发小组专门为NVIDIA显卡做游戏画面优化。


测试方法:采用游戏自带GPU Benchmark工具记录平均/最大/最小帧数。
测试分辨率:1024x768/1680x1050/1920x1200/@32bit
画质设定: DX10、ALL HIGH



失落星球 AA测试



作为NVIDIA的“the way”游戏,GeForce 9600GT及GeForce 8800GS都有不俗的表现,尤其是GeForce 9600GT,在打开1920×1200分辨率下打开AA后领先Radeon HD 3850幅度达25%。
使命召唤4:现代战争 AA测试
《使命召唤4》与所有系列前作相比发生显著的变化,游戏时代背景由前几部的以第二次世界大战时期为中心,直接转变为以现代战争为背景。作为一款第一人称视角的FPS游戏,自上市以来,曾创下连续几周蝉联北美地区销售榜首的战绩。

尽管不是一款基于DX10引擎设计的游戏,《使命召唤4:现代战争》的画面效果、逼真程度毫不逊色于一些所谓的DX10游戏,它真正吸引人的地方还是其超高的可玩性和现场感,以致于不少玩家抱怨COD4的关卡过少,还没玩过瘾就已经通关,只能期待资料片的放出。



“Charlie Don't Surf ”游戏测试场景
测试方法:选取Missions ActⅠ第2个任务“Charlie Don't Surf ”开始前一个大约60秒的过场动画(即时渲染),使用Fraps软件记录60秒内平均值,共记录3次,取3次的平均值为最后所得帧数。
测试分辨率:
1024x768/1680x1050/1920x1200/2560x1600@32bit

狂野西部

这页我们来看看COJ DX10的测试结果,《狂野西部》(Call of Juarez)DX10版本由Techland开发,Focus Home Interactive和UbiSoft Entertainment联合发行。游戏背景设定在19世纪末美国西部,是一款第一人称视角的FPS游戏,在故事情节、射击动作、游戏画面等方面均有独到之处。

测试分辨率:1024x768@32bit Low No AA/AF、1680x1050@32bit balanced 2AA/AF


狂野西部 AA测试


COJ与Crysis一样,对显卡的绝对渲染能力和显存容量、带宽要求都相当高,1680x1050分辨率下,几款显卡都能保持在30fps以上的水平,HD 3850 512M在这款AMD-ATI御用的游戏中捍卫了A卡的尊严。
鱼雷快艇:海洋骑士
《鱼雷快艇:海洋骑士》(PT Boats: Knights of the Sea)是一款鱼雷艇驾驶模拟海战游戏, 开发商Akella在游戏尚未发布之前,先推出了一款DX10 Tech Demo Benchmark测试程序,让用户先行体验游戏DX10特效的漂亮画面和高细节的游戏模型,该游戏发布日期还没有准确消息,但厂商之前透露会在今年发布。

这款Demo Benchmark支持的主要特色如下:高级海洋渲染、软粒子、反射、光束线和高级透明效果、射击和光照的高级HDR效果。

测试方法:运行该游戏Demo Benchmark工具,记录平均/最大/最小帧数。
测试分辨率:1024x768@32bit Low No AA/AF、1680x1050@32bit Medium 4AA/AF


鱼雷快艇:海洋骑士 AA测试
根据先前的测试经验,《鱼雷快艇:海洋骑士》打开AA特效后,Geforce 8600GT/HD 2600XT等中低端显卡仅有个位数的表现,这页我们再来看看9600GT开启AA后在这款benchmark中的表现:


N卡在这个测试程序中一直有个良好的表现,在1680x1050分辨率中等画质下开启4倍全屏抗锯齿,8800GS和HD 3850帧数有严重的下降,比起G92系列产品,9600GT 512M确实在AA方面做了很大改进和优化。
战争机器
《战争机器》(Gears of War)是Epic Games公司首度为微软游戏工作室开发的游戏。作为Xbox 360平台的招牌大作,采用Unreal Engine 3引擎的《Gears of War》(《战争机器》)移植PC后绝对是近期最令人期待的游戏之一。微软的计划是用这样一款毋庸置疑的大作来提高Games for Windows平台的人气。游戏故事叙述未来世界的人类与地底种族罗卡斯之间的生存之战。

游戏的类型并非常见的第一人称射击游戏,而是采取背后视点的第三人称策略动作游戏,能更清楚的显示出玩家所操作角色的一举一动,与环境的互动也更为生动丰富。

与虚幻竞技场3明显的区别,Gear of War加入了DX10/AA的支持,我们知道在最新的DX10.1规范中,HDR/AA特效是强制执行的,从理论上HD 3800系列的会表现更好一些。
测试方法:选游戏中一个固定场景以固定线路移动,使用Fraps软件记录30秒的平均值,共记录3次,取3次的平均值为最后所得帧数。
测试分辨率:1024x768/1680x1050/1920x1200/2560x1600@32bit

这款游戏进行了锁帧,最高帧数只能达到62fps。9600GT 512M看起来更适合这款游戏,1680x1050下仍能保持50fps的水平,当然HD 3850 512M也有它的优势,这款游戏A卡普遍在开AA后的成绩更好一些,编辑猜测这与HD 3800系列显卡支持DX10.1 HDR/AA有关,即类似于“Free AA”,而且A卡画质明显会比N卡好一些,对这个感兴趣的朋友可以自己去截图比较一下。
战争机器 AA测试

测试场景截图
同时打开DX10与AA特效后的成绩对比情况:

虚幻竞技场3
对于广大FPS玩家来说,《虚幻竞技场3(Unreal Tournament 3)》标志着有史以来最具号召力的科幻竞技射击游戏系列的正式回归。基于强大的“虚幻3(Unreal Engine 3)”图像引擎,《虚幻竞技场3》在图像效果、游戏性以及挑战性推向全新的高度。

《虚幻竞技场3》游戏的画面风格类似使用同一图象引擎的《战争机器》,不过画面在高分辨率和高倍数的抗锯齿的情况下,实际效果比《战争机器》要好上很多。而且游戏中还包含了大量的载具和武器,这些都将成为玩家们在游戏中必须利用的一些元素!


测试方法:使用一款UT3 Benchmark V0.2.0.45 Benchmark软件,纹理细节、图像等级都设为“5”最高,运行其中的“War-Torlan_fly”飞行场景模式,记录所得平均帧数。
测试分辨率:1024x768/1680x1050/1920x1200/2560x1600@32bit ALL High

War-Torlan_fly游戏场景截图
基于UE3引擎的游戏在光影效果尤其是HDR高光动态很有自己的特色,不像《上古卷轴4》、《切尔诺贝尔利阴影》、《孤岛危机》光影会随着动态生成的天气实时变化,在画面的真实感上差了一些,但这样的好处是降低了渲染的难度。

对于UT3这款人气大作来说,千元以上价位的中端显卡1680x1050基本都能跑在60fps左右,22宽LCD玩的话,流畅运行不成问题。
生化奇兵
《BioShock》在发布之前被誉为2007年最值得期待的游戏之一,游戏引人入胜的剧情和出色的可玩性赢得了国外专业游戏媒体满分的评价。这款科幻恐怖射击游戏由Irrational Games采用“虚幻引擎3”改良而来的“Vengeance”引擎开发,被看作是《System Shock 2》(网络奇兵2)的精髓续作。

《BioShock》游戏全面支持DirectX 10,尤其是对水面渲染进行了加强,比如反射和折射效果,而且物体在投入水中的时候也会有物理模拟加速,从而产生互动的波浪效果,另外火焰燃烧等软粒子效果也很出色,物体阴影同样是动态变化的,游戏还支持DX10.1规范要求的全局动态照明特效渲染,从而营造出了非常细腻的城市场景、人物纹理及动态光影等效果。复杂的纹理渲染和动态光影,这款游戏对显存容量的要求也超过了256MB。

Video设置:点击放大原图
测试方法:选取游戏第一个坠机的火海场景,使用Fraps软件记录30秒内平均值,共3次,取3次的平均值为最后帧数。
测试分辨率:1024x768/1680x1050/1920x1200/2560x1600@32bit ALL High

9600GT 512M在生化奇兵中的表现让人惊叹,1024x768下的帧数已经超过了半年前8800GTX 768M的成绩,但是到了1920x1200分辨率,9600GT 512M、8800GS 384M、HD 3850 512M基本都在接近30fps左右徘徊,对于这款第一人称FPS游戏来说,不到30fps的话玩起来你会感到画面明显的卡顿,2560x1600分辨率对中端显卡来说要求有点过分,看来只有8800GTS 512M级别的显卡才能胜任。
功耗测试
NVIDIA 9600GT PDF给出显卡TDP功耗为95W,官方给出最低需要一个400W以上的电源,那么它的实际功耗表现如何呢?

测试方法:Vista系统开机后不运行任何程序,并将后台多余程序全部关闭,系统闲置20分钟后记录整机功耗值;运行3Dmark06 1920x1200@32bit 8AA/16AF,记录3D峰值时整机功耗。
测试说明:室温恒定26°C

NVIDIA 统一着色架构显卡核心频率与Shader频率并不一致,与传统的分离式渲染架构相比,2D降频似乎很难做到,9600GT 512M所组建的平台峰值功耗超过了8800GS 384M,达到221W,对手Radeon HD 3850 512M在闲置功耗的控制方面要好一些。
9600GT SLI:失落星球
单卡的性能真的很强,双卡SLI后的性能也非常令人期待,我们加入了,测试的第一款游戏为失落星球。




9600GT 512M SLI后的性能相当惊人,在这款DX10游戏中成功地超过HD 3870 X2 1GB,如果以目前两者的价格来看,9600GT 512M SLI无疑是非常超值的。
9600GT SLI:英雄连:抵抗前线
《英雄连:抵抗前线》也加入了对SLI/Crossfire的支持,接下来我们来看看Geforce 9600GT 512M SLI的成绩如何:




SLI测试总结:
目前的DX10游戏对SLI/CF的支持非常有限,不少游戏在开启双卡SLI/CF后,成绩不升反将,174.12驱动对SLI的优化也有待进一步完善,相信随着微软Vista SP1补丁正式发布,未来的双卡SLI/Crossfire会有更好的表现。
测试总结/市场展望
作为NVIDIA(英伟达)在中端布置的黄金产品,GeForce 9600GT的表现可以用惊艳来形容,在对比GeForce 8800GS与Radeon HD 3850时,在大多数游戏及分辨率都以决定性优势胜出,尤其是打开抗锯齿的测试环境下,不愧为最强的中端产品。目前20、22宽显示器已经成为市场的主流,GeForce 9600GT可以在这些显示器的标准分辨率下流畅的运行游戏,而打开抗锯齿时仍然不失可玩性。抗锯齿选项的开启不仅可以使画面的细腻度增加,并且可以消除画面移动中的画面闪烁问题,可见抗锯齿对于追求画面质量的玩家是必不可少的,而在中端可以实现这样画质的产品中,GeForce 9600GT是唯一的选择!

在SLI的测试中,GeForce 9600GT的表现则更加让人震撼,有些游戏中的性能提升甚至接近单卡性能的两倍,甚至可以超越旗舰级的GeForce 8800Ultra,性价比无人能出其右。NVIDIA(英伟达)一直把SLI当作一个品牌在推广,在AMD-ATI的CrossFire尚未成熟阶段,SLI技术甚至曾经担负着划分市场格局的作用。

GeForce 9600GT的性能是毋庸置疑的,但是目前唯一的缺陷就是官方建议售价偏高,大概为人民币1499元价位。我们知道在这个价位上可选择的产品也非常丰富,包括AMD-ATI的Radeon HD 3850 512MB、NVIDIA(英伟达)自家的GeForce 8800GS 768MB、GeForce 8800GT 256MB等。但是我们也应该看到,GeForce 9600GT的上市价格与GeForce 8600GTS上市价相同,1499元的价格一直都是NVIDIA(英伟达)中端产品的标准上市价格,从GeForce 6600GT时期就是如此。与GeForce 8600GTS时期有所不同的是,G84发布的时候AMD-ATI并没有DirectX 10的中端显卡与之抗衡,这样就导致了GeForce 8600GTS价格居高不下,不过现在的中端市场上,AMD-ATI早就布阵了Radeon HD 3850严阵以待,所以GeForce 9600GT的1499元建议售价应该只会停留在纸面阶段,实际上市的产品价格应该会低于这个价格。
另外,相信下游厂商会推出256MB的版本,这样GeForce 9600GT的价格还会进一步的降低,即使突破千元价位也不是没有肯能,只不过我们需要等待一段时间。再则目前对于NVIDIA来说其实已经控制着中高端市场,对NVIDIA来说目前最大的压力应该是来自与899元价位的Radeon HD 3690,也许即将到来的GeForce 9500GT便是应对Radeon HD 3690的法宝。
在高清解码方面,GeForce 9600GT也做到了业内最好,尤其在PureVideo HD软件配合方面,动态对比、画中画双流解码等都是其他产品所不具备的;最新的压缩技术及纹理双寻址引擎的配备更是让处在黄金分割点上的GeForce 9600GT更加完美。GeForce 9600GT的发布也势必引起AMD-ATI全面的调整中端产品的定位及价格,实际上AMD-ATI已经在开始这么做了,2008年的春天,值此元宵佳节之际,GeForce 9600GT在完美黄金分割点的光环下向我们走来了……