|
深入探讨AMD AthlonXP处理器
【原创】阅读
人次
2001年11月15日18:54
|
|
【文章简介】
“人类曾经认为地球是平的,人们也曾经认为MHz代表性能”—深入探讨AMD Athlon XP处理器... (4298 字) |
11月8日,AMD在光华长安大厦的北京办事处内召开了一次名为“微处理器的新发展”的讨论会,并在中国正式发布Athlon XP 1900+处理器。回想起来,AMD正式发布Athlon XP系列处理器是在今年的10月9日,而这也正是哥伦布发现美洲大陆的同一天。AMD想告诉我们什么? AMD一直在强调,频率并不代表性能,那什么是性能呢?要知道,我们买一台电脑不是用来看它有多高的主频,而是它能做什么工作,做得有多快。性能越高,完成某一工作所用的时间就越少。性能 = IPC(Instructions per clock,每一时钟周期内执行的指令)x 频率(MHz)。在80286、386和486时代,由于x86处理器的基本架构是相同的,所以不同厂家生产的处理器的IPC也完全相同,也就使人们认为性能等于频率,将主频作为区别性能的主要依据。 从第五代x86处理器开始,AMD K5、Intel 奔腾以及Cyrix 5x86虽然都兼容x86指令集,并且运行的软件也都相互兼容,但它们内部的结构开始出现了不同,这也是K5和5x86的浮点性能远远不如奔腾的主要原因。既然频率相同,那么IPC比较低的K5和5x86自然性能也就不如奔腾处理器了,486 DX4/100和奔腾100之间的巨大性能差别也可以用IPC不同来解释。 由于性能 = IPC x 频率,所以如果想提高处理器的性能,有两种方法:一是提升处理器的主频,二是提高IPC。无论是提升主频还是IPC或是同时提升都能起到提高处理器性能的目的。但处理器设计完成后,IPC就不能再做变动了,否则需要重新设计处理器。既然IPC不能变动,那么惟有提高主频才能提升性能。在Intel的一份文档中指出,“P4的设计重点是要提供一个平均水平的IPC,大约比P6微结构低10~20%”,换句话说,P4的IPC只有PIII处理器的80~90%,这也就很好地解释了为什么PIII 1G在某些测试中比P4 1.3GHz都快。较低的IPC值还有另外一个弱点:需要较高的频率才能弥补在IPC方面的不足。如果IPC比较低,那么提升相同的性能,就需要付出更多的主频为代价(相对于IPC较高的处理器而言),而且频率越高,性能方面的差别就越明显——因为IPC是固定的。 从实际应用来看,现在用户主要接触三大类电脑产品——PDA、PC和服务器。对于PDA,好象只关注某型号PDA处理器主频的人并不多,大部分人对PDA的功能和实用性更感兴趣,大家更关心掌上电脑的操作系统到底是Palm OS还是Windows CE。而服务器方面,则更注重实际应用性能,例如能够处理多少个并发连接负载等。世界上大部分功能非常强大的服务器的CPU的实际主频不过几百兆赫兹,Intel自己的ITANIUM处理器最高频率也不过800MHz而已。既然在高端和消费类产品领域领域,都不以频率作为性能的代表,那么为什么只有在PC方面,人们只认识频率呢? 所以,AMD打算创建一个“TPI标准”,用来衡量CPU真实性能的高低。TPI是指 True Performance Initiative,真实性能标准。如果这一标准能够普及,那么用户们去购买电脑时就可以直接根据TPI来判断什么样的机型适合自己使用,整机也会通过TPI来标明性能,就好象某型号的电脑宣称QUAKE 3能跑多少帧一样,只不过帧数会被更真实更客观的TPI所代替而已。TPI标准将在2002年出台,届时也会有很多厂商支持。为了实现这一目标,AMD还特意任命了一个“用户宣传副总裁”,直接向CEO办公室汇报。 现在我们进入正题,来看看Athlon XP究竟有哪些过人之处。首先来回顾一下Athlon XP处理器的主要特性:
·采用0.18微米铜连线工艺制造;
·内嵌128KB一级缓存和256KB二级缓存,共计384KB;
·工作电压1.75V;
·核心(die)面积128平方毫米;
·晶体管数量:3750万;
·接口:Socket A(Socket 462);
·266MHz FSB(Front Side Bus,前端总线);
·QuantiSpeed体系结构;
·专业3D Now!指令集;
·采用型号而非频率来划分产品之间的区别
Athlon XP里的“XP”是指它为Windows XP操作系统而设计,而后面的1500+、1600+等等数字则代表型号。举例来说,实际运行频率为1.33GHz的Athlon XP标称为1500+,而且在系统开机的自检画面、Windows系统的系统属性以及著名的WCPUID中也都是这样显示的。当然,要想“正确”显示Athlon XP处理器的型号,所用的测试软件必须是支持Athlon XP处理器的最新版本,否则仍然会将实际运行频率显示出来。很多人以为Athlon XP 1500+的含义是指比P4 1.5G快一点(“+”嘛),实际上所谓的1500+并不是指它比P4 1.5G更快,而是相对ThunderBird核心的老Athlon处理器而言的,也就是说Athlon XP 1500+的性能要比老Athlon 1500MHz还高一点(这才是“+”的含义),跟P4毫无关系, 业界很多资深人士从AthlonXP的标称方式中自然而然的联想到奔腾时代Cyrix推出的6x86系列处理器的标称方式,即用PR标准值的方法来划分其产品。 当时Cyrix自己认为,他们的处理器在较低频率下就能达到较高频率的奔腾处理器的性能,所以将200MHz的Cyrix处理器标记为PR233出售,但问题也就出在这里。Cyrix 6x86处理器的PR值是通过Winstone 97的测试成绩来决定的。在Winstone 97测试中,由于大部分是整数运算,所以Cyrix处理器的性能要略高于同频的奔腾处理器,但Cyrix仅凭这一项测试成绩就认为200MHz的6x86处理器可以和奔腾233相比,并打上PR233的标记。实际上在浮点性能方面,即使是同频的6x86也比奔腾慢一半以上。另外,6x86系列处理器的PR标准值系统非常混乱,无论是150MHz还是166MHz的6x86,统统打上PR200的标记;而188和200MHz的6x86则全打上PR233的标记。6x86非常低的整体性能(不光是浮点运算能力低下,还有发热量奇大,容易死机、与部分主板不兼容等等BUG)为Cyrix带来了一系列恶名,连带着PR标准值也蒙上了一层阴影。 而AMD Athlon XP系列处理器命名方法与Cyrix则截然不同。Athlon XP系列处理器后缀的型号是通过多种类型的应用程序,包括数字媒介、办公软件和3D游戏以及大量业界标准测试决定的,包括了各个方面的性能,并没有仅采用某个单一测试软件的测试结果,也没有哪个软件为Athlon XP做了特别优化。最为重要的一点是Athlon XP的后缀1500+之类是相对老Athlon核心的Thunderbird而言的,并不是像先前的Cyrix一样是相对于奔腾系列而言。现在大多数人们也开始接受了AMD的这种标称方法。Athlon XP处理器后缀的型号与实际运行频率有以下关系: 型号= 实际频率 × 3 ÷ 2 - 500 而要想根据型号算出Athlon XP的实际运行频率,可以: 实际频率 = 型号 × 2 ÷ 3 + 333 实际上就是把前面一个公式按照一元一次方程的方法求解。 Athlon XP与现在采用“ThunderBird”核心的Athlon还有很多不同之处: ·采用全新的封装形式 “ThunderBird”核心的Athlon为陶瓷封装,也就是CPGA(Ceramic-PGA);而Athlon XP则采用了OPGA(Orgnaic Pin Grid Array,有机管脚阵列),这种封装的基底使用的是玻璃纤维,类似印刷电路板上的材料,可以降低阻抗和封装成本。 ·266MHz前端总线 由于主频已经很高,况且考虑到整体性能因素,Athlon XP系列处理器只有266MHz前端总线的产品。也就是说,大部分KT133A芯片组主板的用户只需要通过刷新BIOS就可以继续升级到Athlon XP,而只支持100MHz外频(200MHz FSB)的KT133主板用户就只能使用Duron系列了(未来的Duron系列处理器仍然是100MHz外频)。 ·兼容SSE的专业3D Now!指令集 Athlon XP加入了最新的3D Now!专业指令集,加入了52条兼容SSE(Streaming SMID Extensions)扩展多媒体指令,完全兼容Intel的SSE标准。Intel PIII处理器具有的SSE指令集,包括52条单精度指令和19条MMX指令,共计71条。而AMD推出K6-2则具有21条3D Now!指令集,到了K7的增强3D Now!指令集,又加入了19条MMX指令集和5条DSP/通信扩展指令,共计45条。现在Athlon XP中的专业型3D Now!指令集则具有97条多媒体指令,由45条增强3DNow!指令集和52条SSE扩展指令集组成。这样一来,无论应用软件是对SSE还是对3D Now!做优化,Athlon XP都可以从中得到好处。 ·QuantiSpeed体系结构 QuantiSpeed体系结构包含超标量完全管道化微体系结构、超标量完全管道化浮点单元、硬件数据预取以及增强TLB四个方面。 1、同时发出9条指令的超标量完全管道化微体系结构 处理器内部的管道(也叫流水线)深度直接关系到CPU的性能,如果管道过长,那么会产生较低的IPC和较高的操作频率(例如P4,具有超长的流水线结构[20段],IPC很低,频率较高)。如果管道过短,那么虽然IPC很高,但操作频率却比较低。如何平衡这两者之间的关系是个关键问题,Athlon XP能够保持管道深度与频率之间的平衡,所以实际性能比较高。 2、超标量完全管道化浮点单元 Athlon XP的超标量完全管道化浮点单元可以在每个时钟周期内完成更多的浮点操作,并且能够提高操作频率。实际上浮点性能从K7时代开始就已经是AMD的强项了。 3、硬件数据预取(Data Prefetch Mechanism) 为了提高处理器的性能,3DNow!和SSE中都有从内存里预取数据放进CPU缓存的技术,这种方法对于那些为3DNow!和SSE优化过的应用程序来说,能够减少了处理器访问内存时的平均延迟时间,而对于未经优化的程序则没有任何性能增强。Athlon XP通过硬件方式实现了这一功能,这种数据预取机制能够监测内存访问,发现有规律的访问模式(例如循环出现的数组数据访问),并以推测的方式在实际的数据访问开始之前将缓冲队列里的数据预取至CPU的二级缓存中,而不管应用软件是否针对3DNow!和SSE做过优化。 4、增强TLB(Translation Look-aside Buffer) 增强TLB结构能够保留关键数据表和靠近处理器的指令,当再次请求这些数据或指令时,这种设计可以使处理器不必等待就能开始操作。在Athlon XP中,TLB的容量更大、在高速缓存中是唯一的,并具有预测性。对TBL的这三种增强能够进一步提高IPC,从而提高了Athlon XP处理器的实际应用性能。 ·加入了保护CPU的温控单元 
前段时间,世界著名的硬件网站Tom's Hardware Guide做了一个各种CPU在散热器失效的情况下的实验,实验结果是AMD的Athlon 1.4G和Athlon MP 1.2G在突然拿掉散热器的几秒钟内便迅速烧毁。后来过不多久,AMD方面也放出了一段录象,实验同样采用Athlon MP 1.2G,突然拿掉散热器后,系统自动关闭,CPU安然无恙。而在仅仅是风扇停转的情况下(散热片仍在),仍然坚持运行了9分多钟,然后因过热而自动关机。这里面固然有主板是否支持过热保护电路的问题,不过Athlon XP也算开始支持过热保护了。虽然自动关闭系统会导致未保存的资料丢失,但起码比CPU烧毁要好。其实在主板上加入这种功能根本增加不了多少成本,可以想象,今后推出的主板绝大部分都会支持相关的保护电路。 Tom's Hardware Guide最近还对AMD和Intel的主流CPU做了一次性价比方面的评比,从表中我们可以看出是Athlon XP 1500+的性价比最好。现在的Athlon XP有着优秀的性能和较高的性价比,应该说Athlon XP处理器是很不错的选择,但在散热和安全保护方面还需要改进以及更多主板厂商的支持。
【作者:小熊在线-UM 北京】 版权作品
未经许可 请勿转载
|