|
自从INTEL推出P4以后,似乎给人们带来了个坏习惯:对于大数字有着前所未有的执著,特别是这些数字是写在M, H, 和 z这三个字母前面. 虽然我们都知道单纯的处理器主频绝对不是评价系统整体性能的参数,但是要要出现用这种数字欺骗消费者的情况,就是在今年,有些品牌机厂商使用2GHz Pentium 4与缓慢的 PC100 SDRAM 和 TNT M64 显卡搭配的整机系统. 这正是利用有些消费者以为追求高主频处理器的病态心里。
Intel的前一代 Celeron (也就是Celeron3)最终的主频被限制在了1.4GHz, 但是Celeron3面对AMD 的1.3GHz Duron 在实际性能表现并没有绝对优势,在能被世界察觉的频率数值上也没有实质性的领先。我想这也就是Intel急于推出基于在主频速度上又特别优势的 Pentium 4 构架的新 Celeron的原因,为的就是在主频速度上甩开对手的纠缠。
今天,我们通过全面的测试Celeron 1.7GHz来看看,Intel是通过什么样的方法使他的旗舰 Pentium 4转变成一款适合主流市场的产品。我们选用了一系列的测试项目给大家展示到底Celeron 1.7GHz 在主流的 CPU市场到底出在什么位置,同时也证明了单纯的时钟频率再也不是唯一评价cup性能的指标了!
Willamette—Celeron
Intel的新Celeron 看起来和Socket 478 Pentium 4 处理器惊人的相似,但从实际的构架和规范来看其实它就是一块廉价版本的老"Willamette" Pentium 4 (所有 Pentium 4系列的处理器都是以Willamette核心为基础的). 如同 Willamette一样, Celeron 1.7GHz 基于 0.18-微米制程和 1.75V 核心电压. 1.75V 比其前一代的Tualatin Celerons的 1.475V稍高, 因为Tualatin Celerons使用的是领先的0.18-微米制程。
在外形方面和Socket 478 Pentium 4 十分相似
我在这里可以列举出关于Celeron 1.7GHz的所有规范和指标,但这种单纯的列举没有任何意义,我们可以用这样简单的一句概括: Celeron 1.7GHz-还有最新的 1.8GHz 版本除了在L2 cache 大小以外和Willamette Pentium 4 processors 是一模一样的. Willamette Pentium 4系列 拥有 256K L2 cache, 新 Celeron将这个数字减到了128K. Celeron 仍然保留了和Willamette Pentium 4一样的8KB L1 数据 cache, 同样的执行跟踪cache (一个高效的L1 指令cache,大小估计在 21KB), 前端总线在 400MHz, 以及 Willamette Pentium 4所具有的其他特征.反正是只在 L2 cache 大小方面有所变化。
.
其中 的128K L2 cache被强行阉割了
这完全是Intel 降低成本的方法, 但是这种简化设计,也就是采用较小的cache,会影响整个处理器的性能表现吗?从理论上讲,将会产生非常大的影响,下面就是产生性能下降的原因。
Pentium 4系列处理器之所以能达到很高的运行频率,主要取决于它那条设计的很深的 20阶流水线管道. 深的管道设计能保证高频率的运行, 但是它还会导致每个时钟下工作效率的下降。其中还有个大问题就是纵深的管线性能表现天生会受到错误的分支预测的很大影响。即使Pentium 4'先进的分支预测单元的效率非常的高,在管道没有被处理高效率的使用的时候性能表现也会受到严重影响。
保证纵深管线设计良好运转的关键所在就是保证管线被高效率的使用,也就是说要保证向cpu提供足够的数据和指令流量来实现这一目的。Cache 就是完成这个任务的主要设计。 Intel 使用了 8KB 低延时 L1 cache和一个指令跟踪 cache,这个cache 能保持着12,000 指令.如果程序或者数据的大小超过 L1 cache,这些东西就会溢出到相对缓慢的L2 cache. 如果 L2 还是满足不了需要, 这是就要求助于系统的内存了, 可是它就要比任何cache要慢。由于高速cache价格昂贵,只能通过速度不同的各级cache配合来完成任务,达到性能和成本的协调。所以 cache的重要性就是显而易见了。同时老的 Willmette Pentium 4 处理器也给我们消费者一种迷惑:尽管他的主频已经达到 2GHz, 但它们的表现并不像它们时钟频率表现出来的那样强大。这就是Pentium 4netbust构架所要面对的事实,它们在每周期执行的指令数量 (IPC) 并不能达到 Athlon 和 Pentium III的水平. 因为和老P4构架的设计同出一辙, Celeron 1.7GHz 同样要面对这个问题. 在我们看来,Pentium 4的IPC 能力似乎是现在主流x86 体系构架中最低的,在这里我们没有考虑 VIA C3.
没有采用0.13微米的工艺使得新赛扬发热量不容忽视
专为主流市场设计的产品
现在的情况是,在intel对IPC 指标有意淡化下,很多人被1.7GHz 的主频速度迷惑了, 在对本地相关销售人员的交流中,发现他们对IPC 的概念也是相当的缺乏,这也在相当程度会对消费者购买意向造成影响。 难道说用户不能在新Celeron获得任何系统性能的提升吗?实际上,就算是L2 cache 方面作出了简化,Celeron 1.7GHz的 Socket 478兼容阵脚给系统带了许多好处,但这并不是处理器自身性能表现的提高。怎么这么说呢?我们知道同主频下, 老的Tualatin Celeron在处理器自身性能上能够完全胜出新Celeron,但它致命的伤在于Socket 370 的平台. 现在市场上的Socket 370构架主板在内存性能和I/0性能已经远远落后了。因为 Celeron 1.7GHz 本质上是一块Pentium 4处理器, 它就能使用现在市场上最新的 Socket 478构架的Pentium 4 主板—这些产品提供了 USB 2.0, Firewire, 相当好的板载声卡, 和ATA/133等一系列新的技术规范. 我们并不认为Celeron 1.7GHz对 SSE2 的支持能对主流应用产生多大影响,我们认为在现在来说它只是作为一个卖点,毫无用处。当然,在以后如果软件对SSE2 作出了优化,这一点就有实际作用了,实际上SSE2的作用就是为了改善Pentium 4底下的IPC性能.
我们的测试方法
所有的测试运行三次,我们取平均值,使用的测试平台如下:
我们使用了AMD最快的 1.3GHz Duron 处理器和一颗运行在400Mhz前端总线即1.7GHz的 Pentium 4 2.26GHz处理器进行对比测试。在使用和者的测试中可以看到Northwood 核心中额外的 L2 cache 带来的性能提升。
我们使用了如下的测试软件:
· SiSoft Sandra Standard 2001.3.7.50
· ZD Media Business Winstone 2001 1.0.3
· ZD Media Business Winstone 2001 1.0.3
· ZD Media Content Creation Winstone 2002 1.0.1
· MadOnion 3DMark 2001SE
· Quake III Arena 1.30
· Codecreatures Benchmark Pro
· Serious Sam SE v1.05
· Comanche 4 demo benchmark
· LAME 3.89
· Xmpeg 4.5 with DivX Video 5.02
· Sphinx 3.3
· ScienceMark 1.0
· POV-Ray for Windows version 3.5
· Mathematica 4.0
· picCOLOR NT Image Analysis 1.00
我们的测试系统 Windows 桌面设置为1024x768 32-bit color ,刷新率为75Hz. 垂直刷新同步(vsync) 在所有的测试中被禁止。所有的3D 游戏测试均使用高细节图形质量,分辨率设置为1024x768 32-bit color.
基准测试成绩
内存性能
Intel的 400MHz前端总线和DDR SDRAM 配合得很好,这里显示 Celeron 1.7GHz 在内存带宽方面比Duron 1.3GHz有效得多, 要知道 Duron 1.3GHz也是使用DDR SDRAM的。因为 Celeron 1.7GHz和Pentium 4 1.7A 同时运行在相同的芯片组上,我们在有效内存带宽方面看不出任何不同。
让我们下面从一张完全不同的测试曲线中,从另一个角度来研究。
Linpack 明显的表现出了更多的 L2 cache优势所在. Pentium 4 1.7GHz 访问更大的矩阵单元的时候比 Celeron 1.7GHz快得多. Duron 在开始的表现比 Celeron 1.7GHz要好, 但是 Duron的较少的64KB L2 cache导致了在数据大量读取的时候落败。
当数据矩阵的大小超过了处理器L2 caches的容量后,性能表现就只受限于系统主存的有效带宽了。
Business Winstone
The Celeron 1.7GHz 在此项测试中落到了最后, 即使是Duron 1.3GHz也把他落得很远. 而Pentium 4 1.7A 在这里的强势表现强有力的证明了额外的L2 cache 在 Business Winstone的重要性. 因为归入此项测试中都是我们平时经常使用的软件应用,这就是我们平常为什么感觉Celeron 1.7GHz 不过如此的原因。
Content Creation Winstone
I这次在 Content Creation Winstone 的测试中 Celeron 1.7GHz 再次名落孙山, 而且和Duron 1.3GHz 还有相当的差距。Pentium 4 1.7A的良好表现再次证明了更大的 cache 在Pentium 4netbust 构架中的重要性。
多媒体应用看来还是Pentium 4 平台的传统强项,但是Celeron 1.7GHz和 Celeron 1.7A的差距也是有目共睹的。
3DMark 2001SE
Celeron 1.7GHz 在 3DMark 2001SE里又表现正常了, 不过这次和Duron 1.3GHz只有略微的差距。
Codecreatures
Codecreatures 性能表现的主要决定与显卡的性能,所以几个处理器的表现几乎没有差别。
Quake III Arena
C eleron 1.7GHz 与AMD Duron 1.3GHz 在Q3A里的表现可以说是不相上下。
Serious Sam SE
Serious Sam SE 给了 Celeron 1.7GHz 很大打击, 再次归位第三名。
Comanche 4
这一回合, Pentium 4 1.7A的分值几乎是 Celeron 1.7GHz的两倍, 连 Duron 1.3GHz也能把它落得很远.
LAME MP3编码
Celeron 1.7GHz 在使用 LAME 对60MB WAV 的文件进行编码时速度也是最慢, 但是各个处理器之间的时间也相差不多.
Xmpeg DivX 编码
对媒体文件进行编码,不管是音频还是视频,对于cpu来说都是一个繁重的任务。现在 可擦写的DVD 驱动器使得家庭视频编辑成为可能,这种应用也竟越来越广泛。
令我们感到惊奇的是Intel的处理器再进行DivX 编码时全面败北, 想当初这可是它的强项啊。Duron 1.3GHz 以很大的优势获得了冠军,击败了经过我们降频处理的Northwood Pentium 4. Celeron 1.7GHz和 Pentium 4 1.7A相似的分数分数也说明了在此类大数据量处理的应用中, L2 cache容量大小并没什么关系.
picCOLOR 图形处理
数码相机和扫描仪的价格急剧下降使得在主流PC上进行图像处理的潜在用户越来越多。我们使用了F picCOLOR NT 通过它的处理过程进行基准测试。
Celeron 1.7GHz 和Pentium 4 1.7GHz 在 picCOLOR中的表现几乎没有差别, 测试成绩在Duron 1.3GHz和 Pentium 4系列的处理器中出现了明显的差别. 最终Pentium 4系列的产品以领先的优势获胜。
POV-Ray渲染
在两组 POV-Ray测试场景中 ,Celeron 1.7GHz 都垫了底. 借助额外的cache 的帮助, 尤其是在 "glasschess" 场景中, Pentium 4 1.7A 拔得头筹.
SPECviewperf
在此方面Duron 1.3GHz 一贯都要比 Pentium 4构架的处理器表现得好,特别是 "dx" 测试.
语音识别
我们想语音识别技术会成为下一个主流桌面系统的热点,一般可以用于email 和文字处理。这也是我们主流 PC 用户最常用到的两个应用。
在Sphinx测试中说明,今天我们测试的处理器每一款能够适用于实时语音识别应用,但是 Celeron 1.7GHz 至少击败了 Duron 1.3GHz。
科学计算
这是我们平时不大用上的,进行专业的复杂数值运算的处理。
这次 Celeron 1.7GHz 再次落到了最后。Duron 1.3GHz I表现的强劲无比。
超频潜力
Intel 现在已经养成了用较低的主频和前端总线区分高端和低端处理器的习惯。所以我们只好利用超频来解决我们金钱和性能的心理平衡。 Willamette'系列 0.18-微米制程的处理器最高主频为2GHz, 我们现在就来尝试来压榨Celeron 1.7GHz的潜在能力。
在测试中我们能使Celeron 1.7GHz达到125MHz 的前端总线,也就是主频达到了f 2.125GHz, 并且稳定的运行了几个小时,我们看来400MHz 的前端总线是非常适合作超频的。
我们的成功并不意味着每一个Celeron 1.7GHz 都能超越2GHz, 这主要是选择的问题,我们回来会对超频性能较好的处理器编号进行整理,以供大家参考的。现在的1.7GHz在超频中遇到的最大问题是0.18-微米的制程和 1.75V的工作电压,我们现在十分期待 0.13-微米的Celeron快点到来,那一定是一款超频的极品。
结论
在我们看来,只花450原人民币的Duron 1.3GHz 要比675块的Celeron 1.7GHz 更有性价比. 两百多元的价钱也许在整个系统中算不了什么,但是我们要知道,Socket A 的主板产品通常也要比支持478-针 socket 平台要便宜,这样就可以省下一笔钱在其他方面考虑了,也许一台刻录机就这样出来了。
我们对模拟出来的 Pentium 4 1.7A的性能表现留下深刻的印象。但我们不会指望INTEL会在近期的Celeron 上配备512KB L2. 可能的推测是Intel 在0.13 微米版本的Celeron 中加入256K L2 cache. 这将是一款值得我们期待的产品。当然,如果你不愿意再等待下去了,我们的基准测试显示得很清楚: AMD的Duron 1.3GHz 在价格和性能方面都是首选。
|