原子时代来临-Intel革命性Atom透析
Intel发布全新的超低功耗处理器品牌“Atom(原子)”…… (14028 字)
| 第6页:执行单元与低功耗下的长流水线 |
执行单元
Atom并不是一款超宽处理器,顺序执行的前端跟缺乏内置内存控制器决定了其有限的指令吞吐能力,再加上数据间的相互关联性致使大量的执行单元只能是闲着空等,因此Atom的设计师们在执行单元的设计上只求达标就好。
Atom没有专用的整数乘法器或除法器,这些运算都由SIMD浮点单元来完成。Atom核心装配有两个SSE单元,其排序器的两个口可以在一个时钟内各发送一个浮点或整数SIMD操作。除了支持全精度整数SIMD和单精度FP ADD外,所有单元均为64bit宽。
用长流水线捍卫能耗?
Atom具备16级流水线,其分支预测失误的惩罚为13级。注重低功耗的Atom,流水线居然比酷睿2的14级还要长,这的确让人吃惊。
更长的流水线通常意味著更高的功耗,特别是有臭名昭著的功耗王“笨死”做为前车之鉴。但这次Intel给了我们下面三个采用长流水线的理由:
对于奥斯丁小组来说,只要能够降低功耗,即使是用高延迟去换取功耗他们也同样乐意。为了尽量降低能耗,Atom只在缓存控制器对cache命中率有把握的时候才去访问缓存,但这样一来每次访问就会产生长时间的延迟;为了让时钟频率足够高,就必须加深缓存访问的流水线,另外Atom采用物理地址标记代替虚拟地址标记,因为后者的能耗太高。
再者,Atom在解码流水线同样用延迟换取低功耗,还记得我们前面介绍的解码器一慢一快两个通道吗?较慢的通道延迟高但能保证指令被正确编译,增加的延迟迫使Atom的在解码时需要三级流水线而不是两级。最后,SMT所采用的一些算法也使流水线长度增加了一两级,所有这些加起来就使得原本设计简单的核心却具备如此深的流水线,当然这样的长流水线设计完全是为了降低功耗以及保证核心能够跑在足够高的频率上(Atom只是一个双指令并发的简单核心,它需要高频率来保证足够的性能),根本不是NetBurst的失败设计所能够相提并论的。
| 《不协调的缓存与Sea-of-FUBs设计》...继续下一页>> [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [上一页] [下一页] |
| 《原子时代来临-Intel革命性Atom透析》分页索引 |
|