极米科技2016销售额:请问非线性流水线的特点和预约表的特点是什么,谢谢

来源:百度文库 编辑:杭州交通信息网 时间:2024/05/01 23:39:11
系统结构的问题(请问非线性流水线的特点和预约表的特点是什么,谢谢~~~~~~~~~~~~~~~)

流水线(pipeline)是 Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高了CPU的运算速度。超流水线是指某型 CPU内部的流水线超过通常的5~6步以上,例如Pentium pro的流水线就长达14步。将流水线设计的步(级)数越多,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。
  如今Intel每次发布新处理器产品的时候,我们都有必要对处理器流水线的问题加以说明,以解释为什么3GHz的P4会在性能上和2GHz的Athlon差不多。Prescott的流水线管长度比Northwood长了近55%,这让我们老调重弹。

  处理器的流水线好比汽车生产车间里的装配线。但CPU的流水线并不是物理意义上的,数据也并不是从一端进入,另一端输出。实际上它是一个指令处理的步骤集合,每一条指令必须经过相同的步骤,我们把它们称为级数。流水线的级数给指令指明方向,告诉它们下面是进行加操作,还是存储数据,并且给出地址。

  最基本的CPU流水线分成5级,如果将每一步细化便可以扩展到10级。流水线必须实现相同的目标:引入指令,输出结果,但级数的不同会让效率发生变化。5级流水线每一步花费的工作量要比十级流水线更大。如果其他保持不变,那么我会选择5级流水线,因为实现5级数据处理更加容易,如果每一级不能保持全速运算,那CPU的效率会大大下降。

  选择更多流水线的理由是,如果每一级的处理过程更简单,那处理的速度会加快。最复杂的那一级会是整个运算中最慢的一环,它将决定整体的运行速度。

  如果我们假设5级流水线的每一级都要花费1ns来完成,每一级运算的周期为一个时钟频率,那么我们得到了1GHz的处理速度。当我们增加线管级数时,这时很难保证每一级都全速运行,我们必须通过缩短每一级运算的周期来进行弥补。庆幸的是,由于每个时钟频率的工作量减少了,我们能有效缩短周期,在后者的设计中,时钟周期可以缩短到0.5ns。

  十级流水线实现了2GHz的运行频率,它是前者运行频率的两倍。如果我们假定每一级流水线都全速工作,那么它的性能也将是前者的两倍。但现实是,流水线不可能每刻都处于满负荷状态,因此市场上的2GHz CPU不可能有1GHz CPU两倍的性能。

  几年前,1.4和1.5GHz Pentium 4处理器将流水线有PIII的10级提高到了20级,令人难堪的是,1.5GHz Pentium 4在性能上不能完胜1 GHz Pentium III,有些应用中甚至不如后者。直到今天,你依然不能简单的认为Pentium 4 2.4C的性能会超出PentiumIII 1GHz两倍之多,我们前面的论述已经给出的一定的解释。

  0.13微米制程的Northwood核心的最高频率是3.6 - 3.8GHz。当转入90nm制造工艺后,Prescott的功耗将降低,同时核心频率也会更高,但这一切只是Intel的一厢情愿。当Intel转向90nm制程时,他们将Prescott的微架构也进行了改动,将它的整数流水线增加到了31级。考虑到最初的流水线解码级数,这样整个流水线管长度甚至会超出31级。

  增加流水线线管的直接好处是:提升运行频率。在一年前的IDF论坛上,Intel曾指出Prescott的频率可以上到4GHz-5GHz,如今Prescott越来越长流水线管正给出了最好的注解。

  线管长度的增加向Intel提出了挑战,Prescott在每个时钟频率上的运行效率肯定会比Northwood慢。要指出的是,一直到Pentium 4的频率提升至2.4GHz,Intel才在性能上赶上了流水线管更短的Athlon XP。现在Intel又一次面对压力,如果3.4GHz Prescott性能赶不上2.4GHz Northwood,Pentium 4的招牌会再一次黯然失色。

  下面介绍的几项技术改进让Prescott在性能上至少不输于同频Northwood,如果不是这样,Prescott恐怕会提前为Pentium 4划上句号。

  增加Prescott的流水线长度并不是一个容易下的决定,但是Intel的工程师觉得值得这么做。GPU的设计目前主要用硬件编译语言完成,而CPU几乎要靠手工设计。这解释了为什么区区几十级线管的P4能运行在GHz级别,而Radeon 9800 Pro只能运行在几百MHZ。如果花六个月周期象设计GPU那样来设计CPU,这几乎是不可能完成的任务。