<P>渲染后端单元(Render Back End)</P>
<P></P>
<P>其实Render Back End就是相当于NVIDIA所说的ROP(光栅操作处理器),均支持FP16帧缓存混合,不过和NVIDIA的GeForce 6/7不同的是,X1000的Render back end在执行FP16的时候还能够做多取样抗锯齿,而这是目前NVIDIA的产品所不具备的。</P>
<P>不过需要注意的是,目前的DirectX9.0c并不支持对浮点Render Target做多取样抗锯齿,因此除非DirectX9升级,否则这个特性可能无法在D3D游戏中使用。不过在OpenGL中,这个特性将完全可以实现。</P>
<P>RADEON X1800拥有16个render back end,而X1600和X1300的Render Back End都只有4个,不过RADEON X1600的Z compare单元是8个,而X1300只有4个,在进行Z/Stencil操作的时候,X1600会比X1300快一倍。</P>
<P>X1000系都支持色彩缓存压缩,以提高多取样抗锯齿时后的性能,相比之下,NVIDIA目前的GeForce 6200系列都缺乏色彩缓存压缩而只在GeForce 6600以上的产品支持。</P>
<P>双向内存读取环路与写入交叉闩</P>
<P>而在RADEON X1000系上,ATI重新起用了32位内存控制器,在RADEON X1800上,有8个32bit内存控制器,内存带宽使用效率恢复到接近GeForce 3时代的水准。</P>
<P>RADEON X1800支持DDR2、GDDR3、GDDR4内存,而第一波产品发布中最高端的RADEON X1800XT采用的是三星的K4J52324QC-BJ12 GDDR3内存颗粒,设定的内存时钟频率为750MHz(等效1500MT/s)。</P>
<P>为了充分利用高速内存的优势,ATI给RADEON X1000系设计了一个新式的环网总线架构。</P>
<P>这个环网设计前提思路是:随着GPU越来越复杂,内部需要连接到内存控制器的处理单元越来越多,如果继续维持完全采用Crossbar的设计,这些连接路由控制将会变得非常复杂,并且信号布线会越来越长和复杂。</P>
<P>更长的布线会导致延迟增加,而复杂的路由会由于线路之间的串音而降低信号品质,此外由于布线延长增加的阻抗,GPU的发热和耗电也会有所增加,这些因素都会导致难以提升GPU的时钟频率。</P>
<P></P>
<P>上图就是ATI RADEON X1800的环网拓扑图,红色的就是两条双向个256位的环路,负责把内存中的资料交付给贴图单元、顶点着色器等单元(这些对象ATI称作是内存客户端),而资料的写入操作则依然会被路由到Crossbar上来实现。</P>
<P>根据ATI的介绍,采用了这样的环路读取、Crossbar写入的设计后,内存总线的频率可以比以前的产品提高一倍,使得X1000系可以充分利用先进的内存技术。</P>
<P>此外ATI还提到,X1000系的内存仲裁器能够由驱动程序控制,可以透过驱动程序的CATALYST A.I(智能参数设定),为特定的应用程序设定仲裁优先次序,让内存控制器优先处理最迫切、对性能影响最大的数据请求。</P>
[此贴子已经被作者于2005-10-5 23:54:04编辑过]
|