|
新一代 "卡 皇" 降临
GeForce GTX 280/260的硬件规格
作为NVIDIA的最新一代图形核心, GT200在硬件规格方面又创下了空前的记录.
GT200使用台积电65nm工艺生产,集成多达14亿个晶体管,核心面积576平方毫米,是有史以来规模最庞大的图形芯片,之前的G80和G92分别只有6.90亿个和7.54亿个晶体管。 GeForce GTX 280将为玩家提供"无与伦比的游戏性能",毫无疑问它是面向最狂热的硬件发烧友和游戏玩家.GeForce GTX 280具有完整的240个流处理器,PCB板长10.5英寸,默认核心频率,流处理器频率和显存频率分别为 602MHz,1296MHz和1107MHz,采用1 GB GDDR3显存和 PCI-Express 2.0接口,显存位宽 512bit,显存带宽达到140.8GB/s.需要同时使用1个 6pin和1个 8pin外接电源接口供电,散热器双插槽设计,显卡热设计功耗(TDP)为236W.
在物理加速方面,GeForce GTX 280和GeForce GTX 260上市后,目前的驱动程序还不能提供物理加速功能,可能要等到第三季度 CUDA 2.0发布之后,支持 CUDA 2.0 的新驱动将具有该功能.
优化的节能设计.GT200 核心采用了"高级GPU节能技术",能根据显卡负载实时,动态的调节显卡时钟频率和电压,并且能关闭一部分当前未使用的晶体管,进一步降低功耗. GeForce GTX 280的待机功耗仅为25W.(GeForce 8800 Ultra的待机功耗在60W以上)

二合一架构:图形处理和并行计算
NVIDIA的第一代DirectX10核心G80采用的是第一代统一架构,将顶点着色器,像素着色器和几何着色器统一为流处理器,提高了着色器使用的灵活度和效率,随后的G92核心也沿用了这一架构.GT200核心则采用了全新的第二代统一架构,这套架构最大的特点是将图形处理和并行运算合而为一.
在GT200核心上,NVIDIA正式引入了较完整的并行计算功能.
1. 图形处理架构
在采用14亿个晶体管之后,GT200在流处理器数量和浮点运算性能上都达到了新的高度.完整的GT200核心具有240 个流处理器,浮点运算性能达到了 933GFLOPs.性比之下,采用G80核心的GeForce 8800 GTX只有128个流处理器,浮点运算性能也只有518GFLPOs.
GT200也是首款采用"NVIDIA PhysX"技术的图形核心,实现了单卡同时进行图形计算和物理加速,并在两项任务之间做到工作量的动态平衡.
受益于GT200核心强大的浮点运算性能和物理加速技术,可以营造一个更接近"真实"的虚拟世界.如果说G80,G92核心带来了动画CG般质量的静态画面,那么GT200核心就是让游戏进入了动态,实时的动画CG时代,把静态逼真进化到了动态逼真.
2.并行计算架构
从GT200核心开始,图形核心具有了真正的并行计算能力,将在图形处理任务之外的广阔的通用计算领域发挥重要的作用.为此 NVIDIA 在一年前就面向通用计算发布了 CUDA 技术.该技术是当今世界上唯一专门针对 NVIDIA GPU 的 C 语言开发环境,开发人员能够通过它来使用 NVIDIA GPU 攻克极其复杂的密集型计算难题.
在硬件方面,GeForce 显卡,Quadro 显卡和 Tesla平台均支持 CUDA,显卡在并行架构,轻量化线程,数据带宽和效率上都非常适合并行运算.在软件方面, CUDA 在应用层采用 C 语言和Fortran 语言,并提供了大量的指令集,绝大多数程序员在经过简单培训之后就能迅速掌握 CUDA 的程序编写,应用软件的转换成本较低.
从发展趋势上来看,今后显卡的应用将大大超出游戏领域,成为并行计算任务不可或缺的硬件配置.
NVIDIA官方白皮书---GT200架构技术信息
http://www.nvidia.com/object/io_1213615494642.html |