OCER评测组第二波——N卡评测员招募公告 | | 年终优秀超频主板大点评 | | 游戏装备进化论
FOXCONN Flaming Blade GTI平价款登场 | | 敢问路在何方 主板技术发展与展望! | | Core 2 Duo E7500搭配DFI BI-P45超频效能教学
华硕P55主板全球抢先订购 | | X-Star王者之星——华硕主板“共赢巅峰”系列活动大型专题 | | MSI X-Slim X600独显版深度解析
返回列表 发帖

决战千元市场,XFX 9600GT单挑AMD HD3870 DDR4


NVIDIA与AMD新一代显卡都已发布之际,前一代王者便退居中高端性价比首选之列,AMD HD3870与NVIDIA GeForce 9600GT都成了定位相近的千元以下首选,那么究竟谁优势更为明显,更适合主流用户选购呢,本文就将这两者做了详尽的对比供您参考。更多内容请到超频网玩家论坛相应专区进行讨论!

NVIDIA GeForce 9600GT简介


2008年2月14日跳票后没多久NVIDIA就发布了其颠覆性的中端卡GeForce
9600GT,其凭借强劲的性能和较高的规格在千元市场称王。随着新一代
产品的到来,GeForce 9600GT也已退居千元以下,成了最有C/P值产品。



GeForce 9600 GT采用的GPU代号为G94,拥有4个纹理处理器集簇(TPC),
每个TPC内部有两个流处理多处理器簇以及8个纹理定制处理器(TA)、8个
纹理拾取器(TF),每个流处理多处理簇内包含有8个流处理器(SP),整个
G94有64SP、32个TA、32个TF,在TPC规模上,G94可以看作是G92的一半。


  在ROP(Raster Operon Processor光栅操作处理器)单元的算法中GeForce 9600GT进行了改进,高分辨率下提升了压缩覆盖性能。另外通过光栅处理器的规模对比我们可以看出,Radeon HD 3870是8个Render Back End对应256Bit位宽,而GeForce 9600GT是16个ROP对应256Bit位宽,可以预见GeForce 9600GT在高分辨率及抗锯齿模式下将大幅领先于Radeon HD 3870。在高分辨率高画质游戏大量涌现的今天,后者恐将在这一轮激烈角逐中被慢慢淘汰!GeForce 9600GT显卡采用的全新ROP单元,支持新一代透明抗锯齿(Transparency AA),官方宣称相当于8xAA的速度12xAA的效果。 在内存界面方面,G94拥有和G92一样的规模:4个64位(共计256位)内存控制器、16个光栅处理器(ROP)矩阵,在这方面G94与G92是完全一致的设计。更强大的内存规格可以使它在高分辨率AA、AF环境下获得更好的性能,这也正是广大用户看好这一代中端卡的缘由所在!


早在G92时期,NVIDIA就为了加强纹理的运算能力,将原来的2组Shader阵列对应
的8个纹理过滤单元增加到了16个,与纹理寻址单元相同。而到了G94时期,为了
和Shader性能提升匹配,GeForce 9600GT纹理引擎内建双寻址能力,每时钟周期
可进行8次双线性寻址计算,8个纹理过滤计算。这些关键性因素都决定了G94在
流处理器数量落后G92核心的8800GS/8800GT很多的情况下性能却不会等比例损失!






NVIDIA GeForce 9600GT依然不支持DirectX 10.1规范!虽然Windows Vista SP1已经发布,但DirectX 10.1显然没能得到NVIDIA的支持,也就是说DirectX 10.1可能会如当年的那DirectX 8.1一样无法普及而失去实际意义。另外根据NVIDIA表示,虽然G9X和G8X系列没有明确支持DirectX 10.1,但是实际上除了其中一项以外其余G9X和G8X都可以提供支持。



  尽管如此,PCI-E 2.0、Display Port、HDMI、HDCP等在GeForce 9600GT上都得到了支持,Display Port规格那10.8Gb/s的传输带宽是HDMI 1.3规范所不能比拟的。另外最重要的是Display Port是免费的,因此Display Port得到了诸如Intel、NVIDIA、AMD等硬件厂商的支持,不过HDMI接口在家电领域已经得到广大家电厂商的支持,付费的公司早已不再少数,所以Display Port接口能否接替HDMI目前来看仍不明了。这对消费者来说其实并非是一件好事,因为厂商间的差异化竞争往往会导致用户的投资难以实现最大化回报,只有规格支持尽可能全面的产品才能避免更多尴尬从而逐渐被消费者接受!

TOP

AMD-ATi HD3870简介

  RV670是AMD-ATi于2007年11月16日发布的DX10系列显卡,它前瞻性的支持了微软即将发布的DirectX 10.1规范,还是全球首款采用55nm制作工艺的显示核心。在整个DX10市场上,它的发布具有更为深层的意义,基于RV670核心的Radeon HD 3870/3850显卡。

AMD-ATi HD3870显卡与其竞争对手相比最大的优势某过于支持DX10.1特效。


  正如以前的DX版本一样,DX10.1也是DX10的超集,因此它将支持DirectX 10的所有功能,同时它将支持更多的功能,提供更高的性能。

  DX10.1的一个主要提高是改善的Shader资源存取功能,在多样本AA时,在读取样本时有更好的控制能力。除此之外,DX10.1还将可以创建定制的下行采样滤波器。DX10.1还将有更新的浮点混合功能,对于渲染目标更有针对性,对于渲染目标混合将有新的格式,渲染目标可以实现独立的各自混合。阴影功能一直是游戏的重要特效,Direct3D 10.1 的阴影滤波功能也将有所提高,从而可望进一步提高画质。

  在性能方面,DirectX 10.1将支持多核系统有更高的性能。而在渲染,反射和散射时,Direct3D 10.1将减少对API的调用次数,从而将获得不错的性能提升。

  其他方面,DX10.1的提高也不少,包括32bit浮点滤波,可以提高渲染精确度,改善HDR渲染的画质。完全的抗锯齿应用程序控制也将是DX10.1的亮点,应用程序将可以控制多重采样和超级采样的使用,并选择在特定场景出现的采样模板。DX10.1将至少需要单像素四采样。

  DX10.1还将引入更新的驱动模型,WDDM 2.1。与DX10的WDDM2.0相比,2.1有一些显著的提高。首先是更多的内容转换功能,WDDM2.0支持处理一个命令或三角形后进行内容转换,而WDDM2.1则可以让内容转换即时进行。由于GPU同时要并行处理多个线程,因此内容转换的即时性不仅可以保证转换质量,还可以提升GPU效率,减少等待时间。另外,由于WDDM 2.1支持基于过程的虚拟内存分配,处理GPU和驱动页面错误的方式也更为成熟。


  在3D效能方面我们应用的更多是BenchMark和游戏,而一款显卡的实际游戏效能如何也正是这两点最为重要。前面提到了关于DX10.1的一些新特性,但NVIDIA直至目前最新的产品也未加入DX10.1的支持,这不得不说是一个遗憾。同样的,例如3DMark这样的测试软件也为了测试的“公平”而做出了一些取舍。虽然我们知道DX10.1只是DX10的一个超集而已,不过还是希望新标准能尽快和谐起来,让广大用户受益。

  如今基于RV770核心的HD4870/HD485O已经发布,而上一代王卡HD3870则退居中高端,成为了千元以下最有性价比产品之一,不过降价必缩水是永恒不便的道理,公版卡会越来越少,通路品牌首当其冲的开打价格战。在乱世中称英雄的只有强者,避免了公版那缺乏个性没有明显优缺点的平庸,也逃离了同质化通路产品那样只顾成本的无奈。

TOP

文字游戏:此SP非彼SP!



  看到这里可能很多玩家要问,用GeForce 9600GT单挑AMD-ATi HD3870,这简直就是SP64与SP320的较量?!其实NVIDIA SP单元的全称是“Stream Processing”,AMD的SP单元全称则是“Shader Processing”,而“Stream Processing”与“Shader Processing”是两个完全不同的概念。



  AMD的每个“Stream Processing Units”都包含有5个 “Shader Processing”分支器,因此在“SP”数量上等于增加了4倍。但“Shader Processing”并不是一个完整的统一渲染单元,因此,AMD显卡真正的SP单元“Stream Processing Units”比规格表中的要少得多,HD3850/3870在规格表中的SP单元有320个,不过HD3870真正的“Stream Processing Units”是64个。

  同样的道理,NVIDIA的每个“Stream Processing”集簇,也包含5个分支预测器,如果按照AMD的“SP”来定议NVIDIA的“SP”数量,则是640个“SP”。所以,即便从规格上来看,NVIDIA的GPU效能也要好一些,当然,这还不包括NVIDIA GPU超标量与独立ROP单元所带来的效能提升。

  换句话说,9600GT 64个SP与3850的320个“SP”数量其实是完全相同的,所以用户朋友们不要被RV670拥有更多联合渲染管线的假像所迷惑,更不要认为SP数量多就一定效能高。




  另外值得一提的是,最近关于NVIDIA“神油”驱动的讨论也沸沸扬扬,很多玩家通过修改来破解了原本只有顶级卡才能享受的物理加速,而3DMark VANTAGE得分也随之猛涨。NVIDIA宣称在日后还将逐一提供整个GeForce 8、9系及之后发布的新品相关物理加速驱动,这不得不说是一个惊喜。

TOP

高清及DirectX 10.1

  相对于前辈GeForce 8800GT,GeForce 9600GT在高清视频的支持上更加完善。除了支持最新的动态对比度增强和蓝绿色、肤色增强外,GeForce 9600GT还标配了完善的HDMI输出转接方案,可以实现以一张显卡同时输出视频+音频的完整数字信号,这在HTPC越来越受重视的中高端装机市场上显然更具竞争力。

  值得一提的是,在GeForce 9600GT中,NVIDIA特意加入了双流解码加速(Dual Stream Decode Acceleration)单元在PureVideo HD中,从而实现双视频流硬件解码。这样我们就可以在CPU占有率没有显著提升的情况下打开画中画功能了,喜欢高清的用户对这一点尤为关注!

近几年来由于大屏幕LCD与存储产品价格逐渐走低,大容量硬盘在选购时点名率
不断提升,因此用户对于各类高清视频的需求也日益增长,甚至有网友放言看过
高清后再也无法接受普通高压缩格式的片子那凄惨的画质了。显卡厂商已察觉出
时机成熟,便在GPU高清硬解码上下足了功夫,当然最终受益的还是广大消费者。


  H.264:


  H.264是一种高性能的视频编解码技术。不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。它最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25∶1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102∶1!H.264为什么有那么高的压缩比?低码率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。

  VC-1:


  VC-1(Video Codec 1)是由电影电视工程师协会(Society of Motion Picture and Television Engineers; SMPTE)所提出的视讯压缩标准,其技术基础来自微软公司的Windows Media Video-9(WMV-9),VC-1标准预计于2004年12月正式定案,届时工研院光电所的FVD(Forward Versatile Disc)、DVD论坛的HD、DVD、以及蓝光光盘协会的BD-ROM…等,都将采用VC-1做为影片压缩的格式。VC-1的压缩效能与H.264旗鼓相当,但复杂度约只有H.264的50%,其最大特色是提供与影片编辑特效相呼应的编码工具,并且针对高位率的位串流(bitstream)有特别的编码符号表,使得VC-1在高分辨率影片压缩的应用上,尤其是对特效电影有很杰出的效能表现。微软公司早在2002年就推出了Windows Media Video 9系列编解码器,实现了视频压缩效率的显著提高。WMV9另外还作为VC-1在SMPTE中实现了标准化。当然了,VC-1纯粹是一种视频压缩算法,并没有WMV中数字版权管理、元数据、播放列表和用户接口这些元素。VC-1多为“.wmv”后缀,但这都不是绝对的,具体的编码格式还是要通过软件来查询。总的来说,从压缩比上来看,H.264的压缩比率更高一些,也就是同样的视频,通过H.264编码算法压出来的视频容量要比VC-1的更小,但是VC-1格式的视频在解码计算方面则更小一些,一般通过高性能的CPU就可以很流畅的观看高清视频。相信这也是目前NVIDIA GeForce 8/9系列显卡不能完全解码VC-1视频的主要原因。

  720P、1080P、1080I:


  720/1080指的是分辨率1280×720与1920×1080,那I和P分别是什么意思呢?I代表Interlace,隔行扫描;P是Progressive,逐行扫描。720P与1080I的带宽是一样的,在清晰度自然是1080I高一些,但在动态画面表现得更流畅的则是720P。而1080P则兼顾了清晰度以及动态表现的要求,也就是大家所说的FULL HD,但它也是对码率、存储空间要求最高的格式。

  DirectX 10.1:





微软DirectX 10引入了统一着色架构的概念,而DirectX 10.1则在此基础上完成了又一次升级进化,修正了DirectX 10制定之初尚未解决的一些问题。作为Windowa VISTA的组件与SP1同时发布。DirectX 10.1拥有Directx 10的全部架构及编程模式,同时对顶点着色、几何着色、像素着色指令集提升到Shader Model 4.1。DirectX 10.1增加的诸多新功能可以分为纹理与着色增强、反锯齿增强和强制规格三大部分。但纵使DirectX 10.1规格更加强大且新特性实用性很强,NVIDIA还是决定新发布的整个9系列均只支持到DirectX 10。


近几年来由于大屏幕LCD与存储产品价格逐渐走低,大容量硬盘在选购时点名率
不断提升,因此用户对于各类高清视频的需求也日益增长,甚至有网友放言看过
高清后再也无法接受普通高压缩格式的片子那凄惨的画质了。显卡厂商已察觉出
时机成熟,便在GPU高清硬解码上下足了功夫,当然最终受益的还是广大消费者!


  值得一提的是,在最新的GeForce 9600GT中,NVIDIA特意加入了双流解码加速(Dual Stream Decode Acceleration)单元在PureVideo HD中,从而实现双视频流硬件解码。这样我们就可以在CPU占有率没有显著提升的情况下打开画中画功能了,喜欢高清的用户对这一点尤为关注!

TOP

XFX 9600GT产品介绍


XFX讯景9600GT显卡包装一改往日彪悍狼人面目,强劲粗犷的9系风格与枪械游戏
完美结合的动感外形设计,非常迎合游戏玩家喜好,且采用了抗震设计内部填充
厚厚的防震缓冲层,最大限度去抵抗某些物流公司的暴力快递人员对产品的摧残。




在随卡的附件方面讯景提供了常规的说明书、质保卡、驱动光盘及两个DVItoVGA、一
个DVItoHDMI转接器、HDMI音频一线通输出线、S端子R、G、B分量线还有双4Pin的D型
口转显卡6Pin供电线等,当然也少不了附赠产品包装上提到的正版游戏英雄连安装盘。




显卡采用XFX讯景071228自主研发PCB板制作,8 PCB Layers,三相供电及非公版散热
设计。GPU采用G94-300-A1显示核心,台积电65nm工艺制程,拥有64个流处理器且支持
DirectX 10、Shader Moder 4.0和OpenGL 2.1技术,支持PureVideo HD 2技术,内建
VP2视频引擎,并支持VC-1、DXVA-C级解码和H.264的硬件解码。显卡拥有512MB/256bit
的显存规格,默认频率达到740MHz/2000MHz,是一款大幅超越公版频率的超频版显卡。




显卡背面的元件可以看到核心两相供电中每相各省略一枚MosFET,而其它元件完整。




摘掉散热器后可以看到显卡正面的供电元件及芯片全貌。GeForce 9600GT采
用如8800GT的环形显存设计,显存这样排列的益处是可以尽量保证每条显存
信号线的长度尽量等同,使信号更为稳定,与大量采用蛇形走线有异曲同工
之妙。GeForce 9600GT核心与PCB成45°和环形显存一样为保证信号的等同性。




正面的这张特写是为了体现那经典的“高科技金属条”,其它很多显卡厂商也经常效仿
讯景的这一举措,防止PCB板因为散热器压力过大而发生形变。靠近SLi接口附近的加固
条已经“开了口”,但是由于这里还有个音频转接口,因此高科技金属条开口比较夸张!

TOP

显卡供电设计分析




该卡的三相供电为2+1设计,核心两相加显存一相,供电元件整齐排列在显卡的右侧。
在供电元件的选用方面十分考究,下料有其针对性。Rubycon电容特点是响应速度快,
适合用于开关电路的上桥电路部分;Chimicon电容特点是耐压值很高,适合用在输入
滤波电路部分;Sanyo电容特点是精度很高,最适合用在开关电路的下桥电路。除此
之外,开关电路并非输出完美的直流电,而会周期性的小幅波动。XFX讯景对此特意
优化了电路,能够尽可能的保持输出电流及电压趋近于一条直线,这样不仅可以降低
电能损耗,更能保证显卡的工作稳定,使超频性能大幅度提升,且延长芯片使用寿命。



核心供电选用了全日系电容设计(三洋+日本化工),并且搭配了全封闭电感及低内阻
Infineon(英飞凌)MosFET,16V 330μF的日本化工输入滤波电容、2.5V 1500μF的三洋
输出滤波电容也都采用了贴片式底座工艺,优质的料件配合良好的做工铸成完美产品。



显存供电采用单相设计,其中有1.1微亨的密闭防磁电感搭配低阻MOS与固态电容组成。



虽然是非公版设计,但依然提供了6Pin未接入报警蜂鸣器,讯景还通过了温度监控方面
加入了对于高温后的报警,蜂鸣器在正常使用情况下报警您就要查看是不是风扇停转了。



供电区域背部PCB的元件有所取舍,省略几枚MosFET和一部分冗余的贴片式阻容元件。
显卡在LayOUT时为这些元件留有焊位,但由于实际测试时元件的有无并未影响实际
产品效能与稳定性表现,因此最终出货时加以省略,属于合理CostDown(缩水)范围。

  降价带来的往往是利润的流失,这对于企业来说无疑是个损失,为此为了能在一定程度上最大挽回损失,有的厂商会改变策略,将销售重点转向利润更高、市场空间更大的产品,而也不排除有些厂家为最大地获得利润而对产品结构和用料等方面做出变动,也就是我们平常所说的偷工减料,压缩成本。但有些上市就缩水的部分应该说不是为了降价后挽回成本而做出的,属于合理缩水,大家应该理性对待。


核心旁有一枚贴片晶体振荡器,有了它,用户可以在搭配NVIDIA nForce Chipset主板上
通过提升PCI-E频率至125MHz左右以便自动超频提升显卡性能。在我们目前所掌握的资料
中得知,由于NVIDIA将GeForce 9600GT的核心频率与PCI-E频率进行了特殊的绑定,因此
GPU核心附件晶体振荡器触发的核心时钟频率容易被很多款检测软件误报,看似频率很低。



公版设计的低通滤波及修正补偿电路中规中矩,完整的料件值得肯定。
DVI插件选用了讯景特色的UV绿,由于搭配非公版散热器,因此PCB边
缘可以搭配印有“XFX”字样的“高科技金属条”,避免散热压垮PCB。



输出接口背面可以看到原本LayOUT时规划了VGA及HDMI。另外,音频方面
GeForce 9600GT显卡已集成SPDIF音频输入接口,配合厂商附带SPDIF线
和DVI-HDMI转接头可以轻易进行一线通输出,双DVI与S-VIDEO输出接口
既方便双屏输出也能转接以适合大多数用户的显示设备保证绝佳兼容性。

TOP

显卡芯片及散热介绍


散热器采用纯铜材质,4Pin PWM可调速风扇设计,待机状态十分安静。



来自EVERCOOL代工的涡轮扇(12V 0.38A),默认30%转速下静不可闻。



纯铜散热器由一整块铜底加上反复折回的纯铜鳍片通过焊接形式结合。



通过用游标卡尺实际测量核心Die我们可以看到其长宽分别约为1.5CM×1.6CM。







  XFX GeForce 9600GT显卡选用了口碑最好的(SAMSUNG K4J52324QE-BJ1A)三星显存芯片。其为64M×32bit规格,共8颗组成512M 256bit。在国内外很多论坛也有网友对其进行讨论,包括其默认频率下的最佳时序等,曾经饱尝Qimonda GDDR3显存高频花屏的用户看到三星BJ1A动不动高达2400MHz的超频频率不知是何感想!



  通常显卡散热器都是风冷设计,而受到其体积限制分为单槽及双槽散热版本,单槽散热最大的好处就是兼容性绝佳,在组建多卡并联时不必因为PCI-E 16X相邻过近而受阻,但缺点是效能方面很难让人满意。于是很多厂商都靠提升风扇转速来加快换热速度,殊不知这样做会使用户饱受噪音的侵袭。我们日常应用中很多时候只是低负载操作,无论CPU还是显卡都不必让散热器全力工作,只有高负载的测试软件或3D游戏才会导致温度骤增,这时智能的PWM调速设计就显得十分人性化了,上图中已经体现了人们在各种噪音条件下的直观感受,我想谁也不愿意平时上网或听音乐时也忍受来自机箱内各个部件散热系统传来的噪音吧!

TOP

核心尺寸及电压功耗测试对比

AMD HD3870核心尺寸实测:

通过用游标卡尺实际测量核心Die我们可以看到其长宽分别约为1.5CM×1.4CM。


  AMD HD3870 +12V轻载及满载功耗:

通过实际测量6Pin +12V电流得知其待机为0.9安培而满载运行时为4.6安培。


  AMD HD3870显示核心及显存电压:

通过实际测量电压得知其核心电压为1.274V而显存电压为2.045V。


  XFX GeForce 9600GT核心尺寸实测:

通过用游标卡尺实际测量核心Die我们可以看到其长宽分别约为1.5CM×1.6CM。


  XFX GeForce 9600GT +12V轻载及满载功耗:

通过实际测量6Pin +12V电流得知其待机为1.5安培而满载运行时为4.8安培。


  XFX GeForce 9600GT显示核心及显存电压:

通过实际测量电压得知其核心电压为1.163V而显存电压为1.913V。


  通过对AMD HD3870与XFX 9600GT的实际测试对比,我们可以看出在工艺上更为先进采用台积电55nm制程的RV670的确可以很好的控制显示核心体积,而基于G94核心的NVIDIA 9600GT则采用台积电65nm工艺制程,核心Die表面积比RV670稍大一些。

  更先进的工艺制程通常意味着更低的电压或更低的功耗,事实是否如此,我们也可以通过实际测量两款显卡的核心、显存电压值及+12V辅助供电电流来判断。这里不得不说,在待机状态下,显示核心轻载条件时AMD显卡的节能技术发挥了很大优势,从不装驱动时的1.8安培降低到了0.9安培,整整低了一倍,而这些也正是其低负载模式下会大幅度自动降低核心频率所换回的。N卡在这方面稍差一些,安装驱动后仅从1.6安培降低到1.5安培,别忘了HD3870的核心及显存电压还都高于GeForce 9600GT不少呢!

TOP

测试项目简介



  在本次测试中我们选用了45nm主流Intel处理器Xeon 3110,将其超频到4GHz(450MHz×9);内存1:1同步运行在DDR2-900 5-5-5-15,SubTimings默认,容量总计4GB(1GB×4);而主板方面则选用了华硕最新的P45中端产品P5Q Pro,操作系统受限于测试条件必须搭配MicroSoft Windows VISTA SP1,所有驱动在各硬件厂商官网更新到最新,为了保证测试结果更具参考价值,我们并未屏蔽声卡、网卡及1394等设备。以下介绍测试项目:

  3DMark VANTAGE

3DMark Vantage是业界第一套专门基于微软DX10 API打造的综合性基准测试工具,
并能全面发挥多路显卡、多核心处理器的优势,能在当前和未来一段时间内满足
PC系统游戏性能测试需求。和3DMark05的DX9专用性质类似,3DMark Vantage是专
门为DX10显卡量身打造的,而且只能运行在Windows Vista SP1操作系统下。它包
括两个图形测试项目、两个处理器测试项目、六个特性测试项目。3DMark Vantage
的另一个全新特性是引入了四种不同等级的参数预设(Preset)。此前的3DMark在得
出最终结果的时候都只有一个简单的分数,而3DMark Vantage按照画质等级划分成
了四级:入门级(Entry,E)1024×768、性能级(Performance,P)1280×1024、高
端级(High,H)1680×1050和极限级(Extreme,X)1920×1200,得分表达方式也改
成了字母加数字的组合形式,从而更细致地反映系统性能等级,可以更对位、更公
平地进行比较。当然,不同等级之间的分数没有可比性。我们本次测试选用Extreme。


  《World in Conflict》(冲突世界)

《World in Conflict》(冲突世界)由知名游戏制作公司Massive Entertainment所
制作,标榜以Direct X10为标准进行画面设计,精湛的场景效果、特殊的游戏方式和
写实的兵种特色,马上就博得了广大的媒体与玩家目光,获得无数的奖项和各媒体所
打出满分的评价,最知名的包含在今年美国E3电玩展获选四项的「2007年最佳实时战
略游戏」奖项、「2007年度编辑十大最受期待游戏」、「最佳十大游戏」、「IGN十大
编辑最受期待游戏」等奖项,而美国游戏杂志权威PC GAMER也给予93分的肯定。所以
我们本次的游戏测试也加入了对其在最高分辨率下默认和全开两档画质的BenchMark。


  《Call of Juarez》(狂野西部)

《Call of Juarez》(狂野西部)是以美国的西部为背景的第一人称射击游戏。
它是Techland游戏公司开发的一款大家期盼已久的佳作,不过相对来看,它的
内容不同于老的情节,在此有很多新的改变。除了这些,本作在射击动作,游
戏画面等方面表现也十分突出。在作战区域显示方面上,Techland的画面表现
水平是相当出众的。根据实际比例,玩家们可以在此看到真实的3D画面效果。
图形设置完全可以调节到最高水平,也可以欣赏到迷人华丽演示。很明显,由
于本作采用的是真实比例,所有画面是很逼真的。纹理制作特别细腻满架可以
看到人物脸部的真实变化,也可以看到周围环境不断改变。比如在一个简单的
城镇中,能看到非常开阔的地带,随着视角的延伸,慢慢的步行穿过城镇街道,
画面会很快进行转换。Techland制作公司的物理运算功能非常准确,这一点可
以和《Half-Life 2》(半条命2)的制作水平相媲美,因此加入其测试是必要的。


  《Company of Heroes》(英雄连:抵抗前线)

《Company of Heroes》(英雄连:抵抗前线)是一套以第二次世界大战为题材
的即时战略游戏,而且使用了Relic公司的次世代‘Essence’引擎开发,并结合
了‘Havok’物理引擎技术,所以游戏画面表现非常惊人,不论细腻的战争场面、
逼真的光影效果、细腻的人物与武器的3D模组、各种爆炸火光烟雾效果等等,让
《Company of Heroes》在看到的第一眼就使人眼睛一亮。另外《英雄连》因为
使用了‘Havok’物理引擎,所以游戏中的每个作战单位不但有更为逼真的动态,
甚至连游戏中的所有建筑物场景都是可以破坏的,玩家别以为只是把作战单位躲
避到建筑物后方就不会受到伤害,因为建筑物一直受到攻击也是会损坏的,所以
玩家必须更妥善的调度小队战略计划,并依照当时的地形地物随时调整战略,否
则可是会吃大亏。这是华硕EAH3870附赠的一款DX10游戏,我们没理由不加入它。


  《Crysis》(孤岛危机)

《Crysis》(孤岛危机)是一款由Crytek出品的PC游戏,其DX10最高画质下的
画面水平已经在向电影化靠拢的路上迈出了一大步。由于采用了令人叹为观止
的先进技术,Crysis综合了令人栩栩如生的视觉效果、复杂多变的游戏场景和
恢弘壮丽的故事情节,玩家必须成功应对游戏中的各种艰难挑战才能最终生存
下来,可玩性极高。遗憾的是,其高配置要求导致90%以上的用户根本没机会体
验特效全开的《Crysis》画面效果,即使是目前顶级显卡也很难做到完全流畅。

  《专业街道赛(Need for Speed Pro Street)》

《专业街道赛(Need for Speed Pro Street)》是极品飞车系列的第十一款游戏,
与以往所有的极品飞车作品有所不同,游戏本身不但增加了大量的新要素之外,
在驾驶的手感方面也作出了调整,并且增加了全新的游戏模式,全新的游戏特征。

  测试方法:选游戏中一个固定赛道,使用Fraps软件记录跑一圈的平均值,共记录3次,取3次的平均值为最后所得帧数。
  测试分辨率:1920×1200@32bit分别测试默认及最高画质。

TOP

3DMark VANTAGE简介

  2008年4月28日,最强劲的3D性能评估软件3DMARK VANTAGE正式发布,从而揭开了PC技术在3D应用测试上的新篇章,相比以往的3DMARK 06测试软件,新版本对电脑性能有了更高的要求,特别是在3D特效方面提出了更苛刻的限制。然而在处理器已经迅速发展的今天,影响性能发挥得瓶颈就更多地集中在了显示芯片的优异程度上,3DMARK VANTAGE对于显卡应用技术和整体性能期盼值也在全面提升。


  为了更深入地了解3DMARK VANTAGE这项新型测试软件,首先我们有必要回顾下显卡的基本技术流程。我们知道16年前的电脑是没有GPU,更不会有3D API等一系列概念,显示卡仅仅是作为一个简单的转换器将CPU数据转换成显示器可识别的模拟信号并输出,没有加速能力,所有运算都在CPU中进行。


  12年前,我们的电脑已经有了GPU雏形、有专门的硬件负责图型处理,从而减轻了CPU的负担,提高了运行效率。但是3D API还没有统一规范,而游戏开发商也不需要直接对硬件进行操作。


  然而现在的电脑已经拥有3D API以及3D特效、纹理、流水、粒子等特效集合,程序员只需要调用3D API中相应的材质、纹理,设定光源的位置、强度,流水的深度、范围等等,而不需要通过程序代码来实现这些3D效果。

  而未来,我们相信我们的电脑显卡将不仅仅是普通意义上的GPU,还将集合PPU:PhysX等技术,这也将是未来游戏运行得一个最普遍最流行的流程。

  在显卡的发展历程中,我们经历了DX系列的飞速裂变,DX8,DX9乃至现在我们所说的DX10,也许未来还将有DX11等等,而我们所说的3DMARK Vantage测试软件正是基于真实地模拟DirectX10游戏执行的。如果说DX8还只停留在画面的整体勾勒上的话,那么DX9已经在更多细致处做了处理,以便还原更真实更贴近现实的游戏视觉效果,而在DX10中除在对图形显示的细微描画外,也已经越来越多地注重游戏的3D特效,力图为玩家呈现真实的场景与震撼的视觉技术。


  作为最新的3DMARK Vantage测试,它真实地模拟DirectX10游戏规范执行,在对系统配置上有着相对较高的要求,要求必须在Vista SP1系统下,使用DirectX 10级别显卡,必须拥有1G以上内存以及支持SSE2的P-D 3.2G或以上级别处理器下系统才能运行。为了检验目前市面上最主流的中高端显卡在3DMARK VANTAGE中的表现,我们特别选取了NVIDIA最有代表性的XFX讯景9600GT高频版显卡与AMD-ATi HD3870显卡在同等测试平台下的表现。关注测试结果的朋友请参照后面章节的测试成绩对比及分析。

  3DMARK VANTAGE测试流程:


  Graphic Test 1: Jane Nash(测试显卡帖图能力)




  此场景画包含以下的特性:
 众多固定物件,众多动态贴图,PCF过滤级联阴影贴图,少量实例对象,不包含Ray-Marching精准体积渲染效果,衣物摆动模拟,各向异性过滤,使用分层渲染的水面反射和折射……

  随着3DMark Vantage测试的全面升级,在Jane Nash测试大量使用了顶级图形特效,这对显卡帖图能力提出了更高的要求,在最高模式下即便是最顶级的显卡面对此种测试可能也会显得疲惫吃力。在此测试下,对显卡核心中的渲染管线提出了更高的要求,渲染管线设计的多少就直接关系到所绘出的图形的填充效率以及画面显示的流畅和精美程度。

  Graphic Test 2:New Calico(测试显卡建模)




  此场景画包含以下的特性:
 基本由移动物体构成,没有贴图物件,使用方差阴影映射物体阴影,大量实例对象,使用大量的ray-tracing效果(包括容积烟雾,True Impostors以及Parallax Occlusion Mapping),New Calico测试中包括了大量移动实体对象,其中引入了复杂而壮观的3D影像等场景对显卡建模提出了苛刻要求,通过此项测试检验县卡在应对大量移动特级视觉效果时的处理应对能力。

  CPU Test 1:人工智能(AI)测试




  AI测试主要针对CPU的运算能力,提供高强度负载,包括个体间的相互配合,路径寻找等。此场景中,所包含的飞机必须在通过每一个通道门时相互避让,以免相撞。

  由于测试给予CPU的负载主要依靠大量小飞机的不同动作来完成,产生大量平行运算,能够充分利用目前多核处理器。运算速度越高的CPU将能够让飞机做出更加及时以及更加大量的躲避动作,从而让飞机能够使用更完美的路线来飞行。

  CPU Test 2:物理测试(Physics)测试




  此测试主要对象是未来游戏的物理运算。测试场景是一个飞行竞赛,不过却加入了很多危险的障碍。飞机尾部将会喷出烟雾,而烟雾会和景内的软体物件如充气障碍物,以及旗帜等相互干扰;同时烟雾也会自行扩散,又受经过的飞机干扰,产生大量物理运算。

  如果在机器内装备有PhysX物理卡(或支持物理运算的显卡),则此项测试将启用物理卡(或支持PhysX的GPU)作物理加速之用;否则将使用CPU进行物理运算。在3DMARK选项里有关闭PPU的选项,让玩家能够屏蔽PhysX硬件加速的选项,方便对比测试之用。

  就目前的GPU整体性能而言,GPU现有技术已经可以将3D的物件图像刻画得真实而细腻,几乎可完全达到还原真实场景的效果,但是在处理移动物体方面时还是会与现实生活中的场景存在一定的落差,毕竟在目前技术层面上3D移动特效方面完全靠GPU技术还不能完美应付。而CPU的AI和物理运算技术恰好在加强游戏3D物件行为以及动作方面提供了技术支持,从而辅助GPU在完成3D物件移动处理方面变得更娴熟。

  就目前现状而言,3DMark Vantage的CPU Test 1以及Test 2还是基本使用CPU进行的,不过据NVIDIA官方透露,在不久的将来,通过NVIDIA即将发布的更新驱动,这两项测试将可以直接使用GPU来运算。由此我们可以推断,在未来的3DMark Vantage测试中,总体成绩也将会因此而大幅提升。

  3DMARK Vantage中其它特效测试


  由左上至右下,依次为:纹理填充测试、色彩填充测试、像素着色器测试、顶点与几何着色、粒子效果、多层次细节模型构建。利用Perlin噪声函数的特点,提出一种基于Perlin噪声函数的随机地形生成方法,并介绍利用该函数构建地形多层次细节模型的实现过程,最后给出利用Perlin噪声函数生成随机地形的实例。








  这些特效测试将对显卡的纹理填充功能、颜色着色功能、像素着色器性能、GPU计算能力以及顶点渲染、几何渲染、Stream out单元的整体性能等提出严格的监测和测试,从而检验显卡在处理特效图形方面的整体能力。

  3DMARK VANTAGE测试分数计算法:

  Graphic Test的测试得分将会是两个测试场景的帧数(fps)与一个固定系数的乘积,具体的计算公式如下 :


  CPU Test的测试得分则与CPU每秒所能执行的操作数(ops,Operations per second)有关,最后的CPU Score(CPU测试成绩)同样要乘以一个系数,具体计算公式如下:


  最后的得分计算方法则会由于测试模式的不同而有不同的计算系数,具体的计算公式如下:

TOP

测试成绩对比

  在实际测试中我们选用了最新的3DMark Vantage及主流的无款DX9C、DX10游戏,分别测试在1920×1200分辨率下默认画质及开启4倍抗锯齿,16倍异性过滤后的效能表现。

  VANTAGE:

P级与X级VANTAGE测试,AMD HD3870与XFX 9600GT平分秋色。


  游戏测试:

1920×1200分辨率下默认画质测试对比柱状图



1920×1200分辨率下4xAA/16xAF测试对比柱状图


  由以上测试对比图可以得知,依仗于出色的核心架构设计,NVIDIA GeForce9600GT在绝大多数测试下都占有优势,而当分辨率高达1920×1200后再开启抗锯齿及异性过滤就凸显出了其最大优势:光栅化单元(ROP)可以直接做AA/AF(全屏抗锯齿/各项异性过滤)操作,高分辨率下开启AA/AF后性能下降很小。AMD HD3870的ROP单元不支持AA/AF操作,需要通过SP单元进行AA/AF,而AMD的SP同时需要兼顾VS、PS与AA/AF操作,所以在大分辨率下开启这两项后,性能下降明显。

  看到这里玩家们都心里有数了吧,在大屏幕LCD日趋普及的今天,选购一款能够在高分辨率下流畅开启AA/AF的显卡是多么重要,而如果您还坚守着19寸LCD或更注重高清解码中的VC-1,另一家产品也是不错的选择!

TOP

测试成绩总结

  按理来说,ATI HD3870拥有相对较高的默认频率而且还拥有相对更新的DDR4显存颗粒,依照频率越高性能越强的一般分析标准,HD3870应该获得相对更为优秀的测试成绩才对,但是事实的测试结果却并非像人们想象的那样。这又是因为什么原因?出于此因素,我们打算更深入地分析这两款显卡的核心部分——GPU核心构架,以便为大家解开疑团。


  AMD的每个“Stream Processing Units”都包含有5个 “Shader Processing”分支器(Branch Execution unit),但“Shader Processing”并不是一个完整的统一渲染单元,由于每5个流处理器由1个分配执行单元(Branch Execution unit)来分配工作,而5个流处理器是不会在每次分配中都被应用到的,假设在一次处理中,5个流处理器中只有4个被分配执行单元调用,那它的利用率就只有80%,满载的情况很少会出现。



  NVIDIA及DirectX中,对“SP单元”的定义为“Stream Processing”,但AMD对SP单元的定义为“Shader Processing”。

  反观NVIDIA核芯架构,每个SP都是通用的、不相关的和标量地,可以同时进行MAD和MUL操作,就是说G84的SP单元时刻都可以被充分利用的,大大提高了GPU的执行效率。
因此,AMD真正的“联合渲染单元”的数量,比其规格表中所列出的要少得多,甚至不足其宣传数量的1/4水平。HD3850/3870在规格表中的SP单元有320个,不过RV670(3870/3850)真正的“Stream Processing Units”是64个。


  NVIDIA显卡的光栅化单元(ROP)可以直接做AA/AF(全屏抗锯齿/各项异性过滤)操作,所以在开启AA/AF后性能下降很小。AMD显卡的ROP单元不支持AA/AF操作,需要通过SP单元进行AA/AF,而AMD的SP同时需要兼顾VS、PS与AA/AF操作,所以开启这两项后,性能下降明显。



  NVIDIA核芯架构中,每SP都是1D标量单元,可以将一个复杂指令拆分为4个简单的标量指令来运行,GPU利用率更高,游戏执行效率更高。而AMD显卡陈旧的核芯架构仅支持4D的矢量操作,虽然在理论上,执行传统的mul+mad或3D+1D/2D+2D的操作时,效率更高,但在实际游戏中往往无法达到“满载”的理想状态,从而使游戏执行效率低下。

  在支持DX10游戏规范方面我们需要承认NVIDIA在这方面的实力,而且NV对于这个趋势也做了充足的准备,将更多AA和AF处理能力设计到G94内核中,在G94架构中为了更好的AA效果,NV用POP单元去处理,而3870用流处理器去运算,从而导致3D处理能力降低。为了更好的AF效果,NV应用了2倍于3870的纹理过滤单元,G94有32个,而RV670只有16个,所以也致使在AA和AF开启的情况下进行测试,96GT在大多数游戏中战胜3870,在实际测试中,NVIDIA显卡先进的核芯架构已大辐领先于AMD的显卡,至少在这点上A卡方面还是存在很大的不足。

  虽然今天3DMARK VANTAGE只能测试GPU中的3D显示效果,但在不远的将来,8系及以上的GPU将全面支持物理运算,NV的GPU上的3DMARK VANTAGE得分将会大幅增加。可惜目前为止我们还没有听到AMD-ATi在这方面的任何举动,AMD在游戏驱动等方面的滞后一直以来也是制约发展的软肋,我们期待着它有更好的改进,当然我们同样也期待未来显卡的不断升级和完善,对于各派别显卡在3DMARK VANTAGE的表现,我们将拭目以待。

TOP

NVIDIA核心AIC厂商:XFX(讯景)



  通常情况下,显卡厂商为了更好去区分产品,会将显卡按照制定的规则进行细致的命名分类,以XFX显卡为例,它的命名规则大致如下,显卡按照“PV-ABCD-EFGH”的模式进行标号,“PV”代表产品总集;“A”代表显示芯片厂商或特殊要求,其中T代表NVIDIA,S代表SIS,H代表芯片支持HDCP;“BC”则代表显示芯片研发代号;“D”代表同系列产品中不同版本;“E”代表显存规格;“F”代表输出/输入接口及其它;“G”代表散热设备或特殊的型号;“H”则代表包装方式。



  XFX讯景继续承诺“一年换新,循环质保”的售后服务承诺:


  一年换新:自购买之日(以经销商销售证明为准,如遗失销售证明,则以产品条形码标签为准)起一年内如出现质量问题,可免费更换同型号的完整包装的全新产品; 如果一年内产品出现质量问题,但因产品停产或断货等原因无法更换新品的,则XFX将提供免费维修服务;如无法修复,则在与用户协商后,更换其他型号的产品(如用户同时提出升级显卡规格的请求,可参照用户购买显卡时的市场价格差,补足差价,收取一定升级费用)。

  需要强调的是,玩家只要凭旧卡裸机便可换取整套全新显卡套装,不仅仅是单纯的以一换一,而是以一换多的显卡换新方案。


  循环质保:一年内产品出现质量问题而更换或维修后,对该产品进行循环质保,即质保期从更换产品之日起重新计算。 需要强调的是,旧卡换新卡后,计算时间将从新卡更换时间开始重新计算。



  在一线显卡厂商当中,XFX讯景不断推出个性化的产品,而其独特的质保条例也使得其它厂商汗颜。不愧为NVIDIA核心AIC,讯景在产品品质与服务质量两方面都做得十分出色,我们超频网也为此对其颁发《编辑选择奖》。

TOP

又是一篇有置顶潜力的强稿[s006]

TOP

回复 15楼 wakin 的帖子

[s018] 已设精、高亮
曲不为直终必弯
养狼当犬看家难
墨染鸬鹚黑不久
粉刷乌鸦白不坚
蜜饯黄连中清苦
强摘瓜果不能甜
好事总得善人做
哪有烦人做神仙

TOP

XFX现在也只能靠中端拼了 不过不拼价格 只拼广告[s035]

TOP

文章真的很强

TOP

好文章,细心阅读ING。。

TOP

才看到,帮顶了

TOP

返回列表
超频网——中国电脑精英玩家基地