ASUS EAH3870显存直飙2750MHz | | ASUS、DFI、GIGA X48主板巅峰夺帅 | | 多核X2电源方案征集大赛
OPB影音:600fsb達成過程及bios分享 | | TPower P45空冷外频612MHz首测 | | Maximus II Formula+TR true black U120E
极限OC玩家专访调查 | | 压缩机助力四核外频升至547MHz | | 强强联合!LanParty UT X48 T2R | | 作弊? 极限玩家的SuperPi的博弈
发新话题
打印

显卡知识讲堂:从SP架构设计看HD3870和9600GT的对抗

本主题由 juv3 于 2008-3-9 12:00 提升

显卡知识讲堂:从SP架构设计看HD3870和9600GT的对抗

AMDNVIDIA对抗的这一年里,有很多网友都对AMDSP单元数量做出了“低能”的判断,认为AMD显卡在SP单元数量占优的情况下居然还不能全胜,觉得AMD的“高规格”是缩水的。这其实是一个误解。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
AMDNVIDIADirectX10显卡的设计上走的是不同的路线,AMD的统一渲染架构设计的比较复杂,虽然看上去SP单元数量占优,其实并非如此。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
SP单元的全称是“Stream Processing”,不过这是NVIDIASP单元全称,AMDSP单元全称是“Stream Processing Units”。AMD的每个“Stream Processing Units”都包含有5个控制单元“Shader Processing”,因此在“SP”数量上等于增加了4倍。如此大家应该知道了,我们在规格表上看到的“SP单元”指的可能是“Stream Processing”,也可能是“Shader Processing”。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
      Shader Processing”并不是一个完整的统一渲染单元,虽然“Shader Processing”有着极强的可塑性,但依然受制于“Stream Processing Units”架构,因此并不能把“Shader Processing”当作“Stream Processing”看待。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
AMD显卡真正的SP单元“Stream Processing Units”比规格表中的要少得多,以HD3870为例,HD3870在规格表中的SP单元有320个,不过HD3870真正的“Stream Processing Units”是64个。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
单以运算效率来说,在同样数量和同样频率下,AMD的“Stream Processing Units”比NVIDIA的“Stream Processing”要快一倍以上,不过AMD的“Stream Processing Units”设计的过于复杂,至今AMD也只推出过含有64个“Stream Processing Units”的显卡,如HD3870ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
AMDDirectX10时代走的是效率路线,NVIDIA走的是频率路线和数量路线。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
NVIDIA大幅提高“Stream Processing”的数量和频率,以此来获得总体性能的提升。结果NVIDIA能够做出128个“Stream Processing”的8800GTX,在SP单元数量上比HD3870要高出整整一倍。与此同时NVIDIA还把“Stream Processing”的频率异步提高,使得“Stream Processing”的频率比核心频率提高了1倍至1.5倍,9600GT的“Stream Processing”频率就是核心频率的2.5倍。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
如此解释大家想必就明白了,AMD显卡的规格并不是“太高”,而是苦于太复杂而不能太高,NVIDIA的规格则要简单的多,更多的“Stream Processing”单元,更高的“Stream Processing”频率。可以说,NVIDIA用数量优势和频率优势,来对抗AMD的效率优势和功能优势。事实证明,和提高数量、提高频率相比,提升效率要困难的多。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
AMD的高效SP单元虽然复杂,但也有着自己的好处。由于AMD在工艺上已经提高到了55nm,因此AMD HD3000系列显卡在价格方面有着更大的选择余地,可以通过降价来提供性价比更高的产品。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
      除去HD3870 X2那个双核怪胎以外,AMD现在能够提供的最高规格是64个“Stream Processing Units”,也就是320个“Shader Processing”,也就是说HD3870是一款最高规格的顶级产品。NVIDIA现在能够提供的最高规格是128个“Stream Processing”,如8800Ultra8800GTX8800GTS,而9600GT只有64个“Stream Processing”,因此有不少网友说9600GT是一款阉割产品其实也是有一定道理的。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
      竞争促进技术进步,竞争催生高性价比产品。一石激起千层浪,自从NVIDIA推出9600GT后,立刻在中高端显卡市场掀起了一波降价潮。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
首先降价的是蓝宝256MBHD3850,价格直杀999元,这对千元显卡市场造成了强烈的冲击。蓝宝HD3850所带来的惊喜还未过去,HD3870又加入战团。近日,双敏公布了HD3870的新价格——1499元。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
      ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
HD3870和9600GT的性能测试各大网站上都有,HD3870还是有明显优势的。从规格上看,HD3870有着工艺优势、技术优势、节能优势和高清优势,而HD3870和9600GT的价格现在已经持平了。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
我们前面已经说过,HD3870是一款高效率的产品,但在SP单元数量和频率上占优势的9600GT也不遑多让。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
      从上表中我们可以很清楚地看到,HD3870有着五大优势:ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
1,55nm工艺优势,可以在成本和功耗上得到更好的控制。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
2,DirectX10.1的技术优势,HD3870可以完美支持Vista SP1。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
3,高清优势,HD3870可以完美解码H.264和VC-1高清视频。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
4,节能优势,HD3870有着移动显卡节能技术PowerPlay。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
5,频率优势,HD3870的核心频率、显存频率都要高于对手。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
      相对的,9600GT也有着自己的优势:9600GT的SP频率是核心频率的2.5倍。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.
综合来看,HD3870在功能和性能两方面的发展比较均衡,而且在这次降价后,功能、性能、价格、性价比都超过了9600GT。但9600GT刚刚推出,应该也有一定的降价空间,相信用不了多久NVIDIA那边也会公布相应的降价策略,否则9600GT可就出师未捷身先死了。想买9600GT的朋友也不用着急现在出手,如果一定要现在出手的话还是HD3870更划算。ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.


[ 本帖最后由 juv3 于 2008-3-6 11:31 编辑 ]
本帖最近评分记录
  • possecat 现金 +50 感谢分享 2008-3-10 14:40
  • possecat 威望 +1 感谢分享 2008-3-10 14:40



3870的价格比9600GT要高150到250啊
北京中关村海龙5064柜台 联系 QQ 84714026 欢迎加入北京攒机DIY群42948219,29052481攒机价格优惠http://dealer.zol.com.cn/d_52192/
http://shop35199567.taobao.com/

回复 2# 的帖子

楼上说的对啊····

lz 如果 512m的  3850  999         3870   1299 还是非常不错的!!!!!!
但是确实A的饱满色彩……所以即使驱动不完善,即使性能稍微弱一点,还是难以再用N卡了……

N卡据说可以调节。但是,作为普通消费者,那什么劳什子的数字抖动没兴趣去碰了。也不知道是真的可以调节还是啥。
512M999早有了,好像有出799和899了

回复 5# 的帖子

我说的是 公版的 谢谢!!!!!!
所谓“简单”和“复杂”不能这么看吧
NVIDIA和AMD的Shader部分都是SIMD
AMD将Shader、TMU、Cache、寄存器、线程管理这些电路设计成分开的模块(16个5D Shader组成一个bank,线程分配器给这4个bank发送指令)
在RV670、RV635、RV620这个高中低三档上,Shader、TMU和Cache的比例与组成是不一样的
而NVIDIA将Shader、TMU、L1 Cache以及线程管理等资源打包成一个模块(TPC,Thread Processor Cluster,在G92上有8组,最低端的G98上有1组),不同档次的产品区别只是TPC数量的多少。显然NVIDIA认为这样的配比比较有好处(或者说是成本价格比比较好,性能均衡)。
注:G84和G86与G9x相同,而G80与G84/G86的区别是TMU的TA数量少一半。
目前还不清楚AMD在R600这个架构上还会有什么后续动作,按照R520、R580的演化方式看,这一代架构应该也可以继续堆Shader数量而不增加线程资源。这样做的好处是比较容易扩展执行单元数量,而代价是效率的下降。R520到R580的性能增长与执行单元数量增长不成比例就是个例子。
相比而言NVIDIA扩展执行单元数量时整套资源同比增长,反而是更复杂一些。如果考虑1D ALU为了提高到2GHz频率需要加长流水线这一点,复杂度也未必低于AMD的5D VLIW多少。

实际上GPU的特殊性就在于,除了通用资源以外,固定功能单元也大大影响着性能,除了纸面上能看到的执行单元数量和FLOPS值以外,架构当中也还有大量的不写在纸面上的因素影响着性能。

[ 本帖最后由 Travis 于 2008-3-11 14:22 编辑 ]
本帖最近评分记录
  • 萌萌 现金 +50 感谢分享 2008-3-11 15:05
引用:
原帖由 juv3 于 2008-3-6 11:28 发表
2,DirectX10.1的技术优势,HD3870可以完美支持Vista SP1。
5,频率优势,HD3870的核心频率、显存频率都要高于对手。
第二点和第五点挺扯的……
显存频率基本就是看厂商用什么显存用什么板子和供电,核心频率只是影响到同一个GPU能发挥出几成能力而无法和另一个GPU横向比较
至于DX10.1,这个东西比DX8.1的改变还要小,再说啥叫完美支持某操作系统,如果机器没有readyboost是不是可以认为“压根不完美”?
引用:
原帖由 Oran 于 2008-3-11 12:06 发表
但是确实A的饱满色彩……所以即使驱动不完善,即使性能稍微弱一点,还是难以再用N卡了……

N卡据说可以调节。但是,作为普通消费者,那什么劳什子的数字抖动没兴趣去碰了。也不知道是真的可以调节还是啥。
不是色彩抖动
是视频回放的默认色彩设置
引用:
原帖由 Travis 于 2008-3-11 14:18 发表


第二点和第五点挺扯的……
显存频率基本就是看厂商用什么显存用什么板子和供电,核心频率只是影响到同一个GPU能发挥出几成能力而无法和另一个GPU横向比较
至于DX10.1,这个东西比DX8.1的改变还要小,再说啥叫完 ...
我也认为频率优势N卡更多些。Shader飚得更高不说,超频潜力也比A卡大很多。再加上很多厂商的超频版出厂就提升了VCore,还有那么多种的超频方式……(NVIDIA驱动面板或nTUNE,ATiTools,RIVATUNER……NVFLASH直刷BIOS等)
听说最近8800GT降价了,512M的才¥1499,不知道9600GT什么时候跟进呢
很好,Travis说的不错。有些地方的确欠妥!

ATI出厂频率就挺高的,超频潜力的话,从核心频率来讲并不输于N卡



9600GT在现在1500这个价位我想很多人都不会出手,非公办的8800GT也这个价。而3850已经下探到了1000。所以性能之争并不能决定市场之争



关于G8x/R6xx的设计,Eji这个点评的主题讲得比较好
http://we.pcinlife.com/thread-900174-1-1.html
简单来讲,ALU不值钱,架构当中ALU以外的东西才是值钱的
发新话题