玩家论坛's Archiver

juv3 发表于 2008-3-6 11:28

显卡知识讲堂:从SP架构设计看HD3870和9600GT的对抗

[size=5]在[font=Times New Roman]AMD[/font][font=宋体]和[/font][font=Times New Roman]NVIDIA[/font][font=宋体]对抗的这一年里,有很多网友都对[/font][font=Times New Roman]AMD[/font][font=宋体]的[/font][font=Times New Roman]SP[/font][font=宋体]单元数量做出了“低能”的判断,认为[/font][font=Times New Roman]AMD[/font][font=宋体]显卡在[/font][font=Times New Roman]SP[/font][font=宋体]单元数量占优的情况下居然还不能全胜,觉得[/font][font=Times New Roman]AMD[/font][font=宋体]的“高规格”是缩水的。这其实是一个误解。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]AMD[/font][font=宋体]和[/font][font=Times New Roman]NVIDIA[/font][font=宋体]在[/font][font=Times New Roman]DirectX10[/font][font=宋体]显卡的设计上走的是不同的路线,[/font][font=Times New Roman]AMD[/font][font=宋体]的统一渲染架构设计的比较复杂,虽然看上去[/font][font=Times New Roman]SP[/font][font=宋体]单元数量占优,其实并非如此。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]SP[/font][font=宋体]单元的全称是“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”,不过这是[/font][font=Times New Roman]NVIDIA[/font][font=宋体]的[/font][font=Times New Roman]SP[/font][font=宋体]单元全称,[/font][font=Times New Roman]AMD[/font][font=宋体]的[/font][font=Times New Roman]SP[/font][font=宋体]单元全称是“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”。[/font][font=Times New Roman]AMD[/font][font=宋体]的每个“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”都包含有[/font][font=Times New Roman]5[/font][font=宋体]个控制单元“[/font][font=Times New Roman]Shader Processing[/font][font=宋体]”,因此在“[/font][font=Times New Roman]SP[/font][font=宋体]”数量上等于增加了[/font][font=Times New Roman]4[/font][font=宋体]倍。如此大家应该知道了,我们在规格表上看到的“[/font][font=Times New Roman]SP[/font][font=宋体]单元”指的可能是“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”,也可能是“[/font][font=Times New Roman]Shader Processing[/font][font=宋体]”。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]      [/font][font=宋体]“[/font][font=Times New Roman]Shader Processing[/font][font=宋体]”并不是一个完整的统一渲染单元,虽然“[/font][font=Times New Roman]Shader Processing[/font][font=宋体]”有着极强的可塑性,但依然受制于“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”架构,因此并不能把“[/font][font=Times New Roman]Shader Processing[/font][font=宋体]”当作“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”看待。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]AMD[/font][font=宋体]显卡真正的[/font][font=Times New Roman]SP[/font][font=宋体]单元“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”比规格表中的要少得多,以[/font][font=Times New Roman]HD3870[/font][font=宋体]为例,[/font][font=Times New Roman]HD3870[/font][font=宋体]在规格表中的[/font][font=Times New Roman]SP[/font][font=宋体]单元有[/font][font=Times New Roman]320[/font][font=宋体]个,不过[/font][font=Times New Roman]HD3870[/font][font=宋体]真正的“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”是[/font][font=Times New Roman]64[/font][font=宋体]个。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=宋体]单以运算效率来说,在同样数量和同样频率下,[/font][font=Times New Roman]AMD[/font][font=宋体]的“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”比[/font][font=Times New Roman]NVIDIA[/font][font=宋体]的“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”要快一倍以上,不过[/font][font=Times New Roman]AMD[/font][font=宋体]的“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”设计的过于复杂,至今[/font][font=Times New Roman]AMD[/font][font=宋体]也只推出过含有[/font][font=Times New Roman]64[/font][font=宋体]个“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”的显卡,如[/font][font=Times New Roman]HD3870[/font][font=宋体]。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]AMD[/font][font=宋体]在[/font][font=Times New Roman]DirectX10[/font][font=宋体]时代走的是效率路线,[/font][font=Times New Roman]NVIDIA[/font][font=宋体]走的是频率路线和数量路线。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]NVIDIA[/font][font=宋体]大幅提高“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”的数量和频率,以此来获得总体性能的提升。结果[/font][font=Times New Roman]NVIDIA[/font][font=宋体]能够做出[/font][font=Times New Roman]128[/font][font=宋体]个“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”的[/font][font=Times New Roman]8800GTX[/font][font=宋体],在[/font][font=Times New Roman]SP[/font][font=宋体]单元数量上比[/font][font=Times New Roman]HD3870[/font][font=宋体]要高出整整一倍。与此同时[/font][font=Times New Roman]NVIDIA[/font][font=宋体]还把“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”的频率异步提高,使得“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”的频率比核心频率提高了[/font][font=Times New Roman]1[/font][font=宋体]倍至[/font][font=Times New Roman]1.5[/font][font=宋体]倍,[/font][font=Times New Roman]9600GT[/font][font=宋体]的“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”频率就是核心频率的[/font][font=Times New Roman]2.5[/font][font=宋体]倍。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=宋体]如此解释大家想必就明白了,[/font][font=Times New Roman]AMD[/font][font=宋体]显卡的规格并不是“太高”,而是苦于太复杂而不能太高,[/font][font=Times New Roman]NVIDIA[/font][font=宋体]的规格则要简单的多,更多的“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”单元,更高的“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”频率。可以说,[/font][font=Times New Roman]NVIDIA[/font][font=宋体]用数量优势和频率优势,来对抗[/font][font=Times New Roman]AMD[/font][font=宋体]的效率优势和功能优势。事实证明,和提高数量、提高频率相比,提升效率要困难的多。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]AMD[/font][font=宋体]的高效[/font][font=Times New Roman]SP[/font][font=宋体]单元虽然复杂,但也有着自己的好处。由于[/font][font=Times New Roman]AMD[/font][font=宋体]在工艺上已经提高到了[/font][font=Times New Roman]55nm[/font][font=宋体],因此[/font][font=Times New Roman]AMD HD3000[/font][font=宋体]系列显卡在价格方面有着更大的选择余地,可以通过降价来提供性价比更高的产品。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]      [/font][font=宋体]除去[/font][font=Times New Roman]HD3870 X2[/font][font=宋体]那个双核怪胎以外,[/font][font=Times New Roman]AMD[/font][font=宋体]现在能够提供的最高规格是[/font][font=Times New Roman]64[/font][font=宋体]个“[/font][font=Times New Roman]Stream Processing Units[/font][font=宋体]”,也就是[/font][font=Times New Roman]320[/font][font=宋体]个“[/font][font=Times New Roman]Shader Processing[/font][font=宋体]”,也就是说[/font][font=Times New Roman]HD3870[/font][font=宋体]是一款最高规格的顶级产品。[/font][font=Times New Roman]NVIDIA[/font][font=宋体]现在能够提供的最高规格是[/font][font=Times New Roman]128[/font][font=宋体]个“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”,如[/font][font=Times New Roman]8800Ultra[/font][font=宋体]、[/font][font=Times New Roman]8800GTX[/font][font=宋体]和[/font][font=Times New Roman]8800GTS[/font][font=宋体],而[/font][font=Times New Roman]9600GT[/font][font=宋体]只有[/font][font=Times New Roman]64[/font][font=宋体]个“[/font][font=Times New Roman]Stream Processing[/font][font=宋体]”,因此有不少网友说[/font][font=Times New Roman]9600GT[/font][font=宋体]是一款阉割产品其实也是有一定道理的。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]      [/font][font=宋体]竞争促进技术进步,竞争催生高性价比产品。一石激起千层浪,自从[/font][font=Times New Roman]NVIDIA[/font][font=宋体]推出[/font][font=Times New Roman]9600GT[/font][font=宋体]后,立刻在中高端显卡市场掀起了一波降价潮。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=宋体]首先降价的是蓝宝[/font][font=Times New Roman]256MB[/font][font=宋体]的[/font][font=Times New Roman]HD3850[/font][font=宋体],价格直杀[/font][font=Times New Roman]999[/font][font=宋体]元,这对千元显卡市场造成了强烈的冲击。蓝宝[/font][font=Times New Roman]HD3850[/font][font=宋体]所带来的惊喜还未过去,[/font][font=Times New Roman]HD3870[/font][font=宋体]又加入战团。近日,双敏公布了[/font][font=Times New Roman]HD3870[/font][font=宋体]的新价格——[/font][font=Times New Roman]1499[/font][font=宋体]元。[/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[font=Times New Roman]      [img]http://classpic22.chinaren.com/album/pic/921/579/2917034545014579921/120418755488038.gif[/img][/font][size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
HD3870和9600GT的性能测试各大网站上都有,HD3870还是有明显优势的。从规格上看,HD3870有着工艺优势、技术优势、节能优势和高清优势,而HD3870和9600GT的价格现在已经持平了。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
我们前面已经说过,HD3870是一款高效率的产品,但在SP单元数量和频率上占优势的9600GT也不遑多让。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
      从上表中我们可以很清楚地看到,HD3870有着五大优势:[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
1,55nm工艺优势,可以在成本和功耗上得到更好的控制。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
2,DirectX10.1的技术优势,HD3870可以完美支持Vista SP1。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
3,高清优势,HD3870可以完美解码H.264和VC-1高清视频。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
4,节能优势,HD3870有着移动显卡节能技术PowerPlay。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
5,频率优势,HD3870的核心频率、显存频率都要高于对手。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
      相对的,9600GT也有着自己的优势:9600GT的SP频率是核心频率的2.5倍。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size]
综合来看,HD3870在功能和性能两方面的发展比较均衡,而且在这次降价后,功能、性能、价格、性价比都超过了9600GT。但9600GT刚刚推出,应该也有一定的降价空间,相信用不了多久NVIDIA那边也会公布相应的降价策略,否则9600GT可就出师未捷身先死了。想买9600GT的朋友也不用着急现在出手,如果一定要现在出手的话还是HD3870更划算。[size=0px]ØÙ¢¬ËËß„±ëclub.hardspell.comlB¯z\9…O.[/size][/size]

[[i] 本帖最后由 juv3 于 2008-3-6 11:31 编辑 [/i]]

fengke117 发表于 2008-3-11 10:22

3870的价格比9600GT要高150到250啊

头发乱了 发表于 2008-3-11 11:53

回复 2# 的帖子

楼上说的对啊····

lz 如果 512m的  3850  999         3870   1299 还是非常不错的!!!!!!

Oran 发表于 2008-3-11 12:06

但是确实A的饱满色彩……所以即使驱动不完善,即使性能稍微弱一点,还是难以再用N卡了……

N卡据说可以调节。但是,作为普通消费者,那什么劳什子的数字抖动没兴趣去碰了。也不知道是真的可以调节还是啥。

chenwuchao 发表于 2008-3-11 12:11

512M999早有了,好像有出799和899了

头发乱了 发表于 2008-3-11 13:38

回复 5# 的帖子

我说的是 公版的 谢谢!!!!!!

Travis 发表于 2008-3-11 14:06

所谓“简单”和“复杂”不能这么看吧
NVIDIA和AMD的Shader部分都是SIMD
AMD将Shader、TMU、Cache、寄存器、线程管理这些电路设计成分开的模块(16个5D Shader组成一个bank,线程分配器给这4个bank发送指令)
在RV670、RV635、RV620这个高中低三档上,Shader、TMU和Cache的比例与组成是不一样的
而NVIDIA将Shader、TMU、L1 Cache以及线程管理等资源打包成一个模块(TPC,Thread Processor Cluster,在G92上有8组,最低端的G98上有1组),不同档次的产品区别只是TPC数量的多少。显然NVIDIA认为这样的配比比较有好处(或者说是成本价格比比较好,性能均衡)。
注:G84和G86与G9x相同,而G80与G84/G86的区别是TMU的TA数量少一半。
目前还不清楚AMD在R600这个架构上还会有什么后续动作,按照R520、R580的演化方式看,这一代架构应该也可以继续堆Shader数量而不增加线程资源。这样做的好处是比较容易扩展执行单元数量,而代价是效率的下降。R520到R580的性能增长与执行单元数量增长不成比例就是个例子。
相比而言NVIDIA扩展执行单元数量时整套资源同比增长,反而是更复杂一些。如果考虑1D ALU为了提高到2GHz频率需要加长流水线这一点,复杂度也未必低于AMD的5D VLIW多少。

实际上GPU的特殊性就在于,除了通用资源以外,固定功能单元也大大影响着性能,除了纸面上能看到的执行单元数量和FLOPS值以外,架构当中也还有大量的不写在纸面上的因素影响着性能。

[[i] 本帖最后由 Travis 于 2008-3-11 14:22 编辑 [/i]]

Travis 发表于 2008-3-11 14:18

[quote]原帖由 [i]juv3[/i] 于 2008-3-6 11:28 发表 [url=http://bbs.ocer.net/redirect.php?goto=findpost&pid=1567037&ptid=196677][img]http://bbs.ocer.net/images/common/back.gif[/img][/url]
[size=5]2,DirectX10.1的技术优势,HD3870可以完美支持Vista SP1。[/size]
[size=5]5,频率优势,HD3870的核心频率、显存频率都要高于对手。[/size]
[/quote]

第二点和第五点挺扯的……
显存频率基本就是看厂商用什么显存用什么板子和供电,核心频率只是影响到同一个GPU能发挥出几成能力而无法和另一个GPU横向比较
至于DX10.1,这个东西比DX8.1的改变还要小,再说啥叫完美支持某操作系统,如果机器没有readyboost是不是可以认为“压根不完美”?

Travis 发表于 2008-3-11 14:23

[quote]原帖由 [i]Oran[/i] 于 2008-3-11 12:06 发表 [url=http://bbs.ocer.net/redirect.php?goto=findpost&pid=1579721&ptid=196677][img]http://bbs.ocer.net/images/common/back.gif[/img][/url]
但是确实A的饱满色彩……所以即使驱动不完善,即使性能稍微弱一点,还是难以再用N卡了……

N卡据说可以调节。但是,作为普通消费者,那什么劳什子的数字抖动没兴趣去碰了。也不知道是真的可以调节还是啥。 [/quote]

不是色彩抖动
是视频回放的默认色彩设置

萌萌 发表于 2008-3-11 14:52

[quote]原帖由 [i]Travis[/i] 于 2008-3-11 14:18 发表 [url=http://bbs.ocer.net/redirect.php?goto=findpost&pid=1580095&ptid=196677][img]http://bbs.ocer.net/images/common/back.gif[/img][/url]


第二点和第五点挺扯的……
显存频率基本就是看厂商用什么显存用什么板子和供电,核心频率只是影响到同一个GPU能发挥出几成能力而无法和另一个GPU横向比较
至于DX10.1,这个东西比DX8.1的改变还要小,再说啥叫完 ... [/quote]
我也认为频率优势N卡更多些。Shader飚得更高不说,超频潜力也比A卡大很多。再加上很多厂商的超频版出厂就提升了VCore,还有那么多种的超频方式……(NVIDIA驱动面板或nTUNE,ATiTools,RIVATUNER……NVFLASH直刷BIOS等)

akg240s 发表于 2008-3-11 16:42

听说最近8800GT降价了,512M的才¥1499,不知道9600GT什么时候跟进呢[s006]

juv3 发表于 2008-3-12 09:24

很好,Travis说的不错。有些地方的确欠妥!

ATI出厂频率就挺高的,超频潜力的话,从核心频率来讲并不输于N卡

juv3 发表于 2008-3-12 09:28

9600GT在现在1500这个价位我想很多人都不会出手,非公办的8800GT也这个价。而3850已经下探到了1000。所以性能之争并不能决定市场之争

Travis 发表于 2008-3-12 11:50

关于G8x/R6xx的设计,Eji这个点评的主题讲得比较好
[url]http://we.pcinlife.com/thread-900174-1-1.html[/url]
简单来讲,ALU不值钱,架构当中ALU以外的东西才是值钱的

页: [1]
超频网——中国电脑精英玩家基地

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.