GeForce9600GT的基准及游戏测试已经非常多,从国外媒体的GPU芯片对比测试可以看出,9600GT的实际游戏性能相当于Radeon HD3870,有8800GT80%以上的性能。并且开启4AA/16AF后9600GT的表现会进一步提高,8AA时会更高。当然8AA对于这样级别的显卡没有意义,但是从不同分辨率、不同游戏、不同画质下的对比结果,我们可以分析出9600GT为什么如此高效。

Radeon HD3870基于RV670核心,RV670是R600的256bit&频率提升版。RV670的架构优劣已经谈过很多次,包括管理调度效率低下导致64个5D ALU与9600GT的64个1D ALU实际效能相当,ShaderAA导致开启抗锯齿后性能骤降,TMU效率过低导致开启各向异性过滤后游戏性能下降,所以一旦开启4AA/16AF后RV670就废了。作为AMD目前主流显卡3870游戏性能不如9600GT还有另一个重大原因,就是大家在游戏序幕常看到的THE WAY!我们知道RV670的5DALU在碰到复杂指令时效率下降,而NVIDIA的1DALU是把复杂指令拆分执行多次,那么如果一款游戏编译器大量采用复杂指令,3870运行这种游戏的效率自然会下降,所以很多游戏中3870惨不忍睹,例如CRYSIS。
GeForce 8800GT的流处理器是112个,比GeForce9600GT多出了48个,TMU数量同比多出75%,但两者的性能差距在20%以内,怎么解释9600GT的高效?从架构上看G94并没有变动,9600GT的核心、Shader频率稍高但根本不足以弥补数量上的差距;GeForce9系驱动进一步优化了Shader、TMU效率但根本没有决定性的影响。所以决定了两者差距的不是GeForce9600GT高效,而是GeForce8800GT的低能。上面架构对比中9600GT与8800GT都有16个ROP和256bit显存位宽,8800GT的16个ROP是和显存位宽同比削减而来的。开启4AA的状态下,16个ROP的9600GT在3DMarkVantage测试中表现出核心频率有瓶颈,更何况8800GT的整体规格都比9600GT高出很多。同时做AA运算时不仅ROP有瓶颈,也会给256bit显存位宽带来很大压力,TMU和Shader运算同样要占用显存位宽,可以说限制8800GT的第一瓶颈就是显存带宽,第二瓶颈是ROP性能。所以在任何测试中,从0AA到4AA到8AA,9600GT与8800GT的差距都越来越小。