不想错过重要资讯?
马上订阅新闻邮件!
 
a 您现在的位置: 中计在线 >> 资讯 >> 产品 >> 文章正文
性能与效能的较量
作者:未知    文章来源:本站原创    更新时间:2006-5-11 13:36:47
【字体:
 中计在线信息化频道全心上线!全力推动中国信息化进程!信息决策,易如反掌,尽在CIW信息化!
热点专题:2007暑期促销宝典
·TMMB被指绕不过韩国专利陷阱
· AMD否认外包芯片生产业务
·华为称华赛正招募大批黑客
·传大唐移动获得青岛TD项目超50%份额
·赛迪金笔杆二季度评选活动

  在一块显卡的制造成本中,除了图形芯片以外,显存几乎一直都是成本最高的部分。因此我们可以看到在整合芯片组领域,厂商大都采用的是“板载图形芯片+共享系统主内存”的方式,以省下显存的成本。而在低端显卡领域,ATI、NVIDIA等图形芯片厂商,也一直希望能够通过“租借”廉价的系统主内存,大大减小显存成本和降低产品价格,提高自家产品的竞争力。
  PCI Express总线的出现,为图形芯片厂商们提供了难得的机遇。NVIDIA和ATI都及时抓住了这个机会,接连为我们带来了TurboCache和HyperMemory等共享显存技术。其中NVIDIA的TurboCache技术已经发展到了第二代,相关的PCI Express显卡产品也已大量上市。
  得益于最新的共享显存技术,2006年的低端PCI Express显卡,无论是性能还是效能方面,都开始提升到一个更高的境界。对于广大的消费者来说,这也意味着用低廉的价格享受高性能的产品已经不再是梦想。
  了解共享显存技术
  最早的共享显存技术,其工作原理是在系统主内存中划分出一块固定空间,以供图形芯片调用。这种方法虽然容易实现,但缺点也很明显。用户即使没有在玩游戏,被分配给图形芯片的内存也不会得到释放,白白浪费了系统资源。
  为了解决这一问题,动态显存分配技术开始出现。顾名思义,该技术可以为图形芯片动态地分配内存空间,力求将内存资源的浪费控制在最低程度。它将内存空间分为固定和动态的两部分,其中固定部分的容量很小,仅用于在系统启动时显示图像;而动态部分则可根据游戏的需要,自动从系统主内存中调用,使用完后又能自动“归还”给系统。
  HyperMemory技术简介
  我们知道,PCI Express x16总线的单向传输带宽可以达到4GB/s,双向传输带宽更是高达8GB/s。而AGP 8X的最大理论传输带宽仅为2.1GB/s。数据传输带宽的大幅提升,除了对高清视频编辑等应用大有裨益之外,还为共享显存技术提供了一个理想的平台。
  ATI早在整合芯片组领域就推出了HyperMemory技术,之后又将其引入了低端PCI Express显卡,并在传统的动态共享显存架构基础上新加入了本地帧缓存架构设计。该设计将板载显存作为本地帧缓存,大幅减少了内存读写次数,缓解了数据存取时间过长的问题。但是HyperMemory技术无法直接往系统内存保存帧缓存,而是要通过板载显存进行中转。也就是说它还不能做到将系统主内存与板载显存视为一个整体。
  TurboCacheII技术简介
  TurboCache技术的工作原理,与HyperMemory有着不少相似之处,但是TurboCache在内存利用效率方面却要更胜一筹。这是因为它具有MMU(Memory Manage Unit)内存管理单元,可以将帧缓存直接写入系统主内存。
  MMU内存管理单元能够在GPU图形芯片与系统主内存之间建立直接传输通道,把系统主内存和板载显存视为一体,并突破两者的物理地址,以虚拟寻址方式对帧缓存与纹理缓存进行自由分配。这样系统主内存实际上已具备了传统意义上的显存功能,读写效率也得到了大幅提升。
  在发布GeForce 7300GS图形芯片的同时,NVIDIA也对TurboCache技术进行了升级。目前的TurboCacheII技术功能已经更加完善和成熟,执行效率也有了进一步的提高。
  测试说明
  在低端PCI Express显卡市场,ATI曾经推出了具备HyperMemory技术的Radeon X300HM系列产品。但是在支持Shader Model 3.0与HDR技术的游戏越来越多的今天,这样的产品已经有些跟不上时代。于是在Radeon X1300系列显卡上市后,ATI很快又发布了Radeon X1300HM。而NVIDIA阵营的GeForce 7300GS显卡则早已上市。
  同样是具备共享显存技术的低端PCI Express显卡,谁更能省钱?谁效率更高?谁性能更好?由于共享显存技术需要调用系统主内存,应该为它们搭配多大容量的内存,才能充分发挥其性能优势?带着这些疑问,我们以当前市场上默认频率最高的Radeon X1300HM和GeForce 7300GS显卡为对象,针对不同环境下的性能进行了详细的测试对比。
  Radeon X1300 HM组:
  七彩虹镭风X1300PRO-GD3 HM白金版拥有4条像素渲染管线,搭配了128MB/128bit规格显存,核心/显存工作频率为650MHz/1000MHz。
  双敏火旋风PCX1318PRO拥有4条像素渲染管线,搭配了128MB/128bit规格显存,核心/显存工作频率为650MHz/1000MHz。
  GeForce 7300GS组:
  七彩虹天行7300GS-GD3超频利器拥有4条像素渲染管线,搭配了128MB/64bit规格显存,核心/显存工作频率为575MHz/1200MHz。
  双敏速配PCX7316GS PRO超强版拥有4条像素渲染管线,搭配了128MB/64bit规格显存,核心/显存工作频率为575MHz/1200MHz。
  测试平台
  主板: WinFast NF4SK8AA-8KRS(nForce4 SLI)
  CPU: Athlon 64 FX-53(2.4GHz)
  CPU散热器: Thermaltake Silent939 K8
  内存: 超胜DDR400 256MB、富豪DDR400 512MB×2
  硬盘: 希捷酷鱼7200.7 80GB
  电源: 鑫谷速核535PE超频卫士
  操作系统: Windows XP Professional SP2
  DirectX版本:DirectX 9.0c
  主板驱动: nForce4 6.70WHQL
  显示驱动: ATi催化剂6.4
  ForceWare 84.26WHQL
  第一场:基准软件测试
  在3DMark03和3DMark05的基准测试当中,可以看到无论是Radeon X1300HM,还是GeForce 7300GS,当内存容量从256MB、512MB一直增加到1GB之后,其成绩虽然有所增加,但都不是非常明显。
  而在对系统硬件资源要求极高的3DMark06测试中,情况发生了很大的变化。Radeon X1300HM在256MB内存和512MB内存环境下的得分差距被拉开,但512MB与1GB之间的差距依然不明显,甚至在SM2.0测试中还出现了1GB成绩低于512MB的现象,并且反复测试都是同样的结果。
  至于GeForce 7300GS,则出现了“两极分化”的态势。在512MB与1GB两种内存环境下,3DMark06得分没有任何差别。而当内存容量减小到256MB之后,其成绩却出现了大幅的下跌。这说明一方面,用户即使只有512MB内存也能得到媲美1GB的速度;而另一方面,如果用户的内存容量只有256MB甚至更低,那么其HDR等性能也会大打折扣。
  第二场:实际游戏测试
  在实际游戏测试当中,我们选择了FarCry、DOOM3、Half Life 2、F.E.A.R、Serious Sam 2等5款当前最流行和具有代表意义的游戏。考虑到低端显卡一般以保持3D游戏的流畅运行为侧重点,因此我们选择了1024×768作为本次测试的标准分辨率。
  在FarCry这项测试中,出现了与3DMark06相类似的结果。Radeon X1300HM在256MB和512MB两种不同的内存容量下,成绩出现了明显差异。而当内存容量增加到1GB后,也有大约10%的提升。而GeForce 7300GS在内存容量从256MB提升到512MB后,性能几乎提升了50%。而当内存从512MB增加到1GB以后,FPS的提升幅度仅有8%左右。
  在DOOM3的测试中,由于需要调用大量纹理数据,所以在第一次运行DOOM3的Timedemo时,其FPS值会明显偏低,一般连续运行两次以后成绩便会稳定下来。因此评测人员在跑DOOM3测试时,常常会取第2次Timedemo的成绩作为最后结果。然而当内存容量降低到256MB以后,我们发现一项测试需要重复跑3次以上成绩才能稳定下来。不过我们看到无论是256MB、512MB还是1GB内存,成绩稳定后的FPS值仅有非常微小的差距。
  在Half Life 2的测试当中,由于游戏本身对硬件的要求并不算太高,所以在6种不同的配置下运行都非常流畅。从测试的结果我们可以看到,无论是Radeon X1300HM还是GeForce 7300GS,当内存容量从256MB、512MB一直增加到1GB后,其FPS值始终呈现递增趋势,但增长幅度都不算大。
  作为最新的3D游戏大作之一,F.E.A.R对硬件的要求明显要比之前的几位“前辈”们高得多。在这项测试当中,在1024×768的分辨率下打开最高画质,居然没有一个项目能够始终保持画面流畅。而在不同内存容量的对比中,我们可以看到当内存容量从256MB提升到512MB的时候,Radeon X1300HM的游戏速度有了33.3%的提升,GeForce 7300GS的提升幅度也达到了25%;而当内存容量从512MB提升到1GB以后,游戏速度却几乎没有什么变化。
  Serious Sam 2是本次测试中对硬件配置要求最高的游戏,在打开HDR最高画质后,所有测试项目没有一个FPS能超过30。从测试结果我们也可以看到,内存的容量大小对游戏速度有着立竿见影的影响。当内存容量从256MB增加到512MB时,Radeon X1300HM的成绩有了翻番的提升,增加幅度达到了103.5%;而GeForce 7300GS的增加幅度也达到了80.6%,同样非常明显。当内存容量从512MB再增加到1GB时,Radeon X1300HM的提升幅度达到了66.9%,GeForce 7300GS则增加了30.6%。
  从实际游戏测试的结果,不难看出256MB内存已经显得捉襟见肘;在较新的3D游戏中,即使512MB内存也难以让Radeon X1300HM和GeForce 7300GS尽情施展。因此要想充分发挥HyperMemory与TurboCacheII技术的优势,1GB以上容量的内存是比较理想的选择。
  结果点评
  在点评之前,我们先来看几个数据:单是从制造工艺和核心晶体管数目来看,Radeon X1300HM所采用的RV515图形芯片,与GeForce 7300GS所采用的G72图形芯片可以说不相伯仲。不过RV515集成了128bit显存控制器,而G72只有64bit。这直接导致了两块显卡的制造成本有着明显差异。
  再来看看显存部分。Radeon X1300HM采用了4颗8Mx32bit的144pin封装2.0ns GDDR3显存颗粒,组成了128MB/128bit的显存规格。而GeForce 7300GS仅仅采用了2颗16Mx32bit的136pin封装1.4ns GDDR3显存颗粒,显存规格为128MB/64bit。显然后者在成本控制上更加游刃有余。
  不过显存位宽的限制,也导致GeForce 7300GS即使搭配更高速的显存,其显存带宽也仅为Radeon X1300HM的60%。这种差距在F.E.A.R等需要频繁进行大量数据传输的3D游戏中表现得尤其明显。另外除了显存带宽优势,Radeon X1300HM的核心频率也比GeForce 7300GS更高。因此除了Serious Sam 2等少数游戏,Radeon X1300HM在性能上几乎一路领先。并且凭借极高的工作频率,它在部分测试中的得分甚至已经超越了Radeon 9800PRO。
  但是从效能方面来说,仅仅具备64bit显存位宽的GeForce 7300GS,也已经拥有了超越Radeon X550XT、GeForce 6600LE等“双128”规格显卡的表现。这完全颠覆了以往人们对64bit显卡“低价低能”的印象,实属难能可贵。不过我们也看到,虽然GeForce 7300GS的成本要远低于Radeon X1300HM,但是这并没有从产品的零售价格中体现出来。因此预计NVIDIA近期会对低端产品的价格进行调整。
  性能、成本与价格的错位
  在显卡领域,虽然ATI与NVIDIA一直都热衷于3D性能王座的争夺,但是对于广大的消费者来说,最终选择的只会是自己买得起的产品。因此在最能体现产品受欢迎程度的市场占有率上,价格平易近人的低端显卡有着举足轻重的地位。两大图形芯片巨头对这片市场也一直不敢掉以轻心。不过在低端显卡的成本控制和市场推广上,ATI与NVIDIA却表现出了截然不同的态度。
  在三年以前,ATI曾经推出过64bit显存位宽的Radeon 9600SE,但是这款产品却在零售市场惨遭败绩。显然这个教训给ATI留下了非常深刻的印象。因为之后我们看到ATI在零售市场的低端主打显卡,几乎清一色是128bit的显存位宽。64bit的产品大多针对的是OEM市场。
  而另一方面,从GeForce 6200TC、6200A、6500一直到最新的7300GS,似乎NVIDIA对64bit显存位宽却是一直情有独钟。这当然是因为它可以显著降低显卡的制造成本,而且NVIDIA也坚信自己的产品拥有非常高的执行效能,缩减显存位宽带来的性能损失并不会太大。
  但问题还是来了。虽然随着DirectX 9游戏成为主流,如今的3D游戏对显存数据传输带宽的要求已经没有DirectX 8时代那么苛刻。但是从本周的比拼测试我们也看到,在核心/显存工作频率相差不大的前提下,128bit的Radeon X1300HM在大部分测试中的性能还是超过了64bit的GeForce 7300GS——因为前者的显存带宽是后者的1.67倍。从成本上来说,显然GeForce 7300GS要更加低廉;但是从价格来看,这两者却一模一样。这样对于消费者来说,GeForce 7300GS的低成本优势其实并没有得到体现。
  早在两年前ATI刚刚发布Radeon 9550的时候,笔者就曾经撰文以“田忌赛马”来形容当时ATI与NVIDIA在主流市场的对阵形势。当时在相同的价位上,ATI以Radeon 9600PRO、9600、9550分别对阵NVIDIA的GeForce FX 5700、5700LE和5500,优势尽显。之后“超频版”Radeon 9550的出现,更是彻底取代了Radeon 9600和9600PRO的地位。Radeon 9550也由此成为纵横主流显卡市场的一代经典。如今在600元以下的低端显卡市场,我们看到ATI又在力图让历史重演。
  不过市场始终充满变数。既然ATI可以将“双128”的Radeon X1300HM价格拉到599元,那么凭借NVIDIA的技术和实力,成本更加低廉的GeForce 7300GS完全可以打出更令人惊喜的价格。许多关注显卡市场的玩家都知道,现在599元已经可以买到8条像素渲染管线和“双128”规格的GeForce 6600显卡了。可以预见NVIDIA一定会继续在低端市场对ATI发起反攻。因此在暑期销售高潮来临之前,我们不妨先静待一场风暴的上演。
  
  
  
  
  
责任编辑:hgzlxy
  • 上一篇文章:
  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
     相关文章
    唯美与性能的结合
    性能与易用性的和谐
    拒绝火热的性能
     相关评论
    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    用户名:
    · 您将承担一切因您的行为、言论而直接或间接导致的民事或刑事法律责任
    · 留言板管理人员有权保留或删除其管辖留言中的任意内容
    · 本站提醒:不要进行人身攻击与无聊谩骂。谢谢配合。
    热门文章
    最新推荐