GPU历史系列(一):故事从19世纪70年代讲起半导体行业观察 2020-05-02 15:08:45
来源:内容由半导体行业观察(ID:icbank)编译自「techspot」,谢谢。 现代图形卡处理器的发展始于1995年推出的首批3D附加卡,随后广泛采用32位操作系统和价格合理的个人计算机。 在此之前存在的图形卡业主要由更加平凡的2D非PC架构组成,图形卡因其芯片的字母数字命名约定和巨大的价格标签而闻名。3D游戏和虚拟化PC图形卡最终从诸如街机和控制台游戏,军事,机器人技术和太空模拟器以及医学成像等多种来源融合在一起。 早期的3D消费者图形卡的相互竞争的“狂野西部”。从如何实现硬件到使用不同的渲染技术及其应用程序和数据接口,甚至夸张的命名。早期的图形卡系统具有固定功能流水线(FFP)和遵循非常严格的处理路径的体系结构,该路径使用了几乎与3D芯片制造者一样多的图形卡API。 尽管3D图形卡将相当乏味的PC行业变成了光彩夺目的表演,但它们的存在却要归功于几代人的创新努力。本文深入研究了GPU的历史。从3D消费者图形卡的早期发展到3Dfx Voodoo游戏改变者,世纪之交的行业整合以及当今的现代GPGPU。 3D消费者图形卡的早期 第一个真正的3D图形卡始于早期的显示控制器,即视频移位器和视频地址生成器(video shifters and video address generators)。它们充当主处理器和显示器之间的直通通道(pass-through)。传入的数据流被转换为串行位图视频输出,例如亮度,颜色以及垂直和水平复合同步,这将像素行保持在显示生成中,并同步每条连续行以及消隐间隔(时间间隔为 结束一条扫描线并开始下一条扫描线)。 1970年代下半叶出现了一系列设计,为我们所熟知的3D图形卡奠定了基础。例如,RCA的1976年“ Pixie”视频芯片(CDP1861)能够输出62x128分辨率或不适用于RCA Studio II控制台的64x32的NTSC兼容视频信号。 紧随一年后,电视芯片之后是电视接口适配器(TIA)1A,该适配器已集成到Atari 2600中,用于生成屏幕显示,声音效果和读取输入控制器。TIA的开发由杰伊·迈纳(Jay Miner)领导,他后来还领导了Commodore Amiga计算机的定制芯片设计。 1977年9月发布的Atari 2600 1978年,摩托罗拉推出了MC6845视频地址发生器。这成为1981年IBM PC的单色和彩色显示适配器(MDA / CDA)卡的基础,并且为Apple II提供了相同的功能。摩托罗拉于同年晚些时候添加了MC6847视频显示生成器,并将其引入了许多第一代个人计算机,包括Tandy TRS-80。 Commodore的MOS Tech子公司VIC的类似解决方案为1980-83年为老式Commodore家用计算机提供了图形卡输出。 次年11月,LSI的ANTIC(字母数字电视接口控制器)和CTIA / GTIA协处理器(彩色或图形卡电视接口适配器)在Atari 400上首次亮相.ANTIC使用直接存储器访问(DMA)处理2D显示指令。像大多数视频协处理器一样,它可以生成运动场图形卡(背景,标题屏幕,得分显示),而CTIA可以生成颜色和可移动对象。雅马哈和德州仪器(TI)向各种早期家用计算机供应商提供了类似的IC。 IBM PC的单色显示适配器 图形卡发展的下一步主要是在专业领域。 英特尔将他们的82720图形卡芯片用作价格为1000美元的iSBX 275视频图形卡控制器多模式板的基础。它能够以256x256的分辨率(或以512x512的单色)显示八种颜色数据。其32KB的显示内存足以绘制线,弧,圆,矩形和字符位图。该芯片还提供了缩放,屏幕分区和滚动的功能。 SGI迅速推出了用于工作站的IRIS图形卡-GR1.x图形卡板,其中提供了用于颜色选项,几何图形卡,Z缓冲区和覆盖/底层的单独的外接(子)板。 英特尔售价为1000美元的iSBX 275视频图形卡控制器多模板能够以256x256分辨率(或512x512单色)显示八种彩色数据。 当时,工业和军事3D虚拟化技术相对完善。IBM,通用电气和Martin Marietta(1992年将收购通用电气的航空部门),以及大量的军事承包商,技术研究所和美国国家航空航天局(NASA)开展了各种项目,这些项目需要技术用于军事和太空模拟。海军在1951年还利用麻省理工学院的Whirlwind计算机使用3D虚拟化技术开发了飞行模拟器。 除了国防承包商以外,还有一些公司用专业图形卡跨越军事市场。 Evans&Sutherland将提供诸如Freedom和REALimage之类的专业图形卡卡系列,还为CT5飞行模拟器提供了图形卡,CT5飞行模拟器由DEC PDP-11大型机驱动,耗资2000万美元。该公司的共同创始人伊凡·萨瑟兰(Ivan Sutherland)于1961年开发了一个名为Sketchpad的计算机程序,该程序可以绘制几何形状并使用光笔在CRT上实时显示。 这是现代图形卡用户界面(GUI)的起源。 在不太重要的个人计算机领域中,Chips and Technologies的82C43x系列EGA(扩展图形卡适配器)为IBM适配器提供了急需的竞争,并且可以在1985年左右安装在许多PC / AT克隆中。同时Commodore Amiga也安装了OCS芯片组。该芯片组由三个主要组件芯片-Agnus,Denise和Paula组成,它们允许一定数量的图形卡和音频计算,不依赖CPU。 1985年8月,三名香港移民Kwok Yuan Ho,Lee Lau和Benny Lau在加拿大成立了Array TechnologyInc。到今年年底,名称已更改为ATI TechnologiesInc。 ATI在第二年推出了他们的第一款产品,即OEM颜色仿真卡。它用于通过9针DE-9连接器将黑色背景的单色绿色,琥珀色或白色磷光体文本输出到TTL监视器。该卡至少配备了16KB的内存,在ATI公司运营的第一年中,销售额就占了ATI 1000万加元的很大一部分。这主要是通过一项合同完成的,该合同每周为Commodore Computers提供大约7000个芯片。 ATI的Color Emulation Card至少具有16KB的存储空间,并在公司运营的第一年1000万加元的销售额中占了很大一部分。 彩色监视器的出现以及一系列竞争对手之间缺乏标准最终导致了视频电子标准协会(VESA)的成立,ATI是该协会的创始成员,NEC和其他六个图形卡适配器制造商也是该协会的成员。 1987年,ATI在其OEM产品线中增加了Graphics Solution Plus系列,该产品线将IBM PC / XT ISA 8位总线用于基于Intel 8086/8088的IBM PC。该芯片通过DIP开关支持MDA,CGA和EGA图形卡模式。它基本上是Plantronics Colorplus板的克隆,但有64kb的存储空间。1987年发布的Paradise Systems的PEGA1、1a和2a(256kB)也是Plantronics的克隆。 ATI EGA 800:16色VGA仿真,支持800x600 并非只有ATI带动了消费者对个人计算的需求。 那年有许多新公司和产品问世。其中Trident,SiS,Tamerack,Realtek,Oak Technology,LSI的G-2 Inc.,Hualon,Cornerstone Imaging和Winbond都成立于1986-87年。同时,AMD,西部数据/天堂系统,Intergraph,Cirrus Logic,Texas Instruments,Gemini和Genoa等公司将在此期间生产首批图形卡产品。 ATI的Wonder系列在接下来的几年中继续获得了惊人的更新。 1988年,带有游戏控制器端口和复合输出选项的Small Wonder Graphics解决方案问世(用于CGA和MDA仿真),以及具有扩展EGA和16位VGA支持的EGA Wonder 480和800+,以及VGA 新增了VGA和SVGA支持的Wonder和Wonder 16。 1989年推出了更新的VGA Wonder / Wonder 16系列,其中包括降低成本的VGA Edge 16(Wonder 1024系列)。新功能包括一个总线鼠标端口,并支持VESA功能连接器。这是一个金手指连接器,类似于缩短的数据总线插槽连接器,它通过带状电缆链接到另一个视频控制器,以绕过拥挤的数据总线。 1991年,Wonder系列的更新继续向前发展。WonderXL卡增加了VESA 32K颜色兼容性和Sierra RAMDAC,从而将最大显示分辨率提高到640x480 @ 72Hz或800x600 @ 60Hz。 ATI图形卡Ultra ISA(Mach8 + VGA) Mach系列于同年5月与Mach8一同推出。它以芯片或电路板的形式出售,可以通过编程接口(AI)卸载有限的2D绘图操作,例如线条画,颜色填充和位图组合(Bit BLIT).ATI添加了Wonder的一种变体 XL在扩展PCB上集成了Creative Sound Blaster 1.5芯片。它被称为VGA Stereo-F / X,它能够模拟Sound Blaster单声道文件中的立体声,并且其质量接近FM广播质量。 诸如ATI VGAWonder GT之类的图形卡板提供了2D + 3D选项,将Mach8与VGA Wonder +的图形卡核心(28800-2)结合在一起以实现其3D功能。Wonder和Mach8推动ATI在这一年度实现了1亿加元的销售里程碑,这主要是由于Windows 3.0的采用以及可用于该平台的2D工作量的增加。 S3 Graphics成立于1989年初,并在18个月后生产了其首个2D加速器芯片和一个图形卡卡,即S3 911(或86C911)。后者的主要规格包括1MB的VRAM和16位色彩支持。 S3 911在同年被924所取代-基本上是24位色的911修订版-第二年又更新了928,增加了32位色,以及801和805加速器。801使用ISA接口,而805使用VLB。从911的问世到3D加速器的问世,市场上充斥着基于S3原始设计的2D GUI设计-特别是来自Tseng实验室,Cirrus Logic,Trident,IIT,ATI的Mach32和Matrox的MAGIC RGB。 1992年1月,Silicon Graphics Inc(SGI)发布了OpenGL 1.0,这是一个针对2D和3D图形卡的多平台供应商不可知的应用程序编程接口(API)。 微软正在开发自己的竞争对手Direct3D API,并没有确保OpenGL在Windows下也能正常运行。 OpenGL是从SGI专有的API(称为IRIS GL(集成的栅格成像系统图形卡库))演变而来的。这是一项旨在保留IRIS非图形卡功能并允许API在非SGI系统上运行的计划,因为竞争对手的供应商开始使用自己的专有API来望而却步 最初,OpenGL瞄准的是基于UNIX的专业市场,但是由于开发人员对扩展实施的友好支持,很快将其用于3D游戏。 微软正在开发自己的竞争对手API,称为Direct3D,并没有竭尽全力确保OpenGL在新的Windows操作系统下也能正常运行。 几年后,ID软件公司的约翰·卡马克(John Carmack)(之前发布的《毁灭战士》(Doom)彻底改变了个人电脑游戏),将Quake移植到Windows上使用OpenGL并公开指责Direct3D的事情发生了。 快进:1997年发布的GLQuake与原始Quake相比 由于微软拒绝在Windows 95上使用OpenGL的微型客户端驱动程序(MCD)的许可,微软的顽固性增加,这将使供应商能够选择哪些功能可以使用硬件加速。SGI通过开发可安装客户端驱动程序(ICD)进行了答复,该功能不仅提供了相同的功能,而且由于MCD仅覆盖光栅化并且ICD添加了照明和变换功能(T&L),因此做得更好。 在OpenGL的兴起(最初在工作站领域引起关注)期间,Microsoft忙于通过其专有API进行设计的新兴游戏市场。他们于1995年2月收购了RenderMorphics,其Reality Lab API受到开发人员的青睐,并成为Direct3D的核心。 大约在同一时间,3dfx的Brian Hook正在编写Glide API,该API将成为游戏的主要API。部分原因是微软参与了Talisman项目(一个基于图块的渲染生态系统),该项目稀释了DirectX的资源。 随着Windows的普及,D3D变得广泛可用,专有API诸如S3d(S3),Matrox Simple Interface,Creative图形卡库,C Interface(ATI),SGL(PowerVR),NVLIB(Nvidia),RRedline(Rendition)和Glide,开始受到开发人员的青睐。 将其中一些专有的API与电路板制造商结盟,以增加添加到快速扩展的功能列表的压力越来越大,这无济于事。这包括更高的屏幕分辨率,增加的色彩深度(从16位增加到24位,然后是32位)以及图形质量增强(例如抗锯齿)。所有这些功能都要求增加带宽,图形卡效率和更快的产品周期。 到1993年,市场动荡已经迫使许多图形卡公司退出业务,或被竞争对手收购。 1993年迎来了一系列新的图形卡竞争者,其中最著名的就是英伟达(Nvidia),该公司于当年1月由黄仁勋,Curtis Priem和Chris Malachowsky创立。Huang以前是LSI的核心软件总监,而Priem和Malachowsky都来自Sun Microsystems,他们之前曾开发过基于SunSPARC的GX图形卡架构。 此后不久,Dynamic Pictures,ARK Logic和Rendition也加入了Nvidia。 市场动荡已经迫使许多图形卡公司退出业务,或被竞争对手收购。其中包括Tamerack,Gemini Technology,Genoa Systems,Hualon,Headland Technology(由SPEA收购),Acer,Motorola和Acumos(由Cirrus Logic收购)。 而ATI不断发展壮大。 作为All-In-Wonder系列的先驱,11月下旬宣布了ATI的68890 PC电视解码器芯片的发布,该芯片首次在Video-It!卡里面亮相。借助板载Intel i750PD VCP(视频压缩处理器),该芯片能够以320x240 @ 15 fps或160x120 @ 30 fps捕获视频,并能够实时压缩/解压缩。它还能够通过数据总线与图形卡板通信,从而无需使用加密狗或端口和带状电缆。 5个月后的3月,ATI迟迟推出了64位加速器。Mach64。 在竞争激烈的市场中,ATI亏损了270万加元,对ATI来说不是好事。竞争对手的主板包括许多主板供应商选择的S3 Vision 968,以及Trio64,后者从Dell(Dimension XPS),Compaq(Presario 7170/7180),AT&T(Globalyst),HP(Vectra VE 4)签订了OEM合同。)和DEC(文丘里斯/ Celebris)。 Vision 968:S3的首个运动视频加速器 Mach64于1995年发布,创造了许多著名的首创。它成为第一个以Xclaim形式在PC和Mac计算机上使用的图形卡适配器,并且与S3的Trio一起提供了全动态视频播放加速功能。Mach64还迎来了ATI的首款专业显卡,即3D Pro Turbo和3D Pro Turbo + PC2TV。 ATI Mach64 VT支持电视调谐器 次月,一家名为3DLabs的技术初创公司问世,该公司诞生于杜邦的Pixel图形卡部门从其母公司手中收购了子公司,以及能够进行OpenGL渲染,片段处理和光栅化的GLINT 300SX处理器。由于价格昂贵,该公司的卡最初是针对专业市场的。 。 1995年的游戏GLINT 300SX减少了2MB的内存。它为纹理和Z缓冲区使用了1MB,为帧缓冲区使用了1MB,但是还提供了一个选项,以增加VRAM的Direct3D兼容性。该卡未能在一个人满为患的市场中取得进展,但是3DLabs已经在Permedia系列的后续产品上进行开发。 那时S3似乎无处不在。该公司的Trio64芯片组主导了高端OEM厂商,该芯片组将DAC,图形卡控制器和时钟合成器集成到单个芯片中。他们还利用了统一的帧缓冲器和受支持的硬件视频覆盖(图形卡存储器的专用部分,用于根据应用程序的要求渲染视频)。Trio64及其32位内存总线兄弟产品Trio32可作为OEM单元和独立卡,可从Diamond,ELSA,Sparkle,STB,Orchid,Hercules和Number Nine等供应商处获得。 市场的主流终端还包括Trident的产品,Trident是一家长期提供免费装饰的2D图形卡适配器的OEM供应商,最近又将9680芯片添加到其产品阵容中。该芯片拥有Trio64的大多数功能,主板的价格一般在170-200美元左右。他们在该支架中提供了可接受的3D性能,并具有良好的视频播放功能。 主流市场上的其他新手包括Weitek的Power Player 9130和Alliance Semiconductor的ProMotion 6410(通常被称为Alaris Matinee或FIS的OptiViewPro)。两者都提供了出色的缩放速度和CPU速度,而后者则将强大的缩放引擎与防阻塞电路相结合以获得流畅的视频播放,这比ATI Mach64,Matrox MGA 2064W和S3 Vision968等以前的芯片要好得多。 Nvidia于5月推出了他们的第一款图形卡芯片NV1,并成为首款能够进行3D渲染,视频加速和集成GUI加速的商业图形卡处理器。 他们与意法半导体(ST Microelectronic)合作,以其500nm工艺生产该芯片,后者还推广了该芯片的STG2000版本。尽管这不是一个巨大的成功,但它确实代表了该公司的首次财务回报。对于Nvidia而言,不幸的是,就在9月份第一批供应商主板开始发售(特别是Diamond Edge 3D)时,Microsoft最终确定并发布了DirectX 1.0。 D3D图形卡API确认它依赖于渲染三角形多边形,而NV1则使用四边形纹理映射。通过驱动程序添加了有限的D3D兼容性,以将三角形包装为二次曲面,但是由于缺少针对NV1量身定制的游戏,该卡成为了各行各业的杰作,无所不能。 大多数游戏都是从世嘉土星移植的。带有集成土星端口的4MB NV1(每个扩展支架通过带状电缆连接到插卡两个)在1995年9月的零售价约为450美元。 微软的最新更改和DirectX SDK的发布使主板制造商无法直接访问用于数字视频播放的硬件。这意味着几乎所有独立显卡在Windows 95中都存在功能问题。相比之下,来自各种公司的Win 3.1下的驱动程序通常都没有问题。 次年5月在洛杉矶举行的E3电子游戏大会上首次公开展示了它。该卡本身在一个月后可用。3D Rage将Mach64的2D核心与3D功能合并在一起.1995年11月,ATI宣布了他们的首个3D加速器芯片3D Rage(也称为Mach 64 GT)。 对DirectX规范的最新修订意味着3D Rage与许多使用该API的游戏存在兼容性问题-主要是缺乏深度缓冲。使用板载2MB EDO RAM帧缓冲区时,3D模态限制为640x480x16位或400x300x32位。在600x480上尝试32位颜色通常会导致屏幕上的颜色损坏,并且2D分辨率达到1280x1024的峰值。如果游戏性能中等,则全屏MPEG播放功能至少可以平衡功能集。 3Dfx Voodoo Graphics有效地消灭了所有竞争,因此性能竞赛在开始之前就结束了。 ATI重新设计了芯片,并于9月发布了Rage II。除了增加了MPEG2播放支持外,它还纠正了第一款芯片的D3DX问题。但是,初始卡仍附带2MB的内存,从而影响了性能,并影响了透视/几何转换。随着系列的扩展,包括Rage II + DVD和3D Xpression +,内存容量选项增加到8MB。 尽管ATI率先将3D图形卡解决方案推向市场,但对于具有不同3D实现理念的其他竞争对手出世,并没有太多时间。即3dfx,Rendition和VideoLogic。 Screamer 2, released in 1996, running on Windows 95 with 3dfx Voodoo 1 graphics Screamer 2,于1996年发布,在带有3dfx Voodoo 1图形卡的Windows 95上运行 在向市场发布新产品的竞赛中,3Dfx Interactive赢得了Rendition和VideoLogic的青睐。然而,性能竞赛在开始之前就结束了,3Dfx Voodoo Graphics有效地消灭了所有竞争。 ★ 点击文末【阅读原文】,可查看本文原链接。 *免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。 今天是《半导体行业观察》为您分享的第2297期内容,欢迎关注。 ★欧洲半导体三驾马车的“乱世”变局 ★华为2019都经历了什么? ★2020年,国产射频PA究竟如何? 中国半导体|苹果|封测|蓝牙|设备|晶圆|英伟达|射频|台积电
GPU历史系列(二):改变游戏规则的3Dfx Voodoo半导体行业观察 2020-05-03 15:06:21
来源:内容由半导体行业观察(ID:icbank)编译自「techspot」,谢谢。 3Dfx的Voodoo于1996年11月推出,它由仅具有3D功能的显卡组成,该显卡需要将VGA线缆从单独的2D卡传递到Voodoo,然后再将其连接到显示器上。 很多公司都出售过这种显卡。Orchid Technologies公司率先推出了售价299美元的“Orchid Righteous 3D”芯片,这款产品以其内置的机械继电器在芯片使用时能够发出“clicked”声而闻名。后来他们使用了固态继电器,与其他供应商保持一致。除此以外,基于Voodoo而设计的芯片还有:Diamond Multimedia的Monster 3D, Colormaster的Voodoo Mania, Canopus Pure3D, Quantum3D, Miro Hiscore, Skywell (Magic3D)和2theMAX Fantasy FX Power 3D。 Voodoo Graphics几乎在一夜之间彻底革新了个人计算机中的图形处理器,超越了大量的仅能提供2D图形设计的供应商。1996年的3D环境使S3占据了大约50%的市场份额。据估计,在Voodoo统治的鼎盛时期,3Dfx占据了3D加速器市场80-85%的份额。但是,这种情况很快发生了变化。 Diamond Multimedia的Monster 3D(3dfx Voodoo1 4MB PCI) 大约在那个时候,VideoLogic开发了一种基于图块的延迟渲染技术(TBDR),该技术在纹理、阴影和光照应用于剩下的渲染之前,抛弃了所有可见的几何形状,从而消除了对大规模z缓冲(在最终渲染中去除遮挡/隐藏的像素)的需求。这个过程产生的框架被分割成矩形块,每个图块都可以自行进行多边形渲染并发送到输出。一旦计算了帧所需的像素并剔除了多余的多边形(z缓冲只在平铺层发生),对多边形渲染就开始了。这样,只需要进行最基本的计算。 前两个系列的芯片和显卡由NEC公司制造,而第三个系列(Kyro)芯片则由ST Micro公司制造。第一张显卡只用于Compaq Presario PC,即众所周知的Midas 3 (Midas 1和2是基于arcade系统项目的原型)。PCX1和PCX2则作为OEM部件。 系列2芯片最初用在了Sega的Dreamcast游戏机上。但是,到1999年11月桌面Neon 250上市销售时,它在169美元的价位上被无情地超越,败于更高分辨率的32位彩色显卡上。 在Neon 250面世之前,Rendition的VéritéV1000成为第一张具有可编程核心的显卡,它使用了基于MIPS的RISC处理器和Pixel Pipelines(像素管线)。处理器负责设置和组织管线的工作负载。 Vérité1000最初于1995年底开发,后来成为Microsoft用于开发Direct3D的主板之一。不幸的是,由于Rendition使用此方法需要在PCI接口上传输数据,因此该卡需要能够支持能够进行直接内存访问(DMA)的主板芯片组。与Voodoo Graphics上市之前的几乎所有其他消费类图形卡相比,V1000的表现都不错,后者的3D性能要高出一倍以上。该板相对便宜,并且提供了良好的功能集,包括包括为预算较低的游戏玩家提供edge反锯齿功能,以及ID软件的Quake的硬件加速功能。然而,游戏开发者们很快就放弃了DMA传输模型,因为这种方式不太受欢迎。 与1996年一样,1997年被证明是消费类图形行业又一个繁忙的一年。 ATI推出了Rage II,随后在3月份又推出了3D Rage Pro。后者是ATI 3D工程组(该小组成立于1995年)推出的第一张AGP 2x卡,这也是他们的第一款产品。 ATI 3D Rage Pro Pro在4MB格式下几乎可以媲美Voodoo Graphics的性能,在使用8MB和AGP接口时,其性能则优于3Dfx卡。由于扩展了4kB高速缓存并增加了边缘抗锯齿功能,该显卡改进了Rage II的透视校正,纹理处理能力以及三线性滤波性能。还集成了一个浮点单元,以减少对CPU的依赖以及对DVD的硬件加速和显示支持。 总而言之,Rage Pro大大增加了ATI的利润,帮助该公司实现了4,770万加元的销售利润,销售额超过了6亿美元。这种成功的大部分来自OEM合同,与消费者和服务器主板的集成以及移动版本。该卡的价格(通常以Xpert @ Work和Xpert @ Play的形式出售)也有所不同:2MB版本的170美元、4MB版本的售价在200-230美元之间,8MB版本则270-300美元之间。其16MB版本售价超过$ 400。 ATI通过以300万美元的价格收购了Tseng Labs的IP来增强他们的产品组合,并于1997年12月聘用了该公司的40名工程师。这是一笔很划算的交易,但因为Tseng未能将RAMDAC整合到其显卡中,导致ATI销售额大幅下降,从1996年的1240万美元降至1997年的190万美元。 3DLabs于1997年3月发布了Permedia(“Pervasive 3D”)系列板卡的修订版,该产品基于德州仪器的350nm制程,而不是之前其所采用的IBM的上一版本的Permedia制程和Permedia NT制程。第一个版本的性能低于标准,而NT型号则由于采用了全三角和AA设置的附加Delta芯片而有所改进,但它的价格达到了300美元。基于Permedia 2的卡已于年底开始发货,但它们并未与游戏重量级产品并驾齐驱,而是作为具有中等3D图形功能的半专业2D卡进行销售的。 ATI和3DLabs更新产品线一个月后,Nvidia推出了RIVA 128(实时交互式视频和动画加速器),并通过渲染三角形多边形增加了Direct3D兼容性。 Nvidia选择了与意法半导体进行合作,意法半导体使用新的350nm工艺生产了该芯片,并开发了RAMDAC和视频转换器。尽管最初的驱动程序存在问题(尤其是在虚幻引擎上),但该卡在Quake 2和3等游戏中表现出了足够的性能,超过了许多基准评测。 Diamond Viper V330 PCI (Nvidia RIVA 128) 这被证明是自1993年以来英伟达一直在寻找的具有里程碑意义的显卡。英伟达要想维持供应就需要把目光放得更远,这对于他们来说是未来经济和成功的关键所在。因此,他们与台积电签署了一项制造协议,与ST Micro一起供应Riva 128ZXs。在1997年底,Nvidia的3D图形市场份额估计为24%,仅次于3Dfx Interactive,排名第二,这主要归功于Riva 128/128ZX。 即使最终合同给了NEC / VideoLogic,但Sega也将NV2纳入了Dreamcast 游戏机中可能采用的图形芯片中,这也增加了Nvidia的收入。 . Rival 3Dfx还与Sega合作进行了该项目,并且据信Rival 3Dfx是为游戏机提供硬件的人,直到后者终止了合同。3Dfx提起了一项1.55亿美元的诉讼,声称它被Sega公司误导,相信他们承诺使用3Dfx硬件,并让他们访问与图形IP相关的机密材料。一年后,他们以1050万美元的价格达成庭外和解。 3Dfx based Sega BlackBelt prototype Dreamcast“Black Belt”项目只是3Dfx Interactive忙碌的一年的一个方面。 Quantum 3D于1997年3月31日从3Dfx剥离而来。SGI和Gemini Technology与该公司合作,利用3Dfx的新SLI(扫描线交错)技术开发了非常高端的发烧友和专业图形解决方案。这涉及使用子卡,该子卡具有通过头连接的第二个芯片组和内存,或者使用带状线缆连接的两个或多个卡,其方式与Nvidia的SLI和AMD的Crossfire目前采用的概念相同。连接在一起后,每张卡(如果是单板SLI卡,则为逻辑块)每一帧都为显示贡献了一半的扫描线。 SLI还将最大屏幕分辨率从800 x 600像素增加到1024 x 768像素。一款Obsidian Pro 100DB-4440(两张单卡,每张都带有一个Amethyst子卡)零售价为2500美元,而单卡SLI解决方案(如100SB-4440和4440V)则需要1895美元。 在1997年夏季,3Dfx宣布了其首次公开募股并推出了Voodoo Rush,试图提供具有2D和3D功能的单卡。但是,最终产品无法使用Rampage芯片,导致Voodoo的销量下降。该卡的SST-1芯片可以处理Glide API游戏,而不达标的Alliance (甚至更差的Macronix芯片)却可以处理其他3D游戏和2D应用程序。Voodoo Rush还导致了屏幕失真,因为3Dfx芯片/内存运行在50MHz,而Alliance AT25运行在72MHz。 由于Voodoo Rush的帧缓冲区由于在3D和2D芯片之间共享而被减半,从而其分辨率限制在了512x384左右,因此情况变得更糟。此外,它的刷新率也下降了,Alliance和Macronix芯片则分别限于175和160MHz RAMDAC。 Voodoo Rush推出后不久,基于Sunnyvale的Rendition就发行了VéritéV2100和V2200。这些显卡在性能上仍然无法与第一个Voodoo匹敌,并且与预算有限的Rush几乎没有竞争力。该公司的研发大大落后于竞争对手,并且游戏开发商对该显卡的兴趣也不大,因此成为Rendition的最后一款商用图形产品。 Rendition还在进行其他各种项目,包括在V2100/V2200中添加富士通的FXG-1几何处理器,这是一种双芯片的方法,其他供应商正在努力将其集成到一个芯片中。因此,美光于1998年9月以9300万美元的价格收购了该公司,希望将LSI的嵌入式DRAM技术与Rendition的图形专业技术结合,但由FXG-1驱动(并以光荣命名)的 Hercules Thriller Conspiracy 显卡以及V3300和4400E仍未完成。 Rendition Verite V2200 reference board 随着功能集和性能的提高,图形卡的价格也随之提高,许多无法抵御ATI,Nvidia和3Dfx上涨趋势的供应商争相进入200美元以下的市场。 Matrox以120-150美元的价格发布了Mystique(由于缺少OpenGL支持而受到限制),而S3的ViRGE系列基本款售价在120美元左右,而DX和GX分别涨到了150美元和200美元。S3将其产品线多样化以确保稳定的销售流,增加了具有动态电源管理(ViRGE/MX)的移动卡,以及具有TV-Out、S-Video和辅助DVD播放功能的桌面ViRGE/GX2。 Cirrus Logic的Laguna 3D系列,Trident的9750/9850,SiS的6326,这些都吸引了游戏玩家的注意力。但对于Laguna3D来说,与S3的ViRGE VX等价格相近的卡相比,99美元的便宜价格却不足以弥补性能下降、3D图像质量差和一致性问题。 Laguna3D发布后,Cirrus Logic很快就离开了图形显卡行业。在此之前,他们还以50美元的价格提供了一系列廉价的16位彩色图形适配器,其中最著名的是Diamond SpeedStar系列和Orchid Kelvin 64。 Trident也瞄准了入门级的产品,在5月份他们推出了3DImage 9750,不久之后又推出了升级版9850,支持AGP 2x总线。9750是一种PCI和AGP 1x显卡,但存在着各种图形质量和渲染问题。9850解决了其中一些问题,但是纹理过滤方面仍存在问题。 SiS在6月加入了 budget 3D图形市场,推出6326,价格通常在40-50美元之间。该显卡提供了良好的图像质量,并优于许多其他budget卡。6326在性能领域从未受到威胁,在1998年售出了700万台。 在1997年6月的Assembly游戏活动中,BitBoys向全世界发布了他们的Pyramid3D图形。这个被大肆宣传的项目是Silicon VLSI Solutions Oy,TriTech和BitBoys共同努力的结果。 但是Pyramid3D从来没有看到过光明,大量的调试和修订推迟了该项目,TriTech失去了完善的芯片专利诉讼,最终使该公司破产。 Bitboys会在1998年5月15日又宣布了他们的第二个设计,即Glaze3D芯片。他们承诺提供一流的性能,并计划在1999年底发布。随着正式发布的时间临近,BitBoys宣布了修改的设计。在十月份的SIGGRAPH99上,它取消了RAMBUS存储器和存储器控制器,转而采用了英飞凌9MB嵌入式DRAM。 再次由于寻找错误和制造问题导致该项目被取消。 该公司因错过发布日期而声名远扬。Glaze3D后来以代号Axe重新设计,通过支持DirectX 8.1赶上了竞争对手。该新芯片原定于2001年底以Avalanche3D卡的形式首次亮相,与此同时,代号为Hammer的Glaze3D的第三次开发已经承诺支持DirectX 9。 Glaze3D的原型版最初是用芯片生产的,但在英飞凌2001年因财务亏损不断增加而停止生产嵌入式DRAM后,一切都陷入了停顿。由于缺少制造合作伙伴,Bitboys最终放弃了桌面图形,转而专注于移动图形IP。 BitBoys的退出和AMD的失误:2006年5月,ATI以4,400万美元的价格收购了BitBoys,并宣布开设欧洲设计中心。不久之后,ATI与诺基亚建立了长期的战略合作伙伴关系。仅仅几个月后,当时健康的AMD宣布将以总值54亿美元的高价收购ATI。包括BitBoys人员在内的移动部门更名为Imageon,由于缺乏管理前瞻性,于2009年1月以6500万美元的价格卖给了高通公司。后者继续以Adreno (Radeon的一个变位词)的名义制作图形显卡,作为广受欢迎的Snapdragon SoC的一个组成部分。 英特尔在1998年1月推出了第一个(也是迄今为止最后一个)商用离散3D桌面游戏芯片。i740的起源可以追溯到美国国家航空航天局(NASA)为通用电气(General Electric)的阿波罗太空计划(Apollo space program)进行的一个飞行模拟项目,后来卖给了马丁•玛丽埃塔(Martin Marietta),三年后他与洛克希德公司(Lockheed)合并。Lockheed-Martin将该项目重新定位为Real3D,用于专业的图形产品,尤其是Real3D/100和Real3D/Pro-1000。Sega Model 3街机板中就有两个Pro-1000图形系统。 洛克希德·马丁公司随后与英特尔和Chips and Technologies建立了一个名为Project Aurora的联合项目。英特尔在1月,即i740推出前一个月,购买了Real3D 20%的股份。至此,英特尔已经在1997年7月购买了100%的芯片和技术。 i740结合了R3D/100上两种不同的图形和纹理芯片的资源,但是有点奇怪的是英特尔实现了AGP纹理,但纹理被上传到系统内存中(渲染缓冲区也可以存储在RAM中)。一些设计会选择使用显卡的帧缓冲区用来保存纹理,如果帧缓冲区饱和或纹理太大而无法存储在本地图形内存中,则纹理交换到系统RAM中。 为了最大程度地减少延迟,英特尔的设计使用了AGP Direct Memory Execute(DiME)功能,该功能仅调用光栅化所需的那些纹理,其余的存储在系统RAM中。性能和图像质量是可以接受的,性能大致与上一年的高端产品相匹配。4MB型号的价格为119美元,8MB型号的价格为149美元,反映了英特尔积极的营销策略。i740以英特尔的品牌进行销售,包括:Real3D StarFighter和Diamond Stealth II G450。 Intel740 / i740 AGP graphics board 英特尔设计了经过修改的i752芯片,但是OEM和游戏界普遍缺乏兴趣,导致该公司取消了商业生产。一些板子使它脱离了制造工厂,但像i740一样,它被制成了集成显卡芯片组。 洛克希德·马丁公司于1999年10月关闭了Real3D,相关IP被出售给了英特尔。随后,许多员工搬到了英特尔或ATI。 ATI在1998年2月对Rage Pro进行了改造,基本上包括重命名Rage Pro Turbo,并为合成基准提供了一组高度优化的驱动程序。除了价格标签飙升至449美元外,别无其他。从beta2开始的驱动程序改善了游戏性能。 ATI随后在8月份推出了Rage 128 GL和VR,这是该公司前Tseng实验室工程师开发的首款产品。然而,直到新年之前,零售渠道的供应一直不太理想,这实际上扼杀了ATI在游戏领域打上自己印记的任何机会,就像他们在OEM市场所做的那样。它的配置包括32MB的随机存储器(16MB和32MB的128版本)和一个高效的内存架构,当屏幕分辨率提高和使用32位彩色显示器时,它可以超越Nvidia TNT。不幸的是,不幸的是,对于ATI,当时许多游戏和许多用户的硬件配置都针对16位的。此外,其图像质量与S3和Nvidia的主流竞争对手基本相同,但仍落后于Matrox。 尽管如此,这已经足够让ATI在1998年以27%的市场份额成为最大的图形供应商,净利润1.684亿加元,销售额11.5亿加元。 ATI于当年10月宣布以6700万美元的价格收购Chromatic Research,其MPACT媒体处理器在许多PC TV解决方案中广受青睐-尤其是Compaq和Gateway。这些芯片提供了非常好的2D图形性能,出色的音频和MPEG2播放能力,但是3D游戏性能却受到限制,价格昂贵,大约为200美元。而最终,ATI由于无法克服的软件问题,所以注定了公司只有四年的寿命。 i740在图形市场上大放异彩两个月后,3Dfx推出了Voodoo2。像其前身一样,它是仅3D解决方案,尽管令人印象深刻,但它代表了一个复杂的系统。这些板具有两个纹理IC,这允许在图形卡中找到第一个多重纹理示例,因此,它总共使用了三个芯片,而不是像竞争产品那样仅结合了2D / 3D功能。 Quantum3D对Voodoo 2的实现包括将Obsidian2 X-24作为可与2D子卡配对的单个SLI卡,具有24MB EDO RAM的单插槽SLI SB200 / 200SBi和具有四个200SBi的Mercury Heavy Metal通过控制器板(AAlchemy),以此连接的SLI板具有当今多GPU卡设置中的SLI桥功能。 后者是用于视觉模拟器的专业图形解决方案,因此价格高达9,999美元,同时需要具有四个连续PCI插槽的Intel BX或GX服务器主板。 Voodoo Banshee于1998年6月发布,但在接下来的三个月中这款产品都没有上市。该卡将仍然是将AWOL Rampage芯片组的2D部分与单个纹理映射单元(TMU)结合在一起,因此3Dfx现在可以在大大降低的生产成本的前提下,提供具有2D和3D功能的单个芯片,但与之相比,Banshee在渲染多纹理多边形的能力上,它仍落后于Voodoo 2。 3Dfx在三年前带来的革命现在正在变成过去。 在原始的3D性能方面,Voodoo 2的表现不尽人意,但是竞争却在迅速发展。在来自ATI和Nvidia的竞争日益激烈的情况下,3Dfx希望通过营销和出售董事会本身来保留更高的利润线,而这以前是由众多董事会合作伙伴处理的。为此,3Dfx于12月15日以1.41亿美元的股票购买了STB系统,但该合资企业被证明是一个巨大的失误,因为该公司(华雷斯)使用的代工厂的质量和生产成本无法与台湾(TSMC)进行竞争。由Nvidia使用。它也无法与ATI的台湾代工合作伙伴联华电子(UMC)相竞争。 3Dfx的许多前合作伙伴改为与Nvidia建立合作伙伴关系。 3月23日,Nvidia推出了Riva TNT,代表TwiN Texel(而非the explosive),这加剧了3dfx在市场上日益增长的压力。在Riva的设计中增加了第二个并行像素通道,使像素填充率和渲染速度翻了一番,还增加了惊人的(1998年)16MB的SDR内存——Voodoo 2的8-16MB RAM是EDO系列中速度较慢的那种。作为一个强有力的竞争者,它的性能由于自身的复杂性而被削弱——台积电350nm工艺上的一个800万片晶体管芯片由于发热而不能在Nvidia最初的125MHz核心/内存频率下运行,因此它采用了一个90MHz时钟。而这使其降幅达到了28%,因此,Voodoo 2几乎始终是性能领导者,而这要主要归功于Glide。 即使规格降低,TNT还是一张令人印象深刻的显卡。它的AGP 2x接口允许以1600 x 1200进行游戏,并使用24位Z缓冲区(图像深度表示)进行32位色彩渲染。与Voodoo 2的16位色彩支持和16位Z缓冲区相比,这是一个巨大的改进。TNT与Voodoo 2和Banshee相比,提供了更好的功能集,更好的CPU时钟速度缩放,出色的AGP纹理和更好的2D性能。这款产品直到9月份才发货,而且数量不多。 并非所有事情都按照Nvidia的方式发展,至少不是一开始就如此。 SGI 于4月9日对他们提起诉讼,指控他们侵犯了纹理映射的专利权。两者之间的纠纷于1999年7月达成的和解协议,使英伟达得以进入SGI的专业图形产品组合,而SGI则终止了自己的图形团队,并将其低级图形团队移交给英伟达。IP的这种知识产权通常被认为是SGI以惊人的速度破产的主要原因之一。 随着市场主要参与者在该年头几个月占据了媒体报道的主导地位,6月和7月突显出该行业的两大衰退迹象。 6月16日, Number Nine发布了他们的Revolution IV。 该显卡无法与Nvidia和ATI在3D性能方面的进步相提并论,因此,该公司试图增强其在2D生产力市场中的地位。 SGI flat panel bundled with the Revolution IV-FP Number Nine一直偏向于2D性能,而不是将资源分配给3D技术,结果发现自己在这两个市场都被英伟达(Nvidia)的TNT等游戏卡所束缚。该公司决定利用困扰大多数专用游戏卡的一个真正的弱点:32位彩色的高显示分辨率,来得以突破。 为此,Number Nine向Revolution IV-FP添加了36针OpenLDI连接器,它将连接到与该显卡绑定的SGI平板屏幕上。17.3英寸SGI 1600SW (1600x1024)加上Revolution IV-FP软件包最初零售价为2795美元。 这是Number Nine的最后一张自制显卡,之后他们又回去卖S3和Nvidia的产品了。1999年12月,S3收购了该公司的资产,并将其出售给Number Nine最初的设计团队的工程师,后者于2002年成立了Silicon Spectrum。 S3在1998年的E3展会上发布了Savage3D,与TNT和Voodoo Banshee不同的是,这张卡很快就进入了零售市场。然而,这种快速引入的却给他们带来了惩罚。OpenGL游戏受到的影响尤其严重,因为S3仅为Quake游戏提供了一个微型OpenGL驱动程序。 S3的原始规格要求该卡的时钟为125MHz,但由于产量和热量输出,最终出货部件的时钟频率为90-110MHz——许多评论杂志和网站仍收到时钟频率更高的125MHz试生产样品。随后随后,Savage3D推出了120MHz的超功率部分,Hercules和STB分别以120 / 125MHz的频率出售了Terminator BEAST和Nitro 3200。尽管OpenGL仿真和DirectX性能由于驱动程序而受到阻碍,但参考板的低于100美元的价格以及可接受的游戏和视频播放性能带来了一定的销量。 在1997年至1998年之间,离开该行业的图形供应商数量有所增加。其中包括Cirrus Logic,Macronix,Alliance Semiconductor,Dynamic Pictures(出售给3DLabs),Tseng Labs,Chromatic Research(均由ATI收购),Rendition(出售给Micron),AccelGraphics(由Evans&Sutherland购买)以及芯片和技术(被英特尔吞并)。 有和没有之间的鸿沟在1999年变得更加明显。 1月,SiS 300发布,这是一款经济型的商用机器图形显卡。在1999年中,SiS 300只能提供最低限度的3D性能,而2D在零售市场上又无法与SiS的大多数竞争对手相匹敌。从单个像素管线上就可以看到这一点。幸运的是,对于SiS,OEM无需担心,因为该产品具有足够多的可选功能来满足性能要求:128位内存总线(SiS 305修订版中为64位),32位颜色支持,DirectX 6.0(305为DX7) ),多纹理,电视输出和硬件MPEG2解码。 接着在2000年12月,SiS 315增加了一个256位的内存总线,支持DirectX 8,全屏AA,第二个像素管线,一个转换和照明引擎,DVD视频运动补偿和DVI支持。性能通常在GeForce 2 MX200的范围内。相同的315芯片在2001年9月构建了SiS的650芯片组(奔腾 4),在2003年构建了SiS552系统。 除了SiS的产品外,精打细算的人仍然可以选择很多产品。其中包括Trident Blade 3D(约合65美元),它还算不错的3D性能(如果支持参差不齐的驱动程序的话)基本上与英特尔的i740不相上下。 受此鼓舞,Trident继续发布Blade 3D Turbo,其时钟从110MHz提升至135MHz,这使其与英特尔修订的i752保持同步。更糟糕的是,当威盛在2000年4月收购了S3显卡后,他们与威盛的集成显卡业务就戛然而止了。 那时,Trident的核心图形业务主要依赖于体积大、价格低的芯片,主要在移动领域上得以发展。Blade 3D Turbo已改进为Blade T16,T64(143MHz)和XP(166MHz)。但Trident的3D技术发展速度远低于市场总体水平。以至于像SiS 315这样一个推迟了很久的预算方案也轻易地超越了他们的新产品。Trident的图形部门在2003年6月被出售给SiS的XGI子公司。 S3 Savage4在性能上比SiS和Trident产品有所提高。该显卡已于2月份发布,零售价从5月份开始,价格为100-130美元,具体取决于板载内存是16MB还是32MB。Savage3D引入了S3的纹理压缩,以确保即使使用有限的64位内存总线,也可以容纳高达2048x2048字节的纹理。 Diamond Viper II Z200 (S3 Savage4) Savage4成为S3的第一张支持多重纹理的显卡,也是第一张支持AGP 4x接口的显卡。但即使是改进的驱动程序和合理的特性集也无法弥补它难以达到上一代3Dfx、Nvidia和ATI卡的性能水平的事实。这一循环在年底Savage 2000发布时又重复了一次。这张卡在1024x768及以下的分辨率上优于TNT2和Matrox G400,但1280x1024/1600x1200则是另一番景象。 3dfx的Voodoo3系列中的第一个系列产品于3月到货。但被期待已久的Rampage芯片组还没有到来,因此,即使在Avenger芯片组中进行了一些调整,这些主板仍具有相同的架构。他们仍然依赖于16位色彩模式,受限于256x256纹理支持以及缺乏基于硬件的变换和照明(T&L)。这些因素开始对游戏开发人员变得至关重要,而3Dfx却因未履行其架构和功能设置承诺而继续令人失望。 这似乎是一个由来已久的传统,3dfx将其命运的失败归咎于市场震动,尽管这并没有真正影响ATI和Nvidia那么多。3Dfx陷入困境的另一个迹象是,该公司在12月宣布,在DirectX和OpenGL继续受到游戏开发者青睐的时候,他们的Glide专有图形API最终将以开源形式提供。 3月,英伟达还发布了Riva TNT2,包括首款具有更快的核和存储速度的Ultra品牌主板,而Matrox则推出了G400系列。 TNT2采用了台积电的250nm工艺,并设法提供了英伟达最初的TNT所希望的性能。它全面胜过Voodoo 3,唯一的例外是使用AMD 3DNow的应用程序!与OpenGL结合使用的CPU指令扩展。TNT2与3dfx和Matrox保持同步,包括用于平板显示器的DVI输出。 同时,尽管OpenGL支持仍然明显落后,但Matrox G400在大多数情况下都胜过Voodoo 3和TNT2。从性能,图像质量和功能设置的角度来看,该卡的价格为199-229美元,物超所值。通过双显示控制器(被Matrox称为DualHead)驱动两台显示器的能力开始了公司的多显示器支持趋势。在这种情况下,辅助监视器的分辨率限制为1280x1024。 G400还引入了EMBM,它提供了更好的纹理表现。对于那些钱包稍微鼓一点的人来说,G400的最高售价为250美元,这使他们拥有了市场上最快的消费显卡,直到2000年初诸如Creative Labs 3D Blaster Annihilator Pro之类的基于GeForce 256 DDR的主板上架。 从那时起,Matrox开始专注于专业市场,并在2002年凭借Parhelia短暂回到游戏市场。三监视器支持不足以抵消次等游戏性能和DirectX 9.0兼容硬件的新潮流。 当3Dfx、Nvidia和Matrox的发布会硝烟散尽之时,3DLabs发布了期待已久的Permedia 3 Create!这张显卡是在几个月前发布的,针对的是对游戏感兴趣的专业用户。因此,3DLabs将2D功能置于3D之上,充分利用了他们在1998年7月从Dynamic Pictures(工作站卡的顶级Oxygen系列的设计者)获得的专业图形技术。 不幸的是,对于3DLabs来说,对工作站图形来说最重要的往往是复杂的多边形建模——通常是以纹理填充率为代价的。这与游戏卡的要求正好相反,在游戏卡中,纹理和视觉效果比复杂的线框模型更重要。 在游戏场景中,TNT2和Voodoo 3的价格过高且胜过竞争对手,但他们在工作站任务方面还远远不够,并与竞争对手区分开来,Permedia 3代表了3DLabs在游戏显卡领域中的最后尝试。从那时起,3DLabs将把精力集中在基于GLINT R3和R4的Oxygen card上。从$ 299的VX-1到$ 1499的GVX 420,而Wildcat系列(例如$ 2499的Wildcat II -5110)仍然基于Intense3D的ParaScale图形处理器,该处理器是在2000年7月从Intergraph收购Intense3D时开始的。3DLabs将从2002年起开始将他们自己的图形集成到Wildcat系列中,当时Creative Technology公司购买了他们的P9和P10处理器。 该公司在2006年退出了桌面电脑市场,并将重心转移到以媒体为导向的图形设计领域,该部门与Creative的SoC group合并,更名为ZiiLabs,并于2012年11月被出售给英特尔。 自从Rage 128首次亮相以来,ATI的步伐有所加快。1998年末,该公司在Rage 128中增加了对AGP 4x的支持并增加了时钟,以发布该卡的Pro版本,该版本还具有视频捕获和TV-Out选项。Rage 128 Pro的游戏性能与英伟达(Nvidia)的TNT2大体相当,但远远低于TNT2 Ultra,这是ATI想用Aurora来弥补的。 ATI's Rage Fury MAXX combined two Rage 128 Pro chips on a single board 当ATI显然没有能够在性能竞赛中取得优势时,该项目改变了方向,改变为Rage Fury MAXX,它可以在同一PCB上包含两个Rage 128 Pro。规格编号给人留下了深刻的印象,两个芯片各自负责渲染备用帧,并将它们之间的游戏工作量减半。实际上,尽管该卡优于上一代产品,但它与S3 Savage 2000并不匹配,并且将始终落后于即将面世的GeForce 256 DDR。后者的价格稍高一些,为279美元,而ATI为249美元。 在Rage Fury MAXX发布不到两个月后,Nvidia于10月1日发布了GeForce 256 SDR,随后在2000年2月发布了DDR版本。这将是使用这种形式的RAM的第一张卡。这是一种基于台积电220纳米工艺的集成了2,300万个晶体管的芯片,是基于转换和照明引擎(TnL或T&L)添加的第一款实际上被称为GPU(图形处理单元)的图形芯片。 该引擎使图形芯片能够进行大量浮点运算,从而将3D对象和场景及其相关照明转换为渲染图像的2D表示。以前,这种计算是由CPU进行的,它很容易成为工作负载的瓶颈,并倾向于限制可用的细节。 GeForce 256作为第一个将可编程像素着色器与T&L结合使用的设备,其地位一直是争论的话题。这是因为许多设计在原型阶段(再现VeriteV4400, BitBoys Pyramid3D, 3Dfx Rampage),也已在不相关的水平(3DLabs GLINT,Matrox G400的WARP),或仅通过一个单独的板上芯片( Hercules Thriller Conspiracy)。 然而,这些都没有实现商业功能。此外,通过率先采用四管道体系结构,Nvidia在竞争中拥有领先的性能。结合T&L引擎,该公司可以将GeForce 256作为专业的工作站显卡进行销售。 在台式机版本上市一个月后,英伟达宣布了他们第一个适用于专业工作站的产品——Quadro,即基于GeForce 256的SGI VPro V3和VR3。这些显卡利用了SGI的图形技术,这是Nvidia通过1999年7月签署的交叉许可协议获得的。 英伟达当年的利润为4,100万美元,收入为3.745亿美元,远远超过1998年的410万美元和1.582亿美元,与1997年的1,330万美元相比也有了巨大的飞跃。微软最初为NV2A(Xbox的图形核心)支付了2亿美元,4月份又进行了4亿美元的二次债券和股票发行,这增加了英伟达的收入。 这些数字与ATI全年12亿美元的收入和1.6亿美元的利润相差无几,这要归功于图形市场32%的份额。但是由于英特尔的815系列集成显卡,后者濒临失去OEM业务的重要部分。 ★ 点击文末【阅读原文】,可查看本文原链接。 *免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。 今天是《半导体行业观察》为您分享的第2298期内容,欢迎关注。 ★Arm芯片三十五年 ★欧洲半导体三驾马车的“乱世”变局 ★2020年,国产射频PA究竟如何? 中国半导体|苹果|封测|蓝牙|设备|晶圆|英伟达|射频|台积电
收藏
举报
35 条评论
写下您的评论...
评论
- 鼓楼乐爷 1天前
vodoo1当年我就买了,1350元,那叫3d加速卡,之前的游戏也都是3d的,但是效果很一般,比如fifa98,生化危机,极品飞车2特别版这些,开了3d加速整个世界都不一样了,但不是说这卡以前的集成显卡没有3d处理能力。 回复0
- 张嘴狂叫怎么地 2天前
大力神显卡在DX7真的是无敌般的存在!玩实况足球居然跟TI4200一样爽,价格才是4200的1/5 回复 ⋅ 1条回复0
- 该用户正在过奈何桥 2天前
第一次玩电脑,好像是95,96年的事儿了。我姐闺蜜的弟弟有台电脑。MMX200,后来加了块巫毒的加速卡。99年自己装机,在深圳组装了一台赛扬400加TNT,6.4G硬盘。仙剑奇侠传,三国英杰传,三国群英传,风色幻想,天地劫神魔至尊传。现在拿着2080,还有Xbox,专用的游戏室书房,都觉得不香了。 回复0
- 爱中国铲除汉奸 2天前
我的第一张显卡,2032有谁记得
GPU历史系列(三):Nvidia一统江湖半导体行业观察 2020-05-04 12:10:59
来源:内容由半导体行业观察(ID:icbank)编译自「techspot」,谢谢。 随着世纪之交,图形行业见证了进一步的整合。 专业市场见证了iXMICRO完全退出显卡市场,而NEC和惠普(Hewlett-Packard)也分别推出了最后一款产品TE5和VISUALIZE FX10系列。Evans &和Sutherland 也通过出售其RealVision生产线而分道扬镳,以专注于planetaria和fulldome投影系统。 在消费图形市场,ATI于2000年2月宣布以大约4亿美元收购ArtX公司。ArtX当时正在为任天堂GameCube开发代号为“海豚”(最终命名为“Flipper”)的GPU项目,这大大增加了ATI的利润。 ATI GameCube GPU 同样在2月,3dfx宣布裁员20%,然后迅速以1.86亿美元的价格收购了Gigapixel,并获得了该公司基于图块的渲染IP。 与此同时,S3和Nvidia解决了他们尚未解决的专利诉讼,并签署了为期7年的交叉许可协议。 VIA在4月至5月左右获得了对S3的控制权,而该公司本身刚刚完成了收购Number Nine的重组过程。作为S3重组的一部分,该公司与Diamond多媒体公司进行了价值1.65亿美元的股票互换。Diamond的高端专业图形部门FireGL被拆分为SONICblue,后来于2001年3月以1000万美元的价格卖给了ATI。 3DLabs在4月份收购了Intergraph的Intense3D,而3dfx的最后一场演出在年底结束,尽管2000年随着期待已久的Voodoo 5 5500在7月份的首次亮相带来了更美好的未来。后者最终与GeForce 256 DDR进行了交易,并赢得了高分辨率的战斗。 但是3dfx曾经是原始性能的代名词,它的优势在于它的全屏反锯齿图像质量。Voodoo 5引入了T-buffer技术,作为变换和照明的一种替代方法,它基本上采用了一些渲染帧并将它们聚合为一个图像的方法。这产生了稍微模糊的图片,当按帧顺序运行时,可以平滑动画的运动。 3dfx的技术成为当今许多图像质量增强的先驱,例如柔和的阴影和反射,运动模糊以及景深模糊。 3dfx的绝唱,Voodoo4 4500,在几次延迟后,于10月19日发布——不像4200和4800,它们从未发布过。这张卡原本计划在春季作为英伟达TNT2的竞争对手,但最终却与该公司的标志性产品GeForce 256 DDR,以及性能更好的GeForce 2 GTS和ATI Radeon DDR背道而驰。 11月14日,3dfx宣布他们将不再生产和销售自有品牌的图形卡,这一传言已经有一段时间了,但很大程度上是在打折扣。火上浇油的消息,即将推出的奔腾4主板将不支持Voodoo5系列所要求的3.3V AGP信号。 Voodoo5 5500 AGP box art 一个月后,当Nvidia以7000万美元外加100万股普通股的价格收购了3dfx的IP投资组合时,3dfx的丧钟敲响了。一些网民后来注意到,原本搬到英伟达的3dfx设计团队最终既实现了他们的复仇,也发挥了他们的潜力,他们交付了表现不佳的NV30图形芯片,支持FX 5700和FX 5800卡。 Nvidia VS ATI时代开始 在Voodoo 5上市之前,ATI 宣布Radeon DDR是“有史以来为台式PC设计的最强大的图形处理器”。该卡的预览版已于4月25日公开发布,仅24小时后,英伟达就发布了GeForce 2 GTS(GigaTexel Shader)予以反击。后者包括Nvidia的ATI Pixel Tapestry Architecture版本,称为Nvidia Shading Rasterizer,允许将高光阴影,体积爆炸,折射,波浪,顶点混合,阴影体积,凹凸贴图和高程贴图等效果应用于每个像素通过硬件的基础。 据该功能被认为已经应用于先前的NV10(GeForce 256)芯片,但由于硬件故障而被禁用。GTS还遵循ATI的Charisma引擎,允许GPU支持所有变换,裁剪和照明计算。也就是说,ATI在vertex skinning和关键帧插值方面更进一步,在关键帧插值方面,开发人员为动画设计了开始和结束的网格,而Charisma核心计算了中间的网格。 ATI Radeon DDR ATI Radeon DDR最终于2000年8月上市。在卓越的T&L实现和对即将推出的DirectX 8特性的支持下,Radeon DDR与GeForce 2 GTS一起,通过将对接口的支持集成到芯片本身,引入了DVI输出的使用。然而,DVI输出更多地出现在OEM卡上,因为零售品种通常带有VIVO插头。 Radeon DDR的一个缺点是,其主板的内核和内存的频率分别低于承诺的200MHz和183MHz。此外,驱动程序在发布时再次失去最佳状态。VIA的芯片组存在16位颜色问题和兼容性问题,但这并不能阻止该卡在高于1024x768x32的分辨率下独领风骚。64MB版本的价格为399美元,而64MB GeForce 2 GTS的价格为349-399美元,后者在基准测试中以10-20%的优势胜出,这帮助ATI保持了其在图形市场份额上超过Nvidia的第一名的位置。 英伟达也没那么糟糕。该公司公布本财年实现净利润9,850万美元,营收达到创纪录的7.353亿美元,这在很大程度上是受其市场细分战略的推动。该公司在6月份发布了一款打了折扣的MX版本的卡,并在8月份发布了一款更高的超频(Ultra)型号。后者在性能上超越了Radeon,但售价也只有499美元。Pro模型于12月到货。 除了从预算MX到专业Quadro 2系列的每个价位都发布GeForce 2卡外,Nvidia还以GeForce2 Go的形式发布了其第一款移动芯片。 当3dfx在11月经历其死亡之际,Imagination Tech(ex-VideoLogic)和意法半导体(ST Micro)试图通过PowerVR系列3 KYRO解决高预算市场。该卡的价格通常在80美元到110美元之间,具体取决于内存帧缓冲区,该卡在1024x768或更低的分辨率下具有很高的游戏性价比。如果GeForce2 MX后来问世,或者它的定价不那么激进(约110美元),它会变得更受欢迎。 2001年4月,KYRO II问世,与原产品相比,它的时钟速度有所提高,而且是由意法半导体在较小的180nm制程上制造的。但这张卡再次面临来自GeForce 2 MX的激烈竞争。Nvidia将该卡重新绑定为MX200,并将其价格降低了40%,同时以与Kyro II相同的价格添加了更高频率的MX400卡。 当PowerVR无法确保基于图块的渲染的游戏开发动力时,意法半导体于2002年初关闭了其图形业务,Imagination Technologies也从台式机图形转向了移动图形,并利用该专业知识开发了片上系统图形。他们许可在超便携式和智能手机市场中将5 / 5XT / 6系列与基于ARM的处理器一起使用。 到2001年黎明时分,个人电脑显卡市场由两家独立的显卡垄断企业组成,除了英特尔以外,这两家公司还提供了绝大多数的集成显卡芯片组。 同时,Matrox和S3 / VIA紧紧抓住了传统市场的利润。 在GeForce 2系列的基础上,Nvidia于2001年2月27日发布了GeForce 3,定价在339美元到449美元之间。这张卡成为了该领域的新王者,但它只有在1600x1200像素的超高分辨率下才真正脱颖而出,最好是采用全屏反混叠技术。 英伟达的GeForce 3卡 最初的驱动程序是有缺陷的,特别是在一些OpenGL游戏中。新的GeForce确实带来了DirectX 8,多重采样AA,梅花AA(基本上是2xMSAA +后期处理模糊),8x各向异性滤光以及无与伦比的处理8xAF +三线性滤光的能力以及可编程的顶点着色器用于更紧密地控制多边形网格运动和更流畅的动画序列。 还有LMA(光速内存架构)支持——基本上是Nvidia的HyperZ版本——用于剔除隐藏在屏幕上其他像素后面的像素(Z遮挡剔除),以及压缩和解压数据以优化带宽使用(Z压缩)。 最后,Nvidia实现了负载平衡算法,将其称为Crossbar内存控制器,该控制器由四个独立的内存子控制器(与行业标准的单个控制器相对)组成,从而可以更有效地路由传入的内存请求。 Nvidia的产品线后来添加了NV2A,它是具有GeForce4属性的GeForce 3的派生产品,该产品已在Microsoft的Xbox游戏机中使用。 微软Xbox中的Nvidia NV2A 至此,英伟达控制了31%的图形市场,英特尔为26%,ATI为17%。 由于Nvidia补充了GF3系列的低时钟Ti 200和超频Ti 500型号,ATI加快了Radeon 8500的交付。该显卡是使用TSMC的150nm工艺(与GeForce 3的NV20相同)围绕R200 GPU构建的。这款芯片在8月份就已经发布了,自从id软件公司的John Carmack大谈特谈这款芯片,说它运行新的Doom 3的性能将是GeForce 3的“两倍”以来,人们一直在热切期待它的发布。 ATI的官方R8500公告同样令人兴奋。但事实是,这张卡在去年10月发行后,在游戏中的表现与被低估的GF3 Ti 200的表现不相上下。未完成的驱动程序和缺乏可行的Smoothvision抗锯齿功能对R8500产生了重大影响。当假期来临的时候,第二轮的评论显示drivers已经在一定程度上成熟了,并且在Ti 200和标准GF3之间提高了R8500的性能。 规格比较快照 极具竞争力的价格和更好的功能集(2D图像质量,视频播放,抗锯齿性能)使该卡成为GF3和Ti 500的有力竞争者。 ATI今年的销售额下降到10.4亿美元,公司录得净亏损5420万美元。该公司开始向主板合作伙伴发放制造和销售显卡的许可证,同时将他们的资源重新集中在设计和芯片制造上。 ATI还首次推出了机顶盒Xilleon,它是基于Xilleon 220 SoC的开发平台,可为集成到数字电视设计中的机顶盒提供完整的处理器,图形,I / O,视频和音频。 ATI Xilleon板 为了补充Xilleon,ATI在2002年6月以2,000万美元的价格收购了NxtWave Communications。该公司专门从事数字信号处理以及机顶盒和地面数字解决方案的应用。 为了跟上产品发布周期,Nvidia在2002年2月发布了GeForce 4。三个MX部件,三个基于MX模型的移动部件,以及两个高性能的Titanium型号(Ti 4400和Ti 4600)组成了最初的产品阵容——基于TSMC的150nm工艺。GeForce 4实际上早在两个月前就已经准备好发布了,但为了避免影响假期期间GeForce 3的销售,发布被推迟了。 MX系列卡片原本是为预算部门设计的,但由于它们是基于旧的GeForce 2架构,因此在很大程度上仍然缺乏新意。MPEG2解码增加,但卡恢复到DirectX 7.0/7.1支持作为早期GF2 MX线。定价为99-179美元反映了功能集的缩减。 另一方面,Titanium型号表现出色,在某些情况下,性能比GeForce3 Ti 500提高了50%以上。一夜之间,Ti 4600成为性能冠军,轻松淘汰了Radeon 8500,而售价199美元的Ti 4200则是性价比最高的储蓄卡。 但随后出现了Radeon 9700 Pro,并迅速把其他所有卡都变成了落后者。 ATI Radeon 9700 Pro (FIC A97P) ATI R300 GPU由最初构成ArtX核心的团队开发,交付出色。它是第一个提供DirectX 9.0支持的应用程序,并且扩展了第一个支持着色器模型2.0,顶点着色器2.0和像素着色器2.0的体系结构。其他显着成就:这是第二个支持AGP 8x的GPU系列-第一款SiS的Xabre 80/200/400系列-并实现了第一个倒装芯片GPU封装。 关于倒装芯片GPU封装:前几代图形芯片和其他IC都使用引线键合安装。通过这种方法,芯片安装在电路板上,逻辑块位于金属层下面,其逻辑焊盘将通过围绕芯片边缘向下布置的细线连接至下侧的焊球或引脚。倒装芯片通过直接在芯片“顶部”上的接触点(通常以球栅阵列形式焊接)去除了导线组件,然后将其倒置或“翻转”,以使焊点直接接触基板或电路板。然后,芯片经历局部加热(回流)以熔化焊料,然后形成与电路板下层触点的连接。 去年10月,ATI又推出了一款非pro 9700,价格为299美元,适用于那些无法放弃售价399美元的顶级机型的用户。与此同时,降价的9500 Pro(199美元)和9500(179美元)通过主流细分市场向下延伸,FireGL Z1/X1则填补了550-950美元的专业显卡市场。去年12月,这款全功能的9700 Pro(售价449美元)也被加了进去。 当发现许多卡可以改用价格更高的同类产品时,ATI的销售可能会受到打击。例如,可以使用其参考板(带有完整的内存走线)将9500卡转换成9700,或者将9800 Pro转换为其XT副本。对于后者,提供了一个驱动程序补丁来检查其是否接受该mod,该mod包括焊接电阻器或使用铅笔调整GPU和内存电压控制芯片。硬改装还包括将各种9800型号升级到FireGL X2,而修补/ Omega驱动程序能够将250美元的9800 SE 256MB变成499美元的9800 Pro 256MB。 除了独立显卡,ATI还推出了台式机集成显卡和芯片组。其中包括打算与AMD CPU配对的A3 / IGP 320,用于英特尔芯片的RS200 / IGP 330和340,以及用于AMD平台的移动系列U1 / IGP 320M和用于奔腾4-M的RS200M。所有这些都得到了ATI southbridges的补充,特别是IXP200 / 250。 SiS公布了GeForce4和R300之间的Xabre产品线。在相同的价位上,这些卡的速度总是比Nvidia和ATI的产品慢,并且由于缺少顶点着色管道而受到限制。这导致了需要严重依赖驱动程序和游戏开发人员以获得最大的软件仿真,从而保持SiS在桌面离散3D图形的边缘。 Xabre生产线还实施了“涡轮纹理化”,其中通过显着降低纹理质量来提高帧速率,并且缺乏各向异性过滤。所有这些都没能吸引评论家的注意。 Xabre生产线是SiS旗下的最后一条生产线,因为该公司剥离了其图形部门(更名为XGI),并于几个月后的6月与Trident Graphics合并。 Nvidia的第一个FX系列产品于2003年1月27日问世,该产品以臭名昭著的“吸尘器” FX 5800和稍快一点(但速度较慢的FX 5800 Ultra)而闻名。与主流的ATI Radeon 9700 Pro(和非Pro)相比,FX的声音更大,其各向异性过滤(AF)的质量和抗锯齿(AA)的性能均较差,并且整体速度要慢得多。ATI遥遥领先,5个月前推出的第二代Radeon 9700卡的性能明显优于Ultra,价格也便宜了100美元(299美元对399美元)。 已经搬到英伟达的3dfx设计团队实现了他们的复仇,并发挥了他们的潜力,交付了表现不佳的NV30图形芯片,还落后于预定计划。 NV30芯片原定于8月与Radeon 9700大约同时上市,但台积电(TSMC)的Low-K 130nm工艺的问题加重和缺陷率高阻碍了Nvidia的发展。一些圈子还认为,该公司的工程资源有限,其中不乏与NV2A Xbox游戏机芯片,SoundStorm APU和主板芯片组捆绑在一起的公司。 为了向前发展,Nvidia承担了一个项目,即使用IBM更传统的氟硅玻璃(FSG)低K 130nm工艺制造几种FX系列芯片。 ATI在3月份更新了它的产品线,从9800 Pro开始,配备了R350 GPU,基本上是R300,对Hyper-Z缓存和压缩指令做了一些增强。 RV350和RV280随后在4月份上市。第一个是在Radeon 9600内部发现的,使用的是Nvidia采用的相同的TSMC 130nm低k工艺,与此同时,为Radeon 9200供电的RV280只不过是经过重新封装的Radeon 9000 RV250(具有AGP 8x支持) 。 同月,ATI与任天堂签署了一项技术协议,该协议最终将为任天堂Wii游戏机带来好莱坞式的GPU。ATI在八月份向微软授予了Xbox 360 GPU合同,从而又推出了第二款游戏机。 Xbox 360 GPU (ATI C1 / Xenos) 在FX 5800不光彩的登场后不到三个半月,Nvidia又推出了NV35 (FX 5900和FX 5900 Ultra)。新的Detonator FX驱动程序大大改善了AA和AF,在质量上几乎与ATI的解决方案相匹配。然而,5900实现了5800无法实现的目标。它将ATI的Radeon 9800 Pro从最快卡的位置上挤了下来,尽管每一张售价499美元,但几乎没有人会真正利用这一点。 正如预期的那样,ATI在9月份发布了9800 XT,重新获得了炫耀的权利。优越的驱动程序支持——主要是一些DX9游戏——也使XT成为比Nvidia更好的整体卡,确保了ATI年终的表现。9700 Pro仍然是出色的主流主板,而FX 5700 Ultra以199美元赢得了低于200美元的市场份额。 ATI在2002年亏损4750万美元之后,在2003年以3520万美元的利润反弹。其中很大一部分来自占主导地位的9800和9600卡的更高售价。同时,由于FX 5200的普及,Nvidia保留了DirectX 9价值细分市场的75%。 新成立的XGI在9月和11月之间交错发布了Xabre后继版本。该显卡系列更名为Volari,价格从49美元的V3到双GPU Duo V8 Ultra不等。V3实际上是Trident的Blade XP4和DX 8.1的改版,而该系列的其余部分(V5和V8)是在以前的SiS Xabre的基础上开发的,并提供了DX9.0支持。 在大多数情况下,除入门级V3的性能均与GeForce FX 5200 Ultra和Radeon 9200相同之外,所有其他型号的交付均不足。Duo V8 Ultra的定价比Radeon 9800 Pro 128MB高出约20%,但性能却与9600XT持平或更低。 XGI的Volari系列产品在2005年底与8300保持一致,与Radeon X300SE / GeForce 6200,Z9 / Z11和XP10差不多,其价格为49美元。该公司于2010年10月重新并入SiS。 S3是另一家卷土重来桌面图形的公司。在将图形部门以2.08亿美元加上该公司6000万美元的债务出售给VIA之后,重组后的合资企业主要集中在芯片组项目上。 DeltaChrome桌面卡已于1月发布,但以历史悠久的S3方式,直到12月才开始在零售渠道中出现首批S4和S8型号。新卡具有2003年大部分新功能;支持DirectX 9、16x AF,HD 1080p支持和纵向模式显示支持。 当然,现在的购买大众普遍认为桌面图形是两匹马的比赛,而S3并不是其中的一匹。当S3希望保持竞争力时,ATI和Nvidia互相推动以实现性能和图像质量的不断提高。 DeltaChrome在2005年被GammaChrome取代。 2005年,英伟达和ATI继续交错发布产品。前者在3月份推出了其第一张GDDR3卡,名为FX 5700 Ultra,随后是GeForce 6系列,高端6800系列。首发机型包括6800(299美元)、GT(399美元)、Ultra(499美元)和一款名为“Ultra Extreme”的超频版本(549美元),以对抗ATI的X800 XT白金版。后者是由一群精选的插件板合作伙伴出售的。 6800 Ultra 512MB于2005年3月14日添加,并以令人难以置信的899美元的价格出售-BFG添加了超频版本,价格为999美元。九月份的6600系列很好地满足了中档的需求。 Nvidia的6000系列特性包括DirectX 9.0c支持、shader model 3.0(尽管显卡从未完全利用这一点)、Nvidia的PureVideo解码和播放引擎,以及SLI支持——从3dfx获得的多gpu性能倍增器IP。 重新引入旧功能:SLI 在3dfx实现中,每个处理单元负责交替的行扫描,而Nvidia则以几种不同的方式处理事情。该公司实现了分帧渲染(SFR),其中每个GPU渲染帧的上半部分或下半部分,交替帧渲染(AFR)让GPU依次渲染帧,在某些情况下,驱动只是根据游戏是否支持该功能而禁用SLI。最后一个特性是驱动程序开发早期的一个不确定因素。 虽然这项技术是在6月份宣布的,但它需要一个带有nForce4芯片组的主板来支持多gpu设置,而这些设置直到11月底才开始大量进入零售渠道。火上浇油,最初的驱动程序会偶尔(最多)释放到第二年。 当时的评论普遍反映了当前的性能,显示两个较低的卡(如6600 GT SLI,售价为398美元)一般等于一个较低分辨率和图像质量的发烧级卡。然而,在最高分辨率和抗锯齿应用,单卡设置仍然占上风。SLI和ATI的CrossFire性能在当时和现在一样不稳定,从理想的缩放到完全不工作。 Nvidia的董事会合作伙伴立即看到了这种重新发明的技术的营销机会,Gigabyte提供了双6600 GT SLI卡(3D1),接着是双6600 (3D1- xl)和6800 GT (3D1- 68gt)。这些卡不仅需要一个nF4芯片组,而且还需要一个Gigabyte的主板。 在高端单GPU卡中,6800 Ultra和X800 XT/XT PE在价格和性能上相当匹配。但他们也不是没有问题。Nvidia的旗舰产品6800 Ultra在8月份上市时非常晚,而且也受到了供应方面的限制,因为这张卡只由一定比例的董事会合作伙伴提供。 6800 GT以399美元的价格击败X800 Pro,而6600 GT则以199美元的价格大获全胜。 那年与英伟达的激烈竞争并没有对ATI的利润产生不利影响,因为当年利润从近20亿美元增长到了2.048亿美元的峰值。 与广受欢迎的6600 GT相关的一个怪癖是,它最初是作为一种PCI Express卡推出的,当时PCI- e是专为奔腾4处理器设计的主板上的一种只使用intel的功能。这些芯片通常在游戏性能上落后于AMD的产品,当然AMD使用的是AGP数据总线。 Nvidia的7000系列早在6000系列完成其生产线之前就开始生产了。在减少的材料清单(BoM) 6800 GS被发现之前的整整5个月,7800 GTX才上市。7800系列的第一次迭代是基于基于台积电110nm制程的G70 GPU,但很快就让位于基于台积电90nm工艺的基于G71的7900系列。 虽然命名约定从“ NV”更改为“ G”,但后者在架构上与GeForce 6000的NV40系列有关。虽然仅略微大于334mm²的NV40-45,但G70却额外封装了八千万个晶体管(总计3.02亿),增加了三分之一的顶点管线和50%的像素管线。在大多数情况下,G70会在9个月内被取代,而GS和GTX 512MB则分别是3个月和4个月。 在入门级,7100 GS继续使用TurboCache(板卡使用一些系统内存的能力),该功能是在上一代GeForce 6200 TC中引入的。 英伟达GeForce 7800 GTX 另一方面,7800 GTX 256MB于6月22日上市,厂商建议零售价为599美元,尽管其实际零售价在许多情况下更高。ATI用X1800 XT夺回了单GPU的桂冠,但Nvidia在三十五天后提出了512MB版本的7800 GTX的反击,并迅速获得了冠军。 两个月后,ATI推出了X1900 XTX,与Nvidia的旗舰产品进行了交易。这场特殊的图形功率竞赛导致两款卡的售价都为650美元。转移到512MB帧缓冲区的卡的一个附带好处是,现在可以通过双链路DVI在2560x1600上进行游戏,并具有32位色彩和高水平的图像质量。 ATI 于2005年5月宣布了其多卡Crossfire技术,并于9月推出了Xpress 200 Crossfire Edition芯片组和X850 XT Crossfire Master板。由于采用单链路TMDS,分辨率和刷新率最初限制为1600x1200 @ 60Hz,但是适用于2560x1600的双链路TMDS将很快取代它。 ATI的原始CrossFire设计需要使用外部Y电缆 与Nvidia解决方案的两个完全相同的卡通过网桥连接器进行通信的解决方案不同,ATI实施了带有TMDS接收器的主卡,该主卡通过外部加密狗和Xilinx合成芯片接受了从卡的输入。 与Nvidia的SLI一样,CrossFire提供了替代帧渲染(AFR)和拆分帧渲染(SFR),但还提供了一种称为SuperTiling的渲染技术。后者在某些应用程序中提高了性能,但不适用于OpenGL或不支持加速的几何处理。与SLI一样,Crossfire也面临着driver相关的麻烦。 ATI打算在去年6月至7月的时间里准备好基于R520的显卡,这是他们第一款采用Shader Model 3.0的显卡,但是后来发现该单元库中的错误导致延迟了4个月。 最初的发布包括使用R520内核的X1800 XL / XT,使用RV515的X1300预算卡以及RV530的四分之一的图形管线,以及基于RV530的X1600 Pro / XT,与RV515类似,但具有更高的着色器和顶点管线与TMU和ROP的比率。 由于R520最初的延迟,GPU及其衍生产品在三个半月后才被基于R580的X1900系列所取代,该系列采用了台积电的新80nm工艺。继续推出后,一半的图形管线资源都流入了RV570(X1650 GT / XT和X1950 GT / Pro),而缩小的RV530成为了为X1650Pro和X1300 XT供电的RV535。 ATI的年度收入达到创纪录的22亿美元,创下公司历史上的最高纪录,这得益于Xbox 360的Xenos GPU出货量。然而,净利润却下滑至1,690万美元。 在此阶段,如果没有热情,所有收到的不基于Nvidia或ATI GPU的图形卡都会引起一定的好奇心。这就是去年11月S3全面改进图形产品的场景。 Chrome S25和S27基于其较高的时钟性能保证了良好的游戏性能,但却提供了一个差等的产品。最初的定价为99美元(S25)和115美元(S27),与Nvidia的6600/6600GT和ATI的X1300Pro/X1600Pro形成竞争,但除了耗电量之外,S3卡在任何意义上都无法与之抗衡。随着ATI/AMD和Nvidia进军HTPC和入门级市场,S3的Chrome 400和500系列也随之消失,这一微弱的优势也随之消失。 S3的另一个问题是,造卡的成本导致利润极其微薄。在一个由两家厂商主导的市场上,该公司需要大量的销售。2012年7月,HTC以3亿美元的价格收购了S3,此举最初被视为HTC和S3与苹果之间的法律纠纷的筹码。 2006年,英伟达和ATI继续霸占观众眼球。 ATI收购了Macrosynergy,Macrosynergy是一家位于上海的设计和工程中心,其人员在加利福尼亚工作,以前是XGI集团的一部分。然后在5月份,该公司以4400万美元的价格收购了BitBoys。 与此同时,继ATI,3dfx和XGI之后,Nvidia首次涉足双GPU单板产品。7900 GX2可以将两个定制板夹在中间,这些板基本上装有一对降频的7900 GTX。但是华硕并没有等到Nvidia的双GPU解决方案,而是发布了自己的产品,即Extreme N7800GT Dual(900美元,制造了2000台),取而代之的是两个7800gt的gpu。 这款显卡引起了华硕对限量版双GPU主板的兴趣,并有可能增强了Nvidia对主板合作伙伴的态度,因为华硕产品在发布时就从其参考模型中脱颖而出。 在大批量的主流市场中,7600 GT和GS均提供了出色的性能和出色的使用寿命,而ATI的X1950 XTX和Crossfire则成为了单GPU卡的高端发烧友基准。X1900 XT和GeForce 7900 GT在高端主流支架中的搭配相当平均。 ATI的David Orton和AMD的Hector Ruiz正式宣布历史性合并 作为一家独立了21年的公司,ATI在2006年10月25日被AMD收购,总价为54亿美元,其中包括从AMD收购的17亿美元,从贷款机构借来的25亿美元,5,700万股AMD股份和1,100万股期权/价值12亿美元的限制性股票单位。买断时,ATI的芯片组/ IGP收入的大约60-70%来自与基于Intel的主板的合作关系。 随着英特尔IGP芯片组市场的很大一部分转移到Nvidia,市场份额急剧下降。此次收购背后的逻辑似乎是通向GPU技术的捷径,而不是动用54亿美元来开发AMD自己的IP并在需要时添加许可技术。当时,AMD的目标是快速推出Torrenza和相关的Fusion项目。 收购ATI两周后,英伟达迎来了PC图形统一着色架构的时代。ATI的xbox360的Xenos GPU已经将统一的架构引入了游戏机。 ★ 点击文末【阅读原文】,可查看本文原链接。 *免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。 今天是《半导体行业观察》为您分享的第2299期内容,欢迎关注。 ★AI芯片的一些科普 ★Arm芯片三十五年 ★欧洲半导体三驾马车的“乱世”变局 中国半导体|苹果|封测|蓝牙|设备|晶圆|英伟达|射频|台积电
GPU历史系列(四):通用GPU的来临半导体行业观察 2020-05-05 14:08:45
来源:内容由半导体行业观察(ID:icbank)编译自「techspot」,谢谢。 随着DX10的到来,顶点和像素着色器保持了很大程度的通用功能,因此移动到统一的着色器拱门消除了许多不必要的重复处理块。第一个使用这种架构的GPU是Nvidia的标志性G80。 四年的研发和4.75亿美元的投入,生产出了6.81亿个晶体管,484mm² 的庞然大物——在11月8日首次成为8800 GTX旗舰和8800 GTS640MB。一款超频的GTX,即8800 Ultra,代表了G80的顶峰,夹在两款较小产品的发布之间:2月份发布的320MB GTS和2007年11月19日限量生产的GTS 640MB/112 Core。 在新的Coverage Sample anti-aliasing(CSAA)算法的帮助下,Nvidia满意地看到其GTX彻底摧毁了所有单显卡和双显卡竞争对手。尽管取得了成功,但该公司在第四季度在独立显卡市场的份额下降了三个百分点-AMD凭借原始设备制造商(OEM)合同的优势获得了增长。 MSI版本的GeForce 8800 GTX 2007年2月和6月,英伟达关于G80的商业战略的其余部分成为现实。基于c语言的CUDA平台SDK(软件开发工具包)以beta形式发布,目的是利用GPU高度并行化的特性实现一个生态系统。Nvidia的PhysX物理引擎以及它的分布式计算项目、专业虚拟化和OptiX (Nvidia的射线追踪引擎)是使用CUDA的更受瞩目的应用程序。 Nvidia和ATI(现为AMD)都在将不断增加的计算功能集成到图形管道中。ATI / AMD将选择依靠开发人员和委员会来开发OpenCL,而Nvidia考虑到CUDA和高性能计算有更直接的计划。 为此,英伟达在6月份推出了Tesla系列的数学协处理器,最初是基于已经为GeForce和Quadro FX 4600/5600提供动力的G80 core,经过至少两次(可能三次)的主要调试,AMD在5月份发布了R600。 媒体大肆宣传该产品是AMD对8800 GTX的回应,但HD 2900 XT令人大失所望。它是一款中高端卡,但有着发烧级主板的功耗,比其他任何当代解决方案都消耗更多的功率。 R600的失误在ATI内部产生了深远的影响,促使战略改变以满足未来的最后期限和最大限度的发布机会。RV770 (Evergreen)以及南北群岛系列改进了执行。 R600是迄今为止最大的ATI / AMD GPU,面积为420mm²,它结合了许多GPU首创。它是AMD的第一个DirectX 10芯片,它的第一个也是唯一一个拥有512位内存总线的GPU,第一个带有tessellator单元的厂商台式机芯片(由于游戏开发者的漠不关心和缺少DirectX支持,该单元一直未被大量使用),第一个具有集成音频/ HDMI支持的GPU,以及第一个使用VLIW的GPU,这种架构一直保留到现在的8000系列。这也是自RADEON7500以来,第一次在竞争对手的价格和性能方面,ATI/AMD没有部署顶级卡。 AMD将R600升级为RV670,将GPU从TSMC的80nm进程缩减为55nm节点,并将512位双向内存环总线替换为更标准的256位。这使得R600的裸片面积减少了一半,同时封装了几乎同样多的晶体管(666万个,而R600是7亿个)。AMD还为DX10.1更新了GPU,并增加了对PCI Express 2.0的支持,所有这些都足以淘汰HD 2000系列,并与主流的GeForce 8800 GT和其他更小的显卡竞争。 在缺乏高端GPU的情况下,AMD于2008年1月推出了两款双GPU显卡,以及基于预算的rv620 /635的显卡。HD 3850 X2在4月份上市,最后一张All-In-Wonder品牌显卡HD 3650在6月份上市。经过精心设计的驱动程序包,双GPU显卡立即引起了评论家和消费者的注意。HD 3870 X2轻松地成为最快的单显卡,而HD 3850 X2也没有慢多少。与Nvidia的SLI解决方案不同,AMD通过通用的ASIC为Crossfiring显卡建立了支持。 Radeon HD 3870 X2在单显卡中放置了两个GPU 在G80取得成功的基础上,英伟达于10月29日推出了8800 GT的G92,受到科技网站的广泛好评,这主要是由于其极具竞争力的价格。512MB显卡的价格介于199美元到249美元之间,性能优于基于G80的8800 GTS。它击败了HD 2900 XT和HD 3870,后者在GT推出三周后发布,通常在GTX的80%之内。不出所料,这导致在几周内短缺8800 GTS。对Nvidia的新竞争者及其8600 GS/GT同款的强劲需求,帮助该公司在年底前获得了71%的独立市场份额。 继GT之后,英伟达于12月11日推出了基于G92的8800 GTS 512MB。虽然GTS在性能上普遍落后于GT,但它的可取之处是使用了更好的内置GPU,在超频时基本上可以与GTX和价格不菲的8800 Ultra相媲美。 如果不添加不幸的后记,即在某些G86、G84、G73、G72/72M GPU、C51和MCP67显卡芯片组的BGA中使用高铅焊料,那么GeForce 8系列的故事就不完整。这与低温填充、冷却不足和冷热循环的密集状态有关,导致了过多的显卡故障。 如果说8系列是Nvidia的技术胜利,那么9系列将迎来一段停滞期。 Nvidia在2008年年中改用了AMD使用的日立(Hitachi)共晶(高锡)焊料,并显著改变了8800 GT冷却器的单槽参考设计,增加了更多风扇叶片,并调整了护罩,以促进更高的气流。G92也被怀疑受到填充不足问题的影响,尽管在8800 GTS 512M和非参考冷却器上的双槽设计似乎没有受到过度影响。 英伟达公司在此次事件中收取了4.759亿美元的费用,这导致英伟达笔记本电脑OEM厂商遭到了消费者的强烈反对。在这件事被公布于众之前,这两家厂商已经知道这件事有一段时间了。英伟达在业内的地位将永远与它的历史最低点联系在一起。 如果说8系列是英伟达的技术胜利,那么9系列则迎来了一段停滞期。该系列的亮点还包括2008年2月推出的首款型号。9600 GT是基于“新的”G94,这比前一年的G92削减了一点,建立在同样的65nm台积电工艺上。 AMD在HD 3870和HD 3850上的降价,以及英伟达8800 GS和GT的降价,使得9系的其余部分几乎完全处于品牌重塑的旗号之下。 最初的9800 GT是8800 GT重新定位,而8800 GTS(G92)则演变为9800 GTX。过渡到台积电的55nm工艺使G92的面积减少了20%,时钟频率也有了小幅度的提升,生产出9800 GTX+,同样的OEM GTS 150,以及在8系列卡推出15个月后进入零售渠道的GTS 250。 由于旗舰GT200的姗姗来迟,以及AMD的HD3870X2现在是单显卡军备竞赛的领头羊,英伟达采用了历史悠久的传统,即把两台9800 GT夹在一起,制造9800 GX2。虽然它赢得了基准测试赛,但大多数观察家很快注意到,以3个9800 GT的价格出售一个双9800 GT充其量只能说吸引力有限。 GTX 260板上的Nvidia G200 GPU 到6月,英伟达发布了带有GT200 GPU的GTX 260和GTX 280,这是一个576mm²的部件,代表了迄今为止最大的生产GPU芯片(英特尔的Larrabee估计为600-700mm²),也是台积电制造的最大生产芯片。 GT200重申了Nvidia希望通过将专用双精度(FP64)和计算硬件整合到设计中,将GPGPU推向聚光灯下的愿望。以游戏为导向的架构变化较为温和,但这并没有阻止Nvidia将280的价格定为649美元,也没有阻止该公司推出3D视觉(3D游戏和视频)驱动程序,以及3D快门眼镜和红外发射器——这是一个非常昂贵的软件包。 在HD 4870和4850上市后,价格大幅下跌,GTX 280下跌38%至400美元,GTX 260下跌25%至299美元。 AMD用RV770回应了GT200和G92。第一款卡是较低主流的HD 4730,于6月8日推出,紧随其后的是主流和性能市场HD 4850和4870。由于规格泄露,商店在NDA 到期前一周就开始销售HD 4850,这次发布已经失去了一定的影响力——这是现在的普遍现象,但在2008年却不那么普遍。 4870和4850成为第一个使用GDDR5内存的消费类显卡,Nvidia最终在18个月后使用基于GT215的GT240实现了这一功能。 HD4870和4850凭借其广泛的功能列表赢得了好评,包括7.1lpcm的HDMI声音、通用性能和多GPU扩展,当然还有价格。该卡的唯一缺点是,在参考板的电压调节部件上,会产生局部高温,这会导致不成比例的故障率和锁定,特别是在使用Furmark等老化软件时。 为了与上一代保持一致,也为了缩短GTX 280的两个月统治期,AMD在8月发布了HD 4870 X2。该显卡很快就在包括性能在内的大多数类别的评估基准图表中占据了首位,但由于参考鼓风机,该显卡还在噪音输出和热量生产类别中占据了一席之地。 Radeon HD 4870 X2(以上)和Radeon HD 4870 2009年1月,当GT200被转移到台积电的55nm工艺上时,英伟达的产品线只进行了一次增量调整。55nm在B3修订版芯片中得到了应用,去年9月,B3修订版芯片首次成为GTX 260的核心216版本。该公司推出了其GTX 295,其中包括两个削减(ROPs和内存总线)GT200-B3。 该显卡的单GPU变体在4月份以GTX 275的形式发布。AMD的回应也是如此:经过修订的rv790xt驱动的HD 4890和HD 4770 (RV740),这也是AMD的第一张40nm显卡。 HD 4770本身并不是一款主要产品,但它给AMD带来了无法估量的经验,让AMD体验到了台积电陷入困境的40nm工艺,由于GPU裸片中金属层之间的连接不完整,导致电流泄漏的差异很大,缺陷率也很高。有了这些工作知识,AMD就能够改进Nvidia在其Fermi架构下面临的代工工艺问题——这些问题还没有出现在Nvidia最初的微型40nm GPU上。 英伟达在7月份推出了首款40nm产品。入门级的GT216和GT218以GeForce 205、210和GT220的形式出现,直到10月份后两款产品进入零售市场,它们都是OEM产品。它们只是作为Nvidia的第一张DX10.1卡而引人注目-AMD在HD 4870/4850上实现了这一点-并通过7.1音频,无损LPCM音频,Dolby TrueHD / DTS-HD / -HD-MA的比特流和HDMI音频提高了声音功能。该系列的目标是家庭影院市场,并最终于2010年2月更名为300系列。 在2009年9月到2010年2月的4个月里,AMD完成了从上到下的4个GPU(Cypress、Juniper、Redwood和Cedar)的全面发布,这4个GPU由Evergreen系列组成,首先是顶级的HD 5870,一周后是中高档的HD 5850。 由于供不应求,台积电陷入困境的40nm工艺打击了AMD利用英伟达Fermi No-Show的能力。这在很大程度上是由于AMD有能力将Evergreen的版本与Windows7同步,并采用了DirectX11。 虽然DX11花了一些时间来展示Evergreen的巨大价值,但HD 5000引入的另一个功能在Eyefinity上产生了立竿见影的效果。Eyefinity依赖于DisplayPort的灵活性,每个板上最多可以支持6个显示管道。它们被路由到一个约定DAC或内部TMDS发射机和显示端口的组合。 以前的显卡通常使用VGA、DVI和HDMI的组合,每个输出都需要一个专用的时钟源。这增加了GPU的复杂性、大小和pin数。DisplayPort否定了独立时钟的需要,为AMD在硬件中集成多达6个显示管道开辟了道路,而软件仍然负责提供用户体验。这包括边框补偿和跨越显示面板的最佳分辨率。 Evergreen系列成为了所有领域的领先者(除了纹理过滤问题),HD5850和HD5770吸引了大量注重成本的玩家,HD5870和双GPUHD5970提供了无与伦比的性能和效率。 6个月后的4月12日,Nvidia终于(soft)通过GTX 470和480发布了它的第一个Fermi板卡。公司的裸片没有一个是全功能的,就像下面的GF104一样,因此Fermi的核心速度是相当保守的,以抑制功率使用和内存带宽较低,因为Nvidia对GDDR5 I/O缺乏经验。 由于GF100 Fermi的芯片尺寸为529mm²,已经给AMD造成供应问题的台积电(TSMC)40纳米工艺的良率还达不到最佳水平。由于芯片尺寸,良率,功率要求和热量输出都密不可分,Nvidia的400系列与AMD的产品相比,在游戏性能上付出了高昂的代价。 Quadro和Tesla版的GF100在市场上几乎没有受到影响,如果有的话,这要归功于专业市场内部的一个现成的生态系统。此次发布没有让人失望的方面是引入了透明超级采样抗锯齿 (TrSSAA),它将与现场覆盖采样AA (CSAA)一起使用。 虽然GTX 480的回应并不热烈,但英伟达的第二款Fermi芯片(GTX 460中的主流GF104)却取得了不朽的成功。它的性能很好,价格也很便宜,192bit/768MB的发行价格为199美元,256bit/1GB的发行价格为229美元。他们推出了大量的非参考和factory超频卡,由于Nvidia选择了保守的参考时钟来帮助降低功耗,因此有很大的超频空间。 460的积极反应部分源于GF100上市后的低预期。据推测,GF104的容量不超过GF100的一半,与AMD的Cypress GPU相比,其遭受的影响非常之大。这证明是错误的。当Nvidia在11月发布新版GF100,即GF110时,博客“专家”和AMD都感到了第二个惊喜。 升级后的芯片实现了之前的芯片无法实现的功能,即实现了整个芯片的功能。最终得到的GTX 570和580是最初400系列的预期值。 第一个AMD Northern Islands系列GPU Barts于10月问世。Barts是Evergreen的进一步发展,旨在降低Cypress裸片的生产成本。与大幅提升性能不同的是,该GPU的性能看起来与之前的HD 5830和HD 5850相当,但在GPU尺寸上大大节省了。AMD削减了流处理器(着色器)的数量,大修并减少了内存控制器的物理尺寸(以及相应的内存速度降低),并取消了执行双精度计算的能力。但是,Barts确实在Evergreen上进行了细分升级。 虽然性能的提高并不显著,但AMD确实升级了显示技术的各个方面。DisplayPort被提升到1.2(从一个端口驱动多个监视器的能力,高分辨率显示器的120Hz刷新,以及比特流音频),HDMI被提升到1.4a(3D 1080p视频播放,4K屏幕分辨率),公司还增加了一个支持DivX的更新视频解码器。 AMD还通过引入形态抗锯齿(MLAA)改进了驱动程序特性集,这是一种后处理模糊过滤器,其功能(尤其是在启动时)非常成功或失败。 HD 6970和HD 6950的推出为具有EQAA(增强质量AA)的Catalyst驱动程序增加了传统的AA模式,而AMD还实现了对HD3D的支持,这一次使用PowerTune进行了动态功耗分析。 一般来说,Cayman部件要比第一代Fermi芯片好。他们本来应该胜过他们,但比第二代(GTX 500s)落后了几个百分点,而且随后两个阵营的driver版本增加了进一步的差异。 Cayman 11月的发布被推迟了一个月,HD6970和6950于12月15日发布,它代表了与VLIW5体系结构的(短暂)背离,而VLIW5体系架构自R300系列以来一直在使用。该公司转而使用VLIW4,它在每个流处理块中删除了第五个特殊功能(或Transendental)执行单元。 这是为了在DX9(及更早版本)游戏中撤回过多的资源,同时对图形管道进行更加面向计算的重组。 Trinity和Richland系列APU的集成显卡是VLIW4的唯一其他部件,而AMD最新的显卡体系结构基于GCN(Graphics Core Next),而VLIW5则作为入门级Evergreen GPU的品牌保留在HD 8000系列中。 参照GF100/GF110的进展,GTX 460的继任者——GTX 560 Ti——于2011年1月上市。基于GF114的显卡具有功能齐全的经过修订的GF104,并被证明与前代产品一样功能强大且用途广泛。在有和没有factory超频的情况下,它提供了无数的非参考解释。 作为回应,AMD立即降低了其HD6950和6870的成本,因此GTX560TI的价格/性能优势消失了,即使评论正在撰写中。随着许多董事会合作伙伴提供的邮寄回扣,HD6950——特别是1GB版本——的购买更加引人注目。 英伟达GeForce GTX 590参考板卡 2011年3月26日,英伟达(Nvidia)推出了第二款重要产品,这款产品一开始就引起了轰动。GTX 590将两个功能齐全的GF110整合到一个电路板上。这场公关风波几乎立刻就开始了。 这些电路板运行的驱动程序没有将功率限制到正确的程度,并且与允许高电压的BIOS配对。这种疏忽使得过电压开始吹mosfet。Nvidia用一个更加严格的BIOS和驱动程序来弥补这个问题,但是发布日的活动引发了一些尖刻的评论和至少一个流行的YouTube视频。GTX 590的性能与两周前推出的AMD自己的双卡HD 6990不相上下。 由于没有明确的基准测试胜利者,这些产品在论坛上引发了无休止的争论,从多GPU扩展、库存可用性、基准相关性、测试方法,到爆炸式的590。 从1月9日开始,AMD的北岛继承者,南岛,以旗舰HD 7970,开始了阶段性的发行计划。它是第一张PCI-E 3.0卡,也是第一个基于台积电28nm制程节点上的AMD GCN架构的芯片。仅仅三周后,7970又推出了第二张基于Tahiti的HD 7950显卡,2月15日,主流的Verde显卡也加入了这一行列。基于Pitcairn GPU的性能卡于一个月后的三月上架。 这些显卡很不错,但与之前的40nm主板相比,并没有提供惊天动地的游戏改进。再加上AMD自HD2000系列以来一直采用的价格标签竞争力较低,两个月内没有WHQL驱动程序和一个非功能视频编解码器引擎(VCE),这降低了许多潜在用户和评论家的热情。 Tahiti的一个好处是证实了AMD通过超频获得了许多尚未开发的性能。这是在功耗和热输出与时钟速度之间的权衡,但导致了一个保守的核心和内存频率。最大化产量的需要和对Nvidia基于Kepler的GTX680/670的低估,也可能已经进入了这个方程。 通过引入Kepler 架构,Nvidia继续在GPU中丰富其功能集。 在之前的几代中,Nvidia使用了最复杂的芯片来满足高端游戏社区,并开始了漫长的专业(Tesla/Quadro)模型验证过程。在最近的几代中,这种方法并没有给公司带来特别好的效益,这种方法在最近几代中并没有为公司提供特别好的服务,因此看起来较小的GK107和以性能为导向的GK104比糟糕的GK110获得了更多的优先权。 GK107可能是必需的,因为Nvidia有大量的OEM移动合同要履行,并且需要GK104用于高端台式市场。这两款GPU都以A2版本芯片的形式发布。Mobile GK107s (GT 640M/650M,GTX 660M)从2月份开始向OEM发货,并于3月22日正式宣布。同一天,Nvidia推出了基于GK104的GTX 680。 与Nvidia最近的GPU设计不同的是,着色器时钟的运行频率与内核频率相同。自从GeForce 8系列产品问世以来,Nvidia采用的着色器的运行频率至少是内核频率的两倍-高达9系列内核频率的2.67倍,是400和500系列产品的两倍。 这种变化的基本原理是基于Nvidia将重点(消费者台式/移动设备)从直接的性能转移到每瓦的性能效率。在并行工作负载中,以较慢速度运行的内核越多,其效率就越高,而以两倍频率运行的内核则越少。基本上,它是GPU和CPU范式(多核、低频率、高带宽和延迟相对于少核、高频率、低带宽和延迟)的改进。 减少着色器时钟还具有降低功耗的优势,而Nvidia通过大幅减少裸片可用的双精度单元,以及将总线宽度减少到更主流的256位,进一步节约了设计成本。这些变化以及动态提升功能(按需超频)增强了相对适中的基本核心速度,提供了更加均衡的产品-尽管以计算能力为代价。但是,如果Nvidia保留了Fermi的计算功能和带宽设计,那么它会因为生产大型的,热的,耗电的设计而被嘲笑。物理定律再次将芯片设计变成折衷的艺术。 英伟达再次生产了双GPU板。由于GK104改善了功率范围,因此GTX 690实际上是SLI中的两个GTX 680。唯一的区别是690的最大核心频率(boost)低于52MHz。尽管性能仍然是driver的SLI配置的一时冲动,但该卡的功能却是一流的,其美学价值堪比限量版。 GK 110与Nvidia通常的做法不同,Nvidia通常先在GeForce的旗帜下发布GPU。最初被视为Tesla K20的这张显卡被大量用于超级计算合同,其中超过22000张需要用于ORNL的Cray XK7 Titan、NCSA的Blue Waters、瑞士CSCS Todi和Piz Daint系统。 在GK110成为GeForce之前,消费者不得不等待6个月。被称为GTX Titan的数字型号的缺乏增强了Nvidia希望将显卡视为与现有(可能是随后的)Kepler系列分离的模型的愿望。Nvidia还扩大了对研究人员和专业人士的吸引力,因为它标志着该公司首次允许GeForce卡保留其专业的Tesla和Quadro显卡一样的计算功能。 英伟达GeForce GTX Titan 该卡迅速成为游戏基准测试中的佼佼者,尤其是在采用超级采样抗锯齿功能的多显示器分辨率中尤其明显。但是,Nvidia对OpenCL驱动程序的支持不多,以及最近与AMD的Gaming Evolved计划相结合的游戏产品的涌现,不仅抑制了Titan的冲击,而且还抑制了其高昂的价格。 6月份,AMD通过HD7970GHz版本推出了“我也是”(me too),其核心频率跃升了75MHz,并进一步提高了50MHz(与Nvidia提供的动态调整版本相对)。GHz版本代表了显卡可能应该在一月份开始的频率。GHz版表示显卡可能应该在一月份开始的频率。 不幸的是,对AMD来说,这个SKU的目标市场已经决定,标准型号通常能够通过以更低的价格和更低的核心电压超频获得相同(如果不是更好的话)的性能。AMD随后推出了HD7970GHz版本和HD7950增强版。 简而言之,PC显卡的现在和未来 到目前为止,2013年已经见证了Nvidia和AMD在PC显卡独立市场份额上的竞争,随着游戏开发和屏幕分辨率无法与集成显卡的跨越式发展相匹配,这一市场份额正在逐步缩小 2002年初,Intel占有14%的个人电脑图形市场份额。随着其极限显卡(830至865芯片组)的推出,该公司的份额上升到33%,然后是第三代和第四代DX 9芯片组的38%,现在是超过50%的DX10 GMA 4500系列。将GPU集成到CPU意味着Intel现在要负责60%的PC显卡的传输。 JPR:2012年第四季度GPU市场份额 对新显卡的需求在每一代产品中都越来越不明显。大多数游戏都是基于10年前的API (DX 9于2002年12月上市),因此游戏中的图像增强功能已不再集中于GPU负载,而更多地关注于后处理过滤——即使是兼容dx11的下一代游戏机,这一点也不太可能改变。当光线追踪被证明是一个难以破解的难题时,依赖光栅化将会继续。 不幸的是,所有这一切都表明,除非游戏引擎发生根本性的变革,或者出现价格合理的超高分辨率显示器,否则硬件发烧友们在未来可做的事情将越来越少。不管未来几个月或几年的情况如何,请放心,我们将继续在TechSpot上回顾即将发布的GPU。 ★ 点击文末【阅读原文】,可查看本文原链接。 *免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。 今天是《半导体行业观察》为您分享的第2300期内容,欢迎关注。 ★从财报看2019年的国产集成电路 ★AI芯片的一些科普 ★Arm芯片三十五年 中国半导体|苹果|封测|蓝牙|设备|晶圆|英伟达|射频|台积电
我知道答案
本帖寻求最佳答案回答被采纳后将获得系统奖励 10 天空金币 , 目前已有 2人回答
|