英伟达黄仁勋的阳谋:从显卡之王到AI芯片霸主
提起英伟达,就绕不过游戏显卡。英伟达的显卡(芯片)早就不局限于玩游戏,现在人们用来做深度学习、自动驾驶、AI计算。
回看英伟达历次GTC发布会,总是给人一种印象,AI计算、元宇宙、比特币、云计算,英伟达每次都在风口上,从来不会缺席。
就拿ChatGPT来说,不仅带火了AI芯片,也让英伟达赢麻了。互联网科技巨头都在忙活着向英伟达下订单,为AI大模型军备竞赛做准备。
从一家专一的游戏显卡公司,一举腾飞成为人工智能时代的带头大哥。英伟达凭什么可以站在时代风口,它的底层逻辑是什么?
01 从显卡之王到AI芯片霸主
1.从显卡的逆袭之路开始
在游戏世界中,英伟达被冠以“显卡之王”,几乎是高端显卡的代名词,其创始人兼CEO黄仁勋是玩家口中的“皮衣刀客”、“显卡教父”。
不过黄仁勋的显卡创业之路并非一帆风顺,而是充满曲折。1993年,技术出身的黄仁勋与两位志同道合的工程师共同创立英伟达,立志要成为计算机图形处理领域的老大。但在创业初期,黄仁勋带领团队耗时两年打造的第一款产品就以失败收场。
1995年,英伟达信心满满发布第一款显卡产品NV1,由于不兼容竞争对手3DFX的Glide 3D标准,市场表现惨淡,甚至让英伟达处于破产边缘。1996年,英伟达不得不停止销售NV1。
而另一边,微软为了抗衡世嘉、索尼、任天堂等日本游戏机厂商,推出了direct x标准,希望自己掌控行业标准。就在这生死关头,黄仁勋做出了后来被证明是关键性的决策:义无反顾地支持微软刚出炉的direct x标准。也就是说,英伟达要将自己和大佬微软绑在一辆战车上。
彼时的教主也没有想到,将在20多年后,和抱住的大腿一起,成为驱动人类社会进步的前沿科技企业。当然这是后话略去不表。
经过两年努力,英伟达在1997年推出全球首款128位3D处理器RIVA 128。跟首款产品截然不同的表现是,RIVA 128一经推出便迅速获得了市场的一致好评,其在前四个月内出货量就突破了一百万颗。
背靠微软在操作系统的垄断地位,深度绑定微软的英伟达成功在显卡领域站稳脚跟。与此同时,个人计算机在PC时代的浪潮中快速普及,英伟达的显卡出货量快速飙升并超越当年竞争对手3DFX。
1999年,英伟达提出GPU概念,推出历史上首款GPU GeForce 256。凭借GeForce 256实力不俗的综合性能,英伟达一战成名。
2000年,英伟达成功将显卡先驱3DFX收入囊中,显卡一哥地位从此确立。也是在这一年,微软选择英伟达为其首款Xbox游戏机提供图形处理器,两者的关系更进了一步。
然而,显卡一哥的位置并不好当。在2008年-2010年期间,英伟达GT200及GF100产品由于过高的发热和功耗等问题,导致英伟达再次遭遇生存危机,其收入大幅下滑,市场份额一度被竞争者ATI超越。
直到英伟达通过芯片设计的优化推出GF110,才重新夺回显卡老大地位。
2.全面拥抱GPU的进阶之旅
自从英伟达的首款GPU大获成功,黄仁勋下定决心走上重塑行业的道路——让GPU更有作为,而不仅仅是图形处理。现在回过头看,黄仁勋当初带领英伟达布局GPU几乎是押注了全部身家。
一方面,英伟达不断研发驱动GPU架构迭代升级,向高端显卡转型;另一方面,英伟达持续加强GPU用于通用计算的能力,开拓新的应用领域,两大方向并驾齐驱。
2012年,人工智能行业兴起,深度神经网络技术在通用GPU的支持下实现重大突破。对黄仁勋和英伟达而言,这无疑是重大转折点。
2015年,搭载TEGRA X1的NVIDIA DRIV问世,标志着英伟达正式投身于深度学习领域。当时NVIDIA Tegra X1是一款256核移动超级芯片,可为深度学习和计算机视觉应用程序带来1 Teraflops的处理能力,性能领先全行业。
2016年,科技界发生了一件震动世界的大事。谷歌的人工智能软件阿尔法狗击败了韩国的世界围棋冠军李世石。这是AI第一次展现出它惊人的实力。不到一年时间,阿尔法狗又击败了当年世界围棋排名第一的中国选手柯洁。这两场人机大战将人工智能推向新的高度。
对英伟达而言,同样在科技界名声大振。毕竟阿尔法狗的成功有英伟达很大功劳,前者身上搭载了170个英伟达GPU。
如今在大规模计算领域,英伟达GPU成为开发者进行人工智能训练的首选,独立GPU市场份额长期超过80%。
2020年以来,自动驾驶技术空前火热,成为各大车企的竞争高地。英伟达又一次踩中风口。
如今在自动驾驶领域,全球有超过370家公司使用了英伟达DRIVE平台。可能连黄仁勋自己也没有预料,自己这么快就会成为车企的座上宾。
英伟达通过Xavier和Orin完成了自动驾驶从ADAS到L5的全栈布局,通过不同组合,满足不同客户对不同自动驾驶等级的需求,特别是在高阶自动驾驶领域,主流车企都钟爱英伟达芯片。
目前英伟达自动驾驶芯片的成熟度和算力都明显领先同行。其中英伟达最新Orin芯片NVIDIA DRIVE Orin SoC(系统级芯片)最大算力达到254TOPS。
由于虚拟货币需要超强大的算力支持,计算越快,得到的虚拟货币越多。而GPU能够通过大量的并行处理器计算以实现自身功能,适合多线程的重复运算场景,正好与虚拟货币的挖矿场景需求高度契合。因此算力领先的英伟达GPU自然而然成为挖矿大军眼里的“核武器”。
自从英伟达被赋予“挖矿”标签,虚拟货币与英伟达GPU芯片库存出现较强关联性。当供求紧张期间,业内还流传着矿工们飞往全球抢卡的故事……
在2021年,全世界同样都在谈论的另一个风口是元宇宙。不过这次出镜的不只是英伟达的GPU,还有黄仁勋。
在2021年4月的一场直播演讲中,黄仁勋当了一回超级网红,其在众目睽睽下用自己的虚拟形象做替身,14秒时间竟然无人察觉,达到了以假乱真的境界。
事后,英伟达公开表示黄仁勋的替身和背后超级逼真的厨房,还有桌上的每一件物品,甚至包括黄仁勋的贴身装备皮大衣,全部都是通过Omniverse平台渲染出来的虚拟画面。
具体来说,英伟达Omniverse是一个易于扩展的平台,可以实3D设计协作以及可扩展的多GPU实时逼真仿真,实现数字孪生,从而为3D创作者、开发者和企业带来更多创意可能,并帮助用户显著提升效率。
而2022年下半年横空出世的ChatGPT更是让英伟达百尺竿头,更进一步。比如微软为OpenAI量身打造的超级计算机,耗资数亿美元,用掉了英伟达数万颗芯片。
今年年初至今,英伟达市值涨幅超过80%,充分享受了AI带来的红利。
2023年3月21日的GTC 2023大会上,黄教主仍然穿着他标志性的皮夹克,全程高能输出,向世人描绘了英伟达在游戏、生成式AI、自主机器、数据中心方面的创新成果,并称这将是英伟达迄今为止最重要的一次GTC。
如今,黄仁勋构建了自己的GPU帝国,几乎任何需要算力的领域,都会有英伟达的身影,英伟达当之无愧成为算力时代不可或缺的底层核心基础。
3.必不可少的“成人礼”:试错之后快速回头
作为全球最具价值的芯片公司,英伟达让各大科技公司羡慕。回过头看,英伟达在元宇宙、自动驾驶、AI计算等领域无一例外都踩中风口。但在30余年的发展历程中,英伟达其实也有不少布局失败。
比如英伟达在2010年发布的GTX 480可以说一败涂地,功耗和发热大,被竞争对手ATI的HD 5000系列按在地上打。在GTX 480上市八个月后,英伟达不得不紧急推出GTX 580来救场。
再比如英伟达曾经为移动设备开发过Tegra系列处理器,希望能在智能手机时代分得一杯羹,但由于功耗和基带等问题,一直不温不火。到了2015年,英伟达发布最后一代Tegra移动处理器Tegra X1。
英伟达经历多次失败,同时也在不断改变,增强自身韧性。相比之下,当年打遍天下无敌手的英特尔,也是英伟达的老对手,自从10纳米制程翻车了一次,整个芯片升级节奏都被打乱了,以至于到现在都没有喘过气来。在集成电路工艺制造水平上,英特尔早已经被三星,台积电等公司追上,甚至被反超。
02 黄教主的两大核武器
1.芯片产品哲学:供给驱动战略
放在十多年前,谁都不知道GPU会在虚拟货币、自动驾驶和AI计算上有如此之大的应用,更没有人知道GPU的前景会如此好。那么英伟达为什么可以在十年之前就预知风口?
答案当然不是因为黄仁勋有先知能力,提前写好了剧本,而是英伟达一以贯之的供给驱动战略。
过去这几年,英伟达给外界的感受是哪里火爆就出现在哪里。实际上,英伟达没有躺在显卡上面不前进,而是不断去优化供给端。在大部分人还没有看准时间节点的时候,英伟达敢于投入大量的资源去开发相关的硬件和软件生态。
早在2003年,英伟达便推出了支持环境光遮蔽的GPU,现阶段环境光遮蔽已经大量被游戏支持。
从2004年左右开始,英伟达投入大量资源研发使GPU通用化的CUDA技术。在当时外界看来,你专心做游戏显卡就可以了,搞什么显卡去做通用计算?
不过英伟达“一根筋”地要开发出使GPU支持通用计算的CUDA,实现每一个英伟达GPU都支持CUDA。
到了2006年,英伟达推出了GPU计算框架CUDA,将高级程序语言如Java、C++等引入了CUDA,极大地简化了对GPU进行编程的流程,降低了编程的难度。更关键的是,CUDA将GPU芯片从当时唯一的应用领域游戏中彻底释放出来,使其可用于各种类型的计算。
事实证明,因为CUDA的易用性和通用性,深度绑定用户,为英伟达GPU快速扩张打下了基础,毕竟到了算力角逐时代,软件开发的便携性已经成为关键指标。
对英伟达而言,CUDA就像是一个飞轮,载着英伟达解决人工智能计算问题,抵达更广阔的市场。
通过提供更好产品来拉动需求,这个过程不仅痛苦,也蕴含着巨大的风险,搞不好就变成往无底洞扔钱。但是跑通之后,你就毫无争议成为引领者,最终市场会给予你丰厚的回报。
除了上述领域,英伟达在自动驾驶领域也是雄心勃勃。英伟达在2015年即推出NVIDIA Drive系列平台,其中DRIVE CX面向座舱,DRIVE PX面向自动驾驶。那时候,大部分车企都还在摸索智能座舱,更别提难度更高的自动驾驶。
但英伟达坚持以超前供给来驱动自动驾驶技术发展,其以一年一代产品的节奏,迭代出了DRIVE PX、DRIVE PX2、Drive PX Xavier、DRIVE AGX Orin等自动驾驶平台。
到2025年,英伟达将量产新一代集中式车载计算平台NVIDIA DRIVE Thor,可提供出色的2000万亿次浮点运算性能,同时降低总体系统成本,从参数指标上看已经把对手甩开了一个身位。
总而言之,以供给驱动为策略的英伟达一次次站上风口。类似的案例,当马斯克决定做特斯拉的时候,电动车市场还被当成“伪命题”,当年特斯拉一度被大量机构看空。如今,特斯拉已经成为电动车的引领者。
映射到国内,大部分科技公司沿用供给驱动策略,呈现的就是只有竞争,没有战略。当年不少互联网公司不仅抢着卖菜,还要干掉中间商来打价格战,并且通过给用户大额补助的方式抢占市场份额,最终是一地鸡毛。
如今进入流量红利消退时代,不少国内互联网科技公司开始通过所谓的黑科技让人们点击更多广告。
为什么元宇宙、云计算、自动驾驶最开始都是欧美引导,国内只有跟风的份?就像ChatGPT爆火之后,国内一堆企业出来凑热闹,开始炒概念。实际上不少公司在相关技术上并没有太多突破,但股价却突飞猛进。
其实电动车也是兴起于欧美,但现在中国的电动车已经引领世界。背后本质就是国内电动车行业有宁德时代、比亚迪这样的企业始终保持战略定力,提前打好了技术地基,这样才能在电动车爆发的时代决胜千里。
2.有别于英特尔的升级模式
黄教主崇尚算力即权力,他创下“黄氏定律”,立志六个月内芯片性能升级一次。
曾经作为芯片的霸主英特尔,近年来“挤牙膏”式的升级被诟病。而英伟达一直维持约两年一次的GPU架构更新,并且每次GPU架构更新,同级别GPU性能均提升达20%以上。
为什么英伟达的GPU可以做到持续快速升级?
总体而言,英伟达实现了硬件和软件的共同驱动。英伟达在领先的硬件基础上面并没有停止脚步,而是构建起软件生态。芯片硬件的发展带来性能的成倍提升,同时还要通过软件把这部分性能有效发挥。两者是相互促进,相互成就的螺旋形关系。
最后,我们想说英伟达仍然是一家年轻的企业,其创始人仍然在运营公司,这在全球科技企业中并不多见。从某个角度讲,英伟达同样是一台不断学习进化的AI机器,令人期待的未来就在前方,让我们继续关注英伟达令人惊叹的产品。
03 引申思考
国内已经涌现出一批优秀的芯片青年近卫军,比如寒武纪、海光信息、景嘉微、沐曦。他们的发展势头很足,市场的预期很高。在研发支出上,海光信息、寒武纪排名前二,其中寒武纪的研发策略比较激进,研发支出占收入比重达到了366.3%。在芯片工艺上,海光信息目前的最先进制程已经达到了7nm。
面对现实情况,国内企业和英伟达的差距还比较大,不光是体现在硬件技术上,也体现在整体的营收规模和研发投入上面。
虽然中国企业离英伟达的差距在一点点缩小,但越到后面,缩小的难度会越来越大。随着芯片工艺演进,每一代芯片的开发成本、设计成本,以及生产成本,已经像滚雪球一样越来越高。
对于芯片行业而言,注定是一场长跑赛,比拼的不仅是硬核科技实力,还有商业模式和生态的构建,国内企业追赶之路任重而道远——目前全球英伟达生态系统涵盖400万名开发者、4万家公司和1万多家初创公司……