黄仁勋,ChatGPT时代的第一位赢家
导读:AI深度学习需要依靠密集且可以大量并行执行的运算,而GPU擅长的正是这种运算。从那时起,英伟达就顺理成章地成为了大部分AI企业的第一选择。
2023年3月,英伟达CEO黄仁勋穿着黑色夹克,站在公司春季GTC大会讲台上侃侃而谈,说出了那句“ChatGPT相当于AI界iPhone问世。”
老黄相信ChatGPT,外界相信老黄,此话一出,流传甚广。
从说话语气来看,黄仁勋这句话并不是要向业界提供一个有待商榷的观点,他真的是在“通知”世界,属于ChatGPT的AI时代来了。
“I think that’s a foregone conclusion(我认为这已经成了定局).”
老黄当然有底气这么说。
曾有人和黄仁勋聊过英伟达的AI布局,老黄说英伟达十年前就发现AI可以“改变一切”,而后,公司内部从底层到顶层也始终将AI技术视作未来。“我们生产的每一个芯片,都专注于人工智能。”
老黄也完全有理由这么说。
CPU-内存-GPU之间的通信速度,很长一段时间一直是AI运算的瓶颈所在。而在目前市场所有的可选项中,英伟达产品的数据传输速度远远领先包括AMD、英特尔在内所有竞对。美银证券半导体分析师Vivek Arya表示,“使用英伟达的产品并增加计算能力非常容易,而计算能力基本等同于硅谷的硬通货。”
英伟达成了硬通货的发行方,黄仁勋也从AI的“头号玩家”,变成了在ChatGPT时代制定游戏规则的人。
ChatGPT时代的入场券
在英伟达官网,你能找到这样一句话:“1999年,NVIDIA发明了GPU。”
与其说AI选择了英伟达,倒不如说是AI选择了GPU(图形处理器),而英伟达正是GPU的创造者,GPU行业的头号玩家。
20世纪九十年代,游戏行业苦于CPU对几何图形处理能力不足,无法进一步释放性能。
英伟达第一个找到了解法。
1997年,英伟达推出了全球首款128位3D处理器RIVA 128,发售四个月内出货量突破一百万台,在图形芯片的月壤上踩出来“人类的一大步”。
两年后,1999年,世界上首块GPU——GeForce256发布,同样是英伟达制造。
不同于一直以来都按照时间顺序进行复杂运算的CPU(中央处理器),英伟达GPU的工作内容是用它包含的成百上千个核心,去一对一处理每个图形的像素点。所有核心在同一时间工作,所有像素点也在同一时间被处理完成。
对于流程简单、数据量庞大的运算而言,GPU的出现带来了指数级别的效率提升。从此,英伟达显卡芯片就等同于GPU,而且是地球上你能找到最好的CPU。
英伟达成为了给AI铺路的人。二十年后的AI,正好需要这种支持大量计算核心的结构——AI领域最常见的卷积运算,本质上是一系列加减乘除的组合。
AI深度学习需要依靠密集且可以大量并行执行的运算,而GPU擅长的正是这种运算。从那时起,英伟达就顺理成章地成为了大部分AI企业的第一选择。
相关资料显示,2020年全球80.6%的云计算和数据中心由英伟达GPU驱动;2021年,中国国内GPU服务器占国内服务器市场规模的比例超过88.4%,而英伟达GPU在其中的占比又超过八成。
2022年三季度,Jon Peddie Research发布报告称,当年Q3独立GPU出货量为1400万台,其中88%的市场份额属于英伟达。
凭票入局AI的时代,每张票面都印着NVIDIA。
2016 年 8 月,英伟达把全球第一台AI超级计算机捐给了当时成立不足一年的OpenAI,并在机器上写下“致Elon和OpenAI 团队,为了计算和人类的未来,我捐出世界上第一台 DGX-1。”
2022年11月发布ChatGPT-3之后,OpenAI背后的金主微软表示,公司的Azure云服务为ChatGPT构建了超过一万枚英伟达A100GPU芯片的AI计算集群,为ChatGPT的开发提供算力支持。
但地主家的余粮也没有很多。
消息人士透露,微软在2022年年末开始在内部实行GPU资源配额供给,但今年1月以来审批时间越来越长,部分申请需要等待几天甚至几周才能获批。而微软先前向英伟达预订的数万枚GPU,也因市场行情的供不应求而到货无期。
下一轮地主,黄仁勋抢了。
赢家老黄
莎士比亚在《奥赛罗》中写道,嫉妒是个绿眼的妖魔,谁落入他的圈套,就要受他玩弄。
嫉妒(envy)源自于拉丁文“invidia”,NVIDIA英伟达的logo,正是一只绿色的眼睛。
这并不是巧合。
黄仁勋和他的英伟达,确实活成了令人嫉妒的赢家——英伟达的AI超级计算机DGX,正是语言大模型背后的引擎。黄仁勋将全球首台DGX交给OpenAI后,超过半数的全球百强企业同样安装了来自英伟达的超级计算机。
根据New Street Research数据显示,目前英伟达GPU已经占据了可用于机器学习的图形处理器市场95%的份额。
为了支持推特自身的AIGC项目,马斯克在近期购买了约一万枚GPU。2023年3月,美国市场研究机构TrendForce发布报告称,处理1800亿个参数的GPT-3.5大模型,需要GPU芯片两万枚。未来GPT大模型商业化所需的GPU芯片数量将会超过三万枚。
云计算行业流传着一种说法:一万枚英伟达A100芯片,是做好AI大模型的算力门槛。
而由于某些原因,国内公司几乎拿不到新的A100、H100芯片,只能采购A800和H800芯片作为替代。
相关机构预估,目前国内大约仅存有3万枚A100芯片,而英伟达推出的A100替代版A800,也是“一票难求”。据悉,部分商家一枚A100GPU的报价已经从原本的约六万美元一路涨至九万甚至十万美元。相对差一些的A800芯片,价格也已超过八万美元。
坊间曾传出一份报告,报告称今年年初百度紧急下单了3000台包含8张芯片的A800服务器(相当于2.4万张A800芯片),预计全年会有A800和H800共5万枚需求。消息人士透露,在百度大模型“文心一言”研发过程的冲刺阶段,几乎占用了集团所有的A100芯片。
阿里云预计也将在今年一万枚左右芯片,其中6000枚是H800。除此之外,阿里云还将采购旗下半导体公司平头哥的自研芯片,每年大约3000枚。而这些包含数万枚A800、H800芯片的订单,单笔的金额不会低于十亿美元。
抢购,还发生在汽车市场。
何小鹏曾在朋友圈转了一篇题为《英伟达A100限令将重创中国自动驾驶》的文章,文章称“芯片短缺将对自动驾驶行业带来挑战”,何小鹏也在配文中承认这是个坏消息。
“但好消息是,刚好我们已经将未来几年的需求提前买回来了”,你以为何小鹏是要守一步,其实他还想将友商一军,“我们会排除万难,将明显超越友商的‘完全自动驾驶’的下一代自动驾驶辅助系统,在明年,全国大范围真正落地。”
何小鹏配了个拳头的表情,像是在表决心,又像是要打人。
从初代图形处理器到显卡神话,从比特币挖矿潮再到如今的ChatGPT,你很难找到第二个像黄仁勋这样“一直是赢家”的人。2023年4月,英伟达的总市值已经达到了6694.69亿美元,超越台积电位居半导体公司之首,相当于五个曾经的芯片霸主因特尔。公司股价单季涨幅90.05%(2023年1至3月),黄仁勋的个人身价也达到了244.56亿美元。
机构预估,未来几年的AI行业将是一个“价值8000亿美元的市场机会”。
伴随着相当于A100芯片性能六倍的H100芯片发布,黄仁勋在2023年3月宣布英伟达将开展一项新的云租赁服务——向B端租赁用于开发ChatGPT等人工智能技术的超级计算机。
看似开源,实则价格不菲——租赁这种包含8个A100或H100旗舰芯片的价格为3.7万美元/月,约合人民币25.4万元。
在ChatGPT时代,望不到追赶者的老黄,还在一路狂飙……
作者 | 伊柒