当前位置:首页 > 投融资 > 产业 > 新兴产业 > 高端装备制造业 > 正文

字节、百度、阿里,为这块芯片抢破了头

来源:每日人物  发布时间:2024-02-18 14:43:37 编辑:诚富

导读:需求似乎是无限的,但英伟达的代工厂台积电产能有限,除了大厂之间的争夺,美国对中国的芯片封锁也让国内的大厂更难买到A100这样的高端芯片。

字节、百度、阿里,为这块芯片抢破了头

包括A800、H100、H800,A100和它的“继承者们”,遭到各方的哄抢,价格水涨船高,最疯狂的时候,在短短一周里,一台由8张A800组成的服务器,可以从230万涨价到330万。有段时间,孙文博感到疑惑:怎么好像在炒比特币?

一个赌局

一个赌局在服务器销售的圈子里悄悄传开:香港新到的300台8卡A100服务器,总货值近8个亿,到底会花落谁手?

关于这个赌局,有层层的迷雾——买家都有谁?不清楚,但有消息说,货是2023年10月的第三个周五进的香港,来自拼多多和金山的采购团队为了这个消息,连夜抵达,严阵以待;货从哪里来的?不知道,据说是一家手段高明的公司,通过英伟达的非授权渠道拿到;具体定价多少?没有准确数字,追踪着这个消息的服务器厂商高管孙文博说:“话语权在卖方,肯定会为这批货筛选到价格最高、现金最多、交易条件最好、未来有望继续合作的买方。”

A100,一个颇具科幻气息的名字,容易让人联想到《终结者》中的机器人代号。实际上,这是一种GPU芯片,采用7nm制程,制造它的光刻机,需要在大约万分之一根头发丝细的空间里进行精细的雕刻。在大约826平方毫米——不到一张3cm*3cm便签纸大的面积里,容纳了足足540亿个晶体管。它的设计公司英伟达,用科学家的名字来命名产品,A来自电磁学科学家安培(Ampere),而A100的前代产品V100,来自电池的发明者伏特(Volta)。

与每台电脑中都有的中央处理器(CPU)不同,GPU似乎离普通人有点远,它在电脑中的另一个名字是显卡,负责图像处理、视频渲染,热衷打游戏的年轻人,会为一块高性能显卡省吃俭用,而GPU的另一个主要场景是“挖矿”,单枚价值数万美元的比特币,就是GPU昼夜不停运作的产物。

如果说CPU是一个数学系毕业的高材生,能计算各种艰深复杂的问题,GPU就像是汇集了一万个只会1+1=2的小学生,能以最快的速度处理海量简单重复的问题,而这正是训练人工智能最需要的能力,通过对庞大数据的学习、分析、推理,让机器像人类那样解决问题。学习的数据越多,机器越聪明,但处理海量数据需要强大的芯片,A100正是为此而生,它靠着超强算力,被誉为“GPU中的王者” “一片顶六片”。

在美国科技公司OpenAI推出的大语言模型ChatGPT惊艳了全世界之后,国内的互联网公司、大模型业公司都大步快跑,冲进这个最有前景的赛道,百度、阿里、科大讯飞、360等互联网大厂,和不少初创企业,都抓紧推出自家的大模型,轰轰烈烈的“百模大战”彻底打响。

大模型之争的关键在于算力和数据,理论上说,只要GPU数量足够多(例如有10000台服务器),一家公司甚至可以在极短的时间之内训练出一个不逊色于ChatGPT 4的大模型,而A100就是挖掘大模型金矿时最锋利的那把铲子。除了大模型,各类人工智能公司,包括计算机视觉、语音交互、智能驾驶等,都需要这把铲子。

需求似乎是无限的,但英伟达的代工厂台积电产能有限,除了大厂之间的争夺,美国对中国的芯片封锁也让国内的大厂更难买到A100这样的高端芯片。包括A800、H100、H800,A100和它的“继承者们”,遭到各方的哄抢,价格水涨船高,最疯狂的时候,在短短一周里,一台由8张A800组成的服务器,可以从230万涨价到330万。有段时间,孙文博感到疑惑:怎么好像在炒比特币?

在无限的需求、有限的供给和时间当中,流转着巨额的钱和掘金者们的冀望,考验着大厂和创业公司们的嗅觉、财力、战略和决策效率。全新的排位赛中,有个体的命运沉浮,也有企业的野心、欲望和争夺。

就像那个赌局,尽管还不知道结果,但行内人都估量,拼多多做电商的,业务跟大模型无关,也没有传出做大模型的消息,但AI时代,先下注总比错过好。就算不做大模型,转售出去,或是做算力租赁,也是稳赚不赔的好生意。至于金山,虽然自家的WPS AI也需要算力芯片,但估计吃不下这么大的单子,财力也稍逊一筹。

暧昧不明的交易,以及谣言、猜测、赌局,都成了大模型和A100疯狂的注脚。

烧钱游戏

王子鹏第一次感到风暴袭来,是在2023年的5月。

来自美团的高管带着采购团队,把他供职的服务器厂商——宝德信息科技有限公司库存里仅剩的数百台8卡A100服务器,像买白菜一样全部扫走。尽管一台机器的价格要大几十万,总订单额过亿,美团的人丝毫没有犹豫,下单、签合同、打预付款、提货……流程飞快。

事实上,在专业的领域里,A100从来不是什么稀罕事物。大模型的风刮起来之前,A100等算力芯片的购买者大多是国内大型的实验室,例如鹏程实验室、智源实验室、之江实验室、中科院的计算所,曾经购买过上百台服务器。除此之外,还有一些人工智能相关业务的公司,比如抖音疯狂增长的那几年,为了训练AI进行内容审核,也曾找宝德订购了不少V100服务器,“一年买两个多亿”。

作为曾经的服务器销冠、如今的高管,王子鹏自称是“战场最前端战壕里的瞭望员”,行业里每个细微的变化,都是销售们最先知道。但那一次,他和同事都看走了眼,以“相当低的价格”出售,“就是平进平出走个量,挣一个点、两个点”。这让公司的高层日后都懊悔不已,觉得做了“赔本生意”。

2023年3月14日,OpenAI发布GPT-4,以此为时间点,大模型赛道突然涌进来大量的钱、公司、采购团队,曾经并不紧俏的A100,突然成了抢手货。而就在2022年的10月,美国商务部对高性能芯片作出额外出口限制,禁止美国公司向中国实体出售高端芯片,A100正在其中。政策是政策,生意是生意,英伟达转而推出了A100的中国特供版——A800,王子鹏打了个比方,与A100相比,A800“就像是把汽车的输油管改细了一点,发动机和轮胎还是原来的东西”。

最初,所有人都追逐最好的东西——市场里有限的A100。需求暴涨,2022年10月之前,“就是一个正常的市场”,到了2023年的5月,“至少得是以前50倍以上的需求量”。美团扫货之后的短短几个月,A100和8卡A100服务器的价格水涨船高,涨到了13-16万/张和135-160万/台左右,这意味着,以前5个亿能买下来的东西,现在要10个亿。

昂贵的价格让这场芯片争夺战变成了烧钱战。价格就是这么涨上去的:在卖方市场里,一批货没有准确的买家,谁出的钱多,就归谁。还有一种情况,厂商签下了订单,宁可付违约金,只交付50%,也要把剩下的货用更高的价格卖出去。

众多买家里,字节是业内公认投入最多的那个。有知情人士透露,字节内部采购了大约13600张A100,按照一张卡7万元的最低价格计算,光这些芯片就价值9.52亿。

一家大厂在内部资料中估算,目前字节拥有20多万张算力芯片,其中约10万张是A100/A800/H800等高算力芯片。这些芯片当中,有一小部分对外出租,未被出租的高算力芯片则被用于字节大模型的训练和推理,还有一些其他型号被用于支持公司内部业务推理场景,比如兴趣电商、抖音搜索、抖音广告排序等。

等市面上仅剩的A100被哄抢得差不多了,对A800的需求逐渐成了主流。此时,更多的大厂和创业公司入局了,比如拼多多,在2023年的下半年组建了大模型团队,招兵买马,开出了百万年薪挖角人才。对算力的需求就像一个越吹越大的气球,A800的价格达到了比A100更高的高度——在2023年10月,一台8卡A800服务器的价格达到了220-230万左右。

双重考验

A100和A800的疯狂,是市场需求和政策禁令双重叠加,催生出的极致供需矛盾的体现。而在涨价和禁令的夹缝之中,大厂和创业公司们也面临着双重考验。

第一重考验是嗅觉和战略决策能力。

本身就探索人工智能前沿技术的阿里达摩院、科大讯飞、百度和商汤科技等公司,长期跟算力芯片打交道,是最早布局、嗅觉也最敏锐的公司。王子鹏和孙文博都曾得到过消息,字节和阿里是最先向英伟达下单的,“都下了近一万张卡的订单”。百度后来之所以最早推出文心一言,也是因为提前采购了算力芯片。

由于涉及大量的钱,事关公司未来发展,大模型项目以及采购算力芯片等事项,大多是公司最高层来决策。一位阿里云人士透露,阿里云内部有一个供应链团队,其中有几十人负责芯片采购,直接听命于CTO。而在阿里云前CEO张勇卸任之前,通义千问等人工智能项目由他亲自盯进度。

据《晚点》报道,在百度开始文心一言内测前,百度创始人兼CEO李彦宏每晚和项目团队开会,他们为筹备产品,一度睡在公司里;而即便已经卸任CEO,张一鸣也在看人工智能论文,经常跟一些字节人士分享论文学习心得和对 ChatGPT的思考。一把手们的重视,让这些公司在这场比赛中占了先机,省下了数以亿计的成本。

而“A100们”设下的第二层考验,是公司内部的沟通和执行能力。

正如一个“打地鼠游戏”,2022年英伟达推出了A100的特供版A800,但2023年10月23日,这款芯片也被列入了禁售列表。跟它一起被禁售的,还有H100的特供版H800,只给中国公司留下了30天的应对时间。

王子鹏记得,在2023年的10月,A800、H100等产品的订单都已经排到了一年后,有英伟达的销售告诉他,公司会断掉一些老产品、低性能产品的供应,把产能都集中到高性能算力芯片上,但即便如此,产能还是不够。这意味着,从英伟达拿货已经不太现实。

市场变化得极快,产品、价格、货期随时变化,那些决策不够快的大厂,会在此时暴露出问题。

孙文博与京东的采购打过交道。京东供应链体系有上千人,专门采购算力芯片的团队有近20人,负责人直接向VP汇报。他们不关心配置、技术,认准了产品型号直接谈价格,这是他们最关心的三个问题之一,另外两个是交货期和具体的交货条件,比如预付款占比、违约条款等。

孙文博还记得京东采购团队的犹豫,“他们一直在追着市场走”。10月上旬,A800还有货,价格在220-230万左右,采购团队向高层汇报后,始终没有得到具体的答复,没有“是”,也没有“否”。直到需求涨起来了,才提出以250万的价格购入1000台服务器,但这时,市场上的价格已经高达320万。

犹豫和观望是有成本的,可能是几千万,也可能是几个亿。孙文博觉得无奈,“劝他们买的时候他们不买,要等价格下跌,结果等到的是上涨”。

后来,孙文博观察到,随着A100、A800价格的高涨,京东的决策周期在变快,从前把情况报给高层没有反馈,“知道了,但很久不决策”,如今,“两三天基本上会给你一个结果,因为超过两天没有决策,基本上这批货就没了”。

卖铲子和水的人

2024年,曾经风光的大厂们,年会要么取消,要么低调举办。沉默的互联网世界,只有英伟达还热闹着。CEO黄仁勋首次参加英伟达中国区的年会,他穿着一身东北大花马甲,笑容灿烂,跟员工一起扭起了秧歌。那股热闹喜庆,也是英伟达这一年的写照。

大模型狂奔、算力芯片被争夺,英伟达成了最大的赢家。假如说大模型创业公司和互联网大厂们在人工智能的世界里掘金,那英伟达就是卖水和铲子的人,市值在一年多时间里暴涨6倍,前几日甚至超过了亚马逊和谷歌,以1.83万亿美元的市值位居全球第四。

在国内,有两种方式可以购买英伟达的产品,一种是通过英伟达的合作伙伴网络内的代理商单独购买GPU卡,例如英迈,神码、丽台;另一种是找到英伟达的OEM整机合作伙伴,直接购买含有英伟达GPU的服务器整机,例如浪潮信息、宝德信息。

假如是前一种方式,根据36Kr的报道,2023年上半年,高算力芯片要像爱马仕一样,配货才能购买,阿里、字节这样财力雄厚、订单量大的大厂,可能会优先供货。

假如是后者,王子鹏说,英伟达对于渠道管理非常严格,根据销售额给渠道划分级别,连续两年达标才可以申请升级,否则就会下降。不同级别拿到的产品价格又是不一样的,级别越高,作为中间商的利润空间就越大。

巨头之下,有不少人在跟着吃肉喝汤,在大模型真正赚到钱之前,这些卖铲子的分销人和中间商早已赚得盆满钵满。

王子鹏曾经跟浪潮的高层交流,“浪潮60%的业绩是互联网一个行业撑起来的”。有一次,王子鹏接到一个浪潮转过来的订单,对方销售称,某运营商有30台8卡A100需求,公司没有货,“要不转给你们做?”王子鹏一脸疑惑:“你们公司怎么可能没有货,全中国囤货最多,销量最大,怎么连运营商都敢得罪。”结果对方说,浪潮的货都优先供给互联网公司了。

尽管不是最大的服务器厂商,宝德也在风口中赚了一笔。直到今天,王子鹏依然觉得不可思议,原来一年才卖十几二十台,碰见大项目可能走个三五十台,现在大量的询价、订单流向自己,一张口就是20台、30台,“我们当时都惊呆了,20台、30台这个订单就是2000万、3000万”,这样的单子,每天都有好几个。

当A100们被几家大厂瓜分,大厂也摇身一变,成为算力租赁商,争做大模型掘金热潮中的卖水人。最典型的是阿里和字节。

前阿里云员工杨箫透露,阿里的战略特殊,不靠大模型赚钱,靠的是生态。已经发布并开源的通义千问就像一个样板间,谁都可以使用阿里的代码,让自己的大模型跑起来,然后来阿里租赁算力。“阿里的大模型是一个带动性的东西,真正赚钱的是卖‘水’。”

在阿里,一台8卡的服务器算力一个月的租赁价格在15万-20万左右,至少4台起卖,这意味着,一台机器只要租出去8个月就可以收回成本。

字节的火山云也像阿里云一样在卖算力,杨箫说:“区别在于,字节纯卖水,阿里在卖水的基础上,还卖服务,一整套解决方案卖给你。”正因如此,阿里的算力价格比字节更贵。

现在,阿里和字节在这门生意上已经成了对头,双方互相探听对方算力芯片的数量、价格。在阿里云,可能只有CEO吴泳铭、CTO周靖人这样级别的高管才知道自己公司一共囤了多少张芯片,但大家都听说过字节囤了多少张。价格战也打响了。字节的火山云销售会询问客户,“阿里跟你们要多少钱?我们六折”。

创业大模型公司作为融资最多、现金流丰裕的客户,是双方争抢的关键。李开复的零一万物和王慧文退出的光年之外,选择了阿里;而在海外名声更大的Minimax,行业内看好的智谱AI,主要使用字节火山云的算力。

2023年也是智能驾驶竞争激烈、开城落地的关键之年,对算力芯片也有庞大的需求。智驾公司元戎启行,曾是阿里云智算业务的客户。新势力中的蔚小理,纷纷成立了智算中心,蔚来的在合肥,小鹏在乌兰察布,都跟阿里合作,理想的在山西,跟火山引擎合作。不过,到了买算力的档口,还是要看哪家性价比更高、更适合自己。一位阿里云人士透露,蔚来曾经在阿里“跑过一个小集群和demo”,但最终还是选了更便宜的字节。

当算力的储备远远供不上需求,阿里云智算业务也像英伟达和浪潮一样,调整了客户策略。“内部有一个客户评级体系,起码到6-7级以上,也就是订单金额在千万以上,才有成为阿里云智算业务客户的机会。”

风口里的人

2022年8月底,美国的芯片禁令下来,A100、H100名列其中。那个月,王子鹏手里刚好有一个项目,机器预计在禁售的前一天抵达香港海关。但到了第二天,那台机器没能进来,英伟达给公司退了款——也就是那台机器的订购价格,近百万。没多久,这台机器的价格就涨到了他不敢相信的数字。

市场里的涨幅,是以十万、百万为单位的。孙文博记得,在10月25号左右,一台H800服务器在国内现货市场的成交价格是220万-230万一台,一周后,11月2日,美国出了最新的政策,服务器的价格从220万直接涨了100万,达到了320万。到了11月,价格还在涨,最高报到了385万。

市场疯狂的上涨让一夜暴富的故事批量上演。

有人看准了时机,在服务器90万的时候囤货,等涨到110万再卖出去,也有人胆子够大,可以等到120万甚至220万的时候再卖。王子鹏总结,“风浪越大,鱼越贵”。孙文博说:“最疯的时候有多少疯?比如你手里有个三五台,因为各种原因没有卖掉,放在那,10天时间,资产就涨了50%。”

据36Kr报道,2023年底,英伟达中国区的销售都联系不上,因为这一年太赚钱,纷纷出国度假了。一家叫声智科技的公司,本来是做电动牙刷和智能家电的,不知道为什么囤了一大批A100,算力租赁做得风生水起。

也有很多唏嘘和感慨。在80台8卡A100服务器以很低的价格被美团扫货之后,宝德的高层领导幡然醒悟,王子鹏记得,“一直在骂销售,说你把我这个东西贱卖,让公司少赚了大几百万纯利润”。

每隔一段时间,这件事就要被老板重新提起来一次,成为督促销售们“看准时机”的反面案例,“说为什么这波这大模型没有抓住,为什么没有赚到钱”。或者是,“你这个事情给我干好,要不然又像大模型一样错失机会”。

骗局、贪腐也出现了。有人在小红书上倒卖A100、A800等芯片。一位自称手里有A100现货的中间商声称,从2023年的3月开始,陆续有人找到他询问有没有货,半年时间,他卖出去大约十几片。

王子鹏认为,在社交平台上声称自己有货源的,很可能是假货源,也有可能是40g的库存货,因为内存不够大,这些A100通常被当做作训练大模型的第二或者第三梯队用卡,大家哄抢的是80g内存的算力芯片。还有一种可能,是互联网大厂中隐秘的贪腐:“互联网可能有很多个数据中心,拆出来卖掉也是有可能的,那么多的卡,回头跟公司报修一下,就说是坏了,也能糊弄过去。”

热情、失落、疲惫、震撼,这个行业以一种前所未有的姿态冲击着人们。孙文博说,作为销售,他承担着所有的情绪——服务器涨价,客户的气撒在他身上;货供不上,老板的焦虑也传递到他这里来,他的神经高度紧绷着,2023年一整年,他的电话24小时待机,不管是谁打来电话,他都会在第一时间接听。

经历了良多,王子鹏依然觉得,这是时代给他的机会。2020年时,他向客户介绍A100,需要把它的历史渊源、性能优势从头到尾讲个清楚,而整个公司,一年才卖十几台服务器。到了2023年下半年,每次他开口给客户介绍产品,对方会给他一个“我懂”的眼神,谈话直接进入下一阶段,“没想到三年以后,我这套专业的说辞变成人尽皆知”。他意识到,那个鼓点,他踩中了。

风口还是风险?

芯片是一个典型的全球化产品。一块芯片,可能由英伟达设计,使用荷兰阿斯麦公司(ASML)的光刻机生产,在台湾的台积电封装,而每一个环节又涉及到更多的国家、企业。

因此,芯片行业与其他行业最大的不同在于,美元汇率、国际形势甚至自然灾害,都会影响到一块芯片的成本、价格和供需关系,而这其中蕴藏着巨大的风险。

一位浪潮的中层销售王初告诉每日人物,在美国发布新规、继续加码,英伟达A100、A800、H100、H800都被禁售的10月底,公司乱成了一锅粥。“我们按照订单金额20%收定金,光定金就收了30个亿,倒推回去,150个亿的单子,供不上。”

缺卡态势严重,王初的一位同事,一个单子8个亿,只供了40多台机器,还有7亿多供不上。公司一到货一批货,就会被哄抢,不知道该分给哪些部门、哪些客户。有的客户已经不愿意再排队等待,撤单的消息一个个传过来。

王初长叹了一声,“浪潮今年好不容易有个新的增长点,是英伟达最大的合作伙伴,所以我们拿到的卡是最多的,拿到的订单是最多的,但现在卡一禁售,对我们影响也非常大”。

处于危机中的还有一些算力租赁公司。他们签下了大量订单,却无力供给,孙文博说:“有个公司董事长说自己,现在在外面已经签了10个亿的合同,结果1个亿的货都没有,每天早上一醒来一屁股的债。”

最大的赢家英伟达,也吃了苦头。黄仁勋曾透露,中国市场占英伟达销售额的大约20%,而美国阻止英伟达向中国销售最先进芯片,如同将“双手绑在背后”。

在国内,国产芯片已经瞄准了这块新空出来的市场,比如华为推出了Atlas 800 AI训练服务器,其中包含8片昇腾处理器。古希腊神话里,Atlas是擎天之神,因为反抗宙斯失败,被罚在世界最西处,用头和手撑住天空。这个名字寄托了华为的愿望,也暗示着华为的处境。

但有业内人士评价:“华为的生态比英伟达差一些,生态的切换是一个庞大且复杂的工程,大家用英伟达的卡和生态太久了,切换起来很困难。”

对算力的信仰,建立在对人工智能的笃定之上,但现在,大模型的乱战,带来的不只有金钱、欲望和争斗,还有一些迷茫。

某211高校信息工程学院副教授赵佳有一种被挤压的感觉:“所有大厂都在做大模型,不知道自己该做什么。”在这场风刮起来之前,他做的是一些“小模型”,借助少量的算力去实现一些现实中的工程目标,比如在南方没有人烟的地方,不再需要工人去一个个检查电线是否完好,而是换成载着人工智能程序的无人机去“巡线”,判断电线上有没有冰,绝缘子有没有裂缝,精准定位后再报修。但因为算力服务器价格的暴涨,他的项目预算不够了,只停留在了“小模型”的阶段,没办法进一步深入。

他对当下数量庞大的大模型感到不理解,“有这么多大语言模型,然后呢?”在他看来,许多大模型产品更多是一种噱头,没有实际的用处,花掉那么多的钱、资源、算力,几乎是浪费。

在几年前一次人工智能相关的学术会议中,刚入行的王子鹏偶遇一位北大药学院的老教授,他有点疑惑,药学教授怎么来参加人工智能会议?对方回答,人工智能可以在很多领域里带来革命性的改变,包括制药。那是一种关于可能性的战争,找到符合标准的化合物并不容易,可能在各个环节遭遇失败,一款新药上市可能需要花掉10年、10亿美元。但人工智能可以在各个流程上替人类计算、预测、筛选,最大程度地缩短时间、节省成本。

王子鹏“被刷新了认知”,原来,AI真的可以改变世界。但几年过去了,他发觉,目前被改变的好像只有商业的世界,那个钱和欲望流动的地方。而对大模型的狂热和对算力的追捧,到底能走到哪一步,谁也没有答案。

(文中受访者均为化名)