井喷式爆发即将到来!华为、百度、阿里、京东激战大模型
导读:为期三天的2023世界人工智能大会已经在上海闭幕 ,共有32个重大产业项目签约,总额达288亿元。在今年的世界人工智能大会上,大模型成为外界关注的焦点,国内外总计30余款大模型集体亮相。
目前,华为、百度、阿里、京东、字节跳动、商汤等巨头相继入场“参战”。不过,有分析认为,大模型在井喷式爆发之后,但最终能留存下来的通用大模型只会有2-3家。
//大厂云集,开打大模型//
所谓人工智能大模型,通常指的是经过大规模数据训练后,能够适应一系列任务的模型。
不完全统计显示,目前,已有约30款大模型新品发布或宣布即将发布。
此前,在5月底举行的中关村论坛上,有专家披露,据其统计到当时为止,中国10亿级参数规模以上大模型已发布了79个。如今,随着世界人工智能大会上批量发布的一批大模型,百模大战也已经正式打响。
7月7日,百度、华为、阿里巴巴等企业被工信部中国电子技术标准化研究院授予“国家人工智能标准化总体组大模型专题组”组长单位,正在积极推动大模型国家标准体系建设,助力中国大模型产业发展。
近期发布的大模型新品包括:阿里巴巴的绘画大模型“通义万相”、中国电信的类ChatGPT产品“TeleChat大模型”商汤科技联合香港中文大学和清华大学等推出的“书生通用大模型体系”、第四范式专注企业软件领域的“式说”大模型。
作为国内首个发布大模型的互联网大厂,百度在人工智能大会上公布了“文心一言”最新进展。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰称,文心大模型3.5效果、功能、性能全面提升,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
7月7日下午,华为开发者大会2023(Cloud)在东莞揭开帷幕。华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0,将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。
(张平安发布华为云盘古大模型3.0。图片来源:华为)
阿里云在7月7日的2023世界人工智能大会上宣布了推出通义大模型家族新成员“通义万相”的消息,瞄准文字生成图像赛道。此前,阿里云在今年4月发布了AI大模型通义千问,并宣布通义千问将接入阿里巴巴所有产品,进行全面升级改造。6月1日,阿里云对外推出了面向AI音视频赛道的“通义听悟”。
金山办公最近也发布了他们基于大模型的AI办公产品“WPS AI”,可以润色文章,自动制作表格和PPT。用户可以让AI把一篇提纲制作成PPT,并能随意更换PPT风格。
京东将在7月13日发布的千亿级“言犀大模型”,中国移动将于近期发布“九天”1+N大模型,医渡科技称正在研发医疗大模型,并将于近期针对部分目标场景推出小范围邀请测试。奇安信集团董事长齐向东表示,正在研发安全行业大模型,面向政府和企业客户;10月24日,科大讯飞将发布通用大模型,全面对标ChatGPT。
有一批知名“玩家”行动更早。
字节跳动4月18日发布大模型训练云平台,包括自研DPU等系列云产品,推出新版机器学习平台,支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本,主要为大模型公司提供算力支撑等服务
腾讯云4月14日正式发布新一代高性能计算集群,算力性能和上一代相比提升3倍,服务器接入带宽从1.6T提升到3.2T,是目前国内性能最强的大模型计算集群。
商汤4月10日发布了通用大模型产品“日日新”。7月7日,“日日新”更新到2.0版。
// 入局大模型,至少需10亿美金 //
大模型的“烧钱”已成为业内共识。此前,华为云人工智能领域首席科学家田奇曾在公开演讲中表示,大模型可能收编高度定制化的小模型,导致市场向大公司集中,其资本门槛高,大模型开发和训练一次1200万美元。
昆仑万维此前也在公告中表示,大模型市场已经进入10家左右中大型公司,打3-5年持久战的格局,要做好这件事情,需要长期储备至少10亿美金以上的资金。
根据澎湃新闻报道,网易伏羲预训练及生成式人工智能平台负责人赵增介绍,目前企业入局大模型主要分为两种范式:第一种是着力于通用能力的基础大模型,这也是成本最高、最为昂贵的大模型。另一种则是基于基础大模型的行业垂直大模型,以大部分创业公司为例。
基础大模型以国外的OpenAI,国内的阿里、百度等为例,据浙商证券分析师陈杭此前发布报告,一片英伟达顶级GPU成本为8万元,GPU服务器成本通常超过40万元,“对于ChatGPT而言,支撑其算力基础设施至少需要上万颗英伟达GPU A100,一次模型训练成本超过1200万美元。”行业垂直大模型则以腾讯和大部分创业公司为例。
腾讯高级执行副总裁汤道生表示,基础通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。基于行业大模型构建自己的专属模型,虽然参数比通用大模型少,但是训练和推理的成本更低,优化也更容易,可能是性价比更高的选择。
// 多地支持,人才、基础创新存缺口 //
根据第一财经报道,此次2023世界人工智能大会 ,共有32个重大产业项目签约,总额达288亿元。
在大会的“大模型时代的通用人工智能产业发展机遇以及风险”论坛上,上海市徐汇区委常委、副区长俞林伟宣布了《徐汇区关于支持生成式人工智能发展的若干措施》,推出了大模型产业扶持新政。此外,人工智能产业政策正在各地密集出台,包括北京、上海、深圳等第一梯队,杭州、南京、苏州、成都等第二梯队都在布局。
(图片来源:启明创投x未尽研究《生成式AI》报告)
启明创投发布的《生成式AI》报告显示,第一梯队城市均围绕算力、数据、产业上下游生态加以布局,成为跨区域协作的中心。第二梯队城市也紧随其后,成都是首个在这波AI大模型浪潮中公布政策的西部地区城市,计划到2025年,全市人工智能产业产值突破1500亿元;南京则提出到2025年,全市人工智能核心产业收入超过500亿元。
分析人士认为,目前市场正处于井喷的前夕,人才、基础创新尚存缺口。
//井喷式爆发后,幸存者最多只有3家?//
根据第一财经报道,在WAIC期间,围绕大模型,算力、算法、数据、芯片等基础设施也成了讨论重点。此外,目前大模型都处于几何级的迭代进化中,在未来要如何和行业、场景结合,打通最后一公里,也成为众多嘉宾谈及的关键。
经济观察报援引腾讯高级执行副总裁汤道生观点表示,通用大模型一般基于公开信息来训练,在许多专业知识和行业数据积累不足。在策略上,通用大模型有点像“把大海煮沸”,不够聚焦,可以解决80%的问题,但未必能够满足企业某个场景的具体需求。
徐立也提到,大模型的幻觉性问题仍很严重,是需要解决的问题。幻觉性问题是自然语言处理领域中的基础问题之一,指文本生成模型的生成结果中含有与输入事实上冲突的内容。这些问题造成了大模型“一本正经的胡说八道”现象。
除此之外,清华大学智能产业研究院院长、中国工程院院士张亚勤提到,当下大模型仍有自己的局限性。比如ChatGPT会有时效性问题,你问它它是什么时候发布的,它不知道,因为它使用的是2021年9月前的数据。另外,大模型还有效率低、涉嫌侵犯隐私和知识产权保护问题等,这些问题都将影响大模型的商用。张亚勤认为,大模型效率至少还要提高10倍,才有大规模商用的可能性。
据证券时报报道,本届论坛期间,启明创投和未尽研究共同发布了《生成式AI》报告。 报告提到,2023年把大模型推向了一个高峰,以GPT-4发布为标志,生成式人工智能朝着通用人工智能的方向,进入了创新应用的阶段。
DCCI互联网研究院院长刘兴亮认为,大模型会迎来井喷式爆发,但最终能留存下来的通用大模型只会有2-3家,“通用大模型能留存下来的最多只有三家。但会有很多专业的模型应用于医药、办公等不同的行业场景,未来我们会有不同的AI助理、AI医生、AI家教等角色。”