80余个国内AI大模型混战 场景之问待破冰
导读:随着ChatGPT掀起大模型的发展热潮,人工智能产业风头更劲,业界、学界、公众高度关注。
7月2日,由北京市人民政府联合工业和信息化部、国家网信办、商务部、中国科协共同主办的全球数字经济大会在北京召开,其中包括人工智能高峰论坛,聚焦通用人工智能、大模型发展等热点问题。
目前,已有80余个大模型公开发布,但大模型的商业化落地才最为关键。论坛参与嘉宾对大模型商业化应用落地提出了设想:大模型必须通用,赋能百行千业才能引领工业革命,必须触点到具体的应用场景,充分挖掘商业价值。
大模型必须通用
此前有声音指出,大模型是风口和泡沫。“大模型是真智能,其标志着通用人工智能的到来。”360创始人周鸿祎说,“大模型直接提高每个人、每个组织的生产力,同时实现赋能。电脑刚发明时并未带动工业革命,距离普通人、普通企业也很远,后来电脑走入家庭和企业才改变了世界。”
衔院科技创始人周伯文指出,ChatGPT使人工智能走到新拐点,AI的本质应当是与人协同交互,从交互中学习,进而协同人类解决问题。
他指出,人工智能演化分为三阶段:
阶段一为ANI,狭义人工智能,已经实现。该阶段机器高度受监督,需要大量人工标记的数据;任务范围狭窄,需要为新任务训练新模式。
阶段二为ABI,广义人工智能,也就是当前阶段。可实现自监督,无需过多明示教学;端对端,即一个模型可以完成多项任务,以及涌现能力、零样本学习等技能。
阶段三则为AGI,通用人工智能,尚未到来。这时人工智能比人类更聪明,且总是学着变得更聪明,独立、自主发展,可能会失控。
“ABI阶段人工智能已经足够强大,可以创造价值,又不必太过担心负面影响。我们应尽量把人工智能的研究深化落地,为将来的AGI做好准备。”周伯文指出。
根据麦肯锡2022全球人工智能调研报告,中国人工智能使用率暂时落后于全球平均水平,较世界领先国家仍有较大提升空间。只有9%的中国企业可借助AI实现10%以上的收入增长,而领先国家受访企业中有19%的公司能实现该增长。
论坛上,与会嘉宾的共识是抓住本轮人工智能发展机会,利用大模型赋能产业。
周鸿祎认为,大模型发展真正的机会在中国,政府、城市、企业都有广阔的应用市场,中国做大模型最应该抓住产业互联网发展的机会。他同时指出,对行业而言,只有大模型走进千家万户、赋能百行千业,才能真正推动人工智能带来的这场革命。
有人将大模型比喻为操作系统,大部分公司没有机会使用。周鸿祎则认为,未来大模型不会只有一两个,而是像数据库一样,变成每个数字化系统的标配,从手机部署到汽车部署,也包括在企业和政府内部的部署。
多个垂直模型组合
如何利用大模型赋能产业发展?与会嘉宾给出了自己的解题思路。
从硬件层面,周鸿祎给出的答案是做行业化、企业化、垂直化、小型化、专有化的大模型。
他直言,企业级场景落地大模型面临的“四个问题”:第一,公有大模型缺乏行业深度。公有大模型与组织内部业务结合不紧密,知识不互通,不能满足企业级应用场景的垂直性、专业性要求。
第二,公有大模型存在数据安全隐患。组织内部知识库不适合训练到公有大模型中;公有大模型易造成企业内部数据泄露。
第三,公有大模型无法保障内容可信。大模型存在“幻觉”,无法保障内容真实可信、有据可查;企业内部数据更新迭代速度快,公有大模型无法实现知识实时更新。
第四,公有大模型无法实现成本可控。直接训练和部署千亿级参数大模型成本过高,企业级应用应使用百亿级基础模型,根据不同需求训练不同的垂直模型,企业则只需要负担垂直训练成本。
“对很多企业来说,训练企业级大模型的成本已在急剧降低,我们的目的是把大模型‘拉下神坛’,变成每个企业、政府部门都能够直接使用的东西。”周鸿祎说。
到底需要什么样的大模型?如何解决上述问题?
周鸿祎认为大模型要做到以下几点:一是行业化,有行业深度训练的数据才有价值;二是企业化,需要和企业内部知识库进行配合,做到实时迭代更新,从而保证大模型更懂企业;三是垂直化,“不要试图用一个大模型解决所有问题,大模型未来在企业落地形态一定是多个垂直模型组合,垂直模型解决专业问题的能力更强。”周鸿祎表示。
四是小型化,做小规模的大模型,百亿参数的大模型成本更低,部署升级也更灵活;五是专有化,专有部署才能保证安全可控。
昆仑万维(40.750, 0.04, 0.10%)科技股份有限公司CEO方汉则指出,高质量数据对大模型发展至关重要。目前国内大模型发展前景是To B和To C战略并重,不过大模型在B端发力必须搭配高质量的行业数据,但目前行业数据存在碎片化、分割化的问题。
“坦白地讲,最近三年的大模型训练积累的是对丰富的预训练数据深度加工能力。OpenAI所有公开的论文和讲演,对训练过程和训练算法都是公开的,但其从不公开模型结构及数据处理。”方汉指出,目前全世界大模型预训练团队都试图重现OpenAI在模型架构的动作以及预训练数据的动作,任何一家企业的预训练数据加工能力都至关重要。
他表示,预训练大模型对于行业数据质量要求极高,只有拥有底座大模型和预训练数据处理的公司才能快速定制行业模型,目前国内定制大模型企业将快速向头部汇聚。
寻找场景
在业务场景等方面,与会嘉宾认为,大模型要充分触点应用场景。
周伯文表示,大模型能否和业务充分结合,从而真正解决业务问题,是决定AI能否实现经济价值的关键因素。只有紧贴业务的AI战略设计、完善的配套架构、充足的AI人才及健全的内部培养机制,才能使AI与业务发展需求充分融合,最大化经济收益。
他从消费场景方面提出了自己的见解,“B2C的方向,B端企业主导生产和销售,难以满足C端用户的个性化需求,试错成本高,商品滞销带来积压浪费;如果是C2B的角度,以消费者为中心,C端用户占据主导,企业根据消费者需求按需生产,不仅可以提升销售额,还能够减少积压浪费。”
周伯文表示,在具体应用场景中,可以用大模型对消费者和产品二元管理进行重构,针对真实世界的消费者和产品互动的数据,理解消费者的思想和情感,洞悉消费者所处的状态和体验,围绕5D(机会洞察Discover,爆品定义Define,产品设计Design,具体研发Develop,触达转化Distribute),把所有消费者和产品的信息压缩进入模型。
本轮AI变革带来了人机交互方式的根本性变革。第四范式副总裁、主任科学家涂威威认为,从B端来看,这是非常大的机会。“过去很长一段时间,企业软件的市场用户体验是很糟糕的,大部分情况下,80%的用户只使用了20%的功能,软件价值远远没有被发掘出来。如果有这样人机交互更自然的方式,软件使用门槛和开发使用效率都会降低很多。大模型需要针对这样的垂直场景去做更多的优化。”他指出。
从投资的角度,君联资本执行董事纪海泉指出,大模型领域首要投资的是底座技术,但投资者并不期望底座的应用技术快速成熟,大模型领域劳动分工短期内也不会发生;其次投资关注的是垂直一体化的大模型,从底座到上层应用由一家公司完成,未来金融、教育、汽车等行业会出现一系列行业垂直一体化的大模型公司。而随着大模型底座逐渐成熟,与公有云类似,未来可能会产生一些类似云原生的AGI原生公司,也可能会出现像ChatGPT这样的Killer APP。