京东成立跨部门项目组 推动大模型优化
导读:5月6日消息,京东集团副总裁、京东科技智能服务与产品部负责人何晓冬近日在接受澎湃新闻采访时表示,希望京东千亿大模型在内部的产业实践中产生效果,先在核心产业上落地,再逐步提供给合作伙伴使用。据他透露,目前京东内部已成立跨部门项目组推动大模型进一步优化。
作者/柏纳
5月6日消息,京东集团副总裁、京东科技智能服务与产品部负责人何晓冬近日在接受澎湃新闻采访时表示,希望京东千亿大模型在内部的产业实践中产生效果,先在核心产业上落地,再逐步提供给合作伙伴使用。据他透露,目前京东内部已成立跨部门项目组推动大模型进一步优化。
何晓冬曾在4月举行的人工智能大模型技术高峰论坛上透露,言犀是“京东版”ChatGPT,言犀大模型预训练参数达到千亿级,品类覆盖3000+,人工审核通过率95%+、生成文字30亿+。
“京东有自身产业链、实际产品可以应用到AI技术中,在供应链环节中落地场景较多,也有更多可以打磨技术的机会,尤其是在落地中会有更多精准和深度推理的需求,这是京东最大的优势。”何晓冬告诉澎湃新闻记者,第二个优势是,京东提供To B(To Businesses,对企业)端服务,经常接触零售、金融、交通等不同行业的客户,在实际技术开发中结合双方优势,更能把握企业的需求。
在何晓冬看来,大模型在落地过程中会涌现大量问题,只有通过大模型解决实际产业场景的问题,才能实现产业价值,从而反哺技术形成真正闭环。他介绍,京东云入局AI研究已接近五年,2020年京东云成立“言犀”人工智能应用平台,探索语音技术、智能客服、数字人等。目前,相关产品已经逐步探索出应用前景和商业空间。
据悉,京东今年2月宣布,言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版GPT,名为“ChatJD”。未来“ChatJD”将以“125”计划作为落地应用路线图,包含一个平台、两个领域、五个应用。1个平台指ChatJD智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级。2个领域包含零售与金融领域。5个应用包含内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业等应用场景。
值得一提的是,天眼查App显示,近日,北京京东叁佰陆拾度电子商务有限公司申请注册“ChatRhino”商标,国际分类为网站服务,当前商标进度为申请中。
此外,“一夜爆红”的大模型,在何晓东看来已有长期技术积累。他透露,在京东内部,近年来十亿级别和百亿级别的大模型已有大量应用,“大模型越大,部署成本就越低,这也是大家坚持把大模型做大的原因,会有更低的门槛和更高的效率部署到产业上去。”
“展望未来,我们将很快进入智能交互时代,搜索框可能会变成对话框,内容的获取不再是通过匹配,而是通过精准生成。”何晓冬表示。在他看来,生成式AI的商业化路径逐渐清晰:最先突破的是文本生成,此后代码、图像、视频、游戏、3D动画等也会迅速实现商业化。
对于未来趋势,何晓冬认为,多模态的大模型会成为下一个技术趋势。从产业应用来看,常规大模型经过简单适配就可以实现快速迁移,因此大模型的规模扩大会降低部署门槛和提升效率,并在金融、零售、政务、交通等场景广泛应用。
除了ChatGPT以外,目前已推出的产业大模型还包括“文心一言”、“通义千问”、“盘古大模型”等。