对标DeepMind Gato,人工智能模型「DB1」已在多领域落地验证
导读:人工智能模型公司「谜题科技」聚焦在决策智能领域,于2022年12月发布推出了对标DeepMind Gato的人工智能模型DB1,该模型由CV、NLP、强化学习和多智能体四者嵌套于一体,可面对单智能体和多智能体进行连续的、离散的决策判断,同时还具备泛化迁移能力,支持并发处理千个以上决策任务。
作者丨吴思瑾
大语言模型的火爆已经不必多言。在爆发的同时,越来越多其他领域的大模型也开始出现在聚光灯下。
36氪近期接触到一家人工智能模型公司「谜题科技」,聚焦在决策智能领域,于2022年12月发布推出了对标DeepMind Gato的人工智能模型DB1,该模型由CV、NLP、强化学习和多智能体四者嵌套于一体,可面对单智能体和多智能体进行连续的、离散的决策判断,同时还具备泛化迁移能力,支持并发处理千个以上决策任务。据介绍,谜题年内还将发布同系列模型DB2。
DB1对标的Gato是DeepMind在2022年5月推出的“通才”型人工智能模型,会根据上下文决定是否输出文本、关节扭力、按钮按压或其他标记物,具有多模态、多任务和多组件的特点。官方信息显示,Gato可以执行604项不同的、多领域一般任务,这些任务具有不同的模式、观察和行动规范,比如在具有相同权重的同一网络下可以完成玩雅达利游戏、给图片加标题、聊天和用真正的机器人手臂堆积积木等等……
谜题科技首席科学家汪军向36氪介绍:“DB1是全球首个人工智能多模态决策大模型,在多方面有着超越Gato的表现,比如DB1不止支持单智能体控制,还支持多智能体协同、人机策略协同;在参数量上也超越11.8亿的Gato达到13.2亿;与Gato追求在虚拟空间中无限衍生任务能力不同的是,DB1更注重在产业中落地,成为企业环境中的超级大脑。”
图源:谜题科技
以目前大热的AIGC(AI Generated content,人工智能生成内容)为参照,谜题认为自己属于AIGA(AI Generated Action,人工智能生成决策)范畴。
AIGC的核心是大语言模型,大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本含义,完成多种自然语言任务,如文本分类、问答、对话等。
谜题所说的AIGA是指通过深度学习技术,在原有从数据中发现规律的基础上,再次将规律返回至产生数据的动作本身,生成新的数据从而实现迭代。在这个过程中,模型积累了“理解”能力和“决策”能力,这种能力需要在产业场景中落地,才能为企业带来价值。
AIGA以决策大模型为核心,谜题的决策大模型DB1是一个输入自然语言、图像、控制、机理、决策、仿真等多任务、多模态数据的预训练系统,通过结合产业场景任务进行微调,形成定制化的模型训练系统,帮助企业解决决策问题。
与当前主流的千亿参数大语言模型不同,DB1只有10亿级别,为此汪军向36氪介绍:“DB1主要面向ToB产业场景,和面向ToC通用场景的大语言模型不同,因此技术上暂不需要更大的参数;虽然DB1才10亿级别,但已经在产业落地实践过程中取得了较为惊艳的表现,以某电力公司设备自动化运维场景为例,谜题已经解决了其以前70%以上根本解决不了的问题。此外,‘决策’本身就是一件很难的事情,因此想要找到大量决策类数据用于训练,也是公司发展过程中必须面对的挑战,目前谜题的做法是除开源数据外,还构建了大量小模型来生产决策、轨迹和控制等数据变成大模型的学习输入。未来,随着DB1产业应用数据的不断扩大,参数规模也将随之变大,性能和表现定会提升,谜题更长远的目标是成为以决策大模型为核心的决策智能平台,去解决产业上的各类复杂问题。”
2022年,谜题合同收入过千万,6个合作项目分布在通信、自动驾驶、汽车、能源等领域,应用场景包括游戏智能、机器人控制、多智能体协同、自动运维及优化等。
在具体的应用场景中,DB1需要与ChatGPT这类聊天机器人协同才能完成任务。人类通过对聊天机器人下达任务,聊天机器人驱动DB1进行任务分解,并通过API操控其他系统完成执行。比如ToB场景下的机器协作控制、设备动态自主运维、企业自动化调度、软件开发测试、能源智能优化和超级RPA;ToC场景下的游戏生产和NPC智能及超个性化助理。
图源:谜题科技
为了实现这种交互,DB1的训练方向包括:与计算机交互且具有逻辑思维和决策能力、与互联网交互并实现自学习、通过API操控外部环境的能力。
之所以谜题能完成决策智能领域的人工智能模型研发,与其团队背景和资质有着紧密的关系。首席科学家汪军是伦敦大学学院(UCL)计算机系教授、上海交通大学-约翰·霍普克罗夫特客座教授、全球唯三的前华为AI首席科学家、阿兰·图灵研究所Turing Fellow,著有数百篇学术论文,多次获得最佳论文奖,还是原MediaGamma联合创始人,后被美国Beeswax于2020年收购。CEO郭宏博毕业于东北大学硕士学位,模式识别与智能系统专业,是原阿里云企业大脑负责人、百度AI平台产品负责人。据介绍,谜题团队近百人,其中博士学位员工占比近半。
DB1虽然取得了一定效果,但汪军也坦言决策大模型仍处于早期阶段,从技术到产品化,中间还有很长的路要走,也会遇到很多挑战,比如跨域任务采样权重敏感、跨域知识迁移困难、长序列建模困难、专家数据强依赖和决策类数据稀缺等。
在拓展市场时,谜题此前最大的难题是如何对外进行市场教育,但ChatGPT的火爆让该问题迎刃而解。目前,公司获客主要来自客户口碑传播和企业官方公众号。
不论是大语言模型还是决策大模型,背后都饱含着企业从自动化时代向超自动化时代发展的期望。在国内,不少RPA公司都开始通过并购、自研或合作的方式构建更多超自动化的能力,流程挖掘厂商也重点加注执行器的研发,以期满足市场需求,实现端到端的解决方案。在海外,Celonis是通过系统生成备选方案后由人进行判断,执行器驱动关联系统完成执行。未来,决策大模型会和大语言模型一起,推动超自动化实现闭环,降低人为参与和决策的占比,进一步释放人类劳动力。
谜题科技作为人工智能模型的企业之一,36氪将持续关注。据介绍,谜题正在进行千万美元融资,凡卓资本担任独家财务顾问。