对标DeepMind Gato，人工智能模型「DB1」已在多领域落地验证

来源：36氪　发布时间： 2023-04-19 11:54:30　编辑：夕歌

导读：人工智能模型公司「谜题科技」聚焦在决策智能领域，于2022年12月发布推出了对标DeepMind Gato的人工智能模型DB1，该模型由CV、NLP、强化学习和多智能体四者嵌套于一体，可面对单智能体和多智能体进行连续的、离散的决策判断，同时还具备泛化迁移能力，支持并发处理千个以上决策任务。

作者丨吴思瑾

大语言模型的火爆已经不必多言。在爆发的同时，越来越多其他领域的大模型也开始出现在聚光灯下。

36氪近期接触到一家人工智能模型公司「谜题科技」，聚焦在决策智能领域，于2022年12月发布推出了对标DeepMind Gato的人工智能模型DB1，该模型由CV、NLP、强化学习和多智能体四者嵌套于一体，可面对单智能体和多智能体进行连续的、离散的决策判断，同时还具备泛化迁移能力，支持并发处理千个以上决策任务。据介绍，谜题年内还将发布同系列模型DB2。

DB1对标的Gato是DeepMind在2022年5月推出的“通才”型人工智能模型，会根据上下文决定是否输出文本、关节扭力、按钮按压或其他标记物，具有多模态、多任务和多组件的特点。官方信息显示，Gato可以执行604项不同的、多领域一般任务，这些任务具有不同的模式、观察和行动规范，比如在具有相同权重的同一网络下可以完成玩雅达利游戏、给图片加标题、聊天和用真正的机器人手臂堆积积木等等……

谜题科技首席科学家汪军向36氪介绍：“DB1是全球首个人工智能多模态决策大模型，在多方面有着超越Gato的表现，比如DB1不止支持单智能体控制，还支持多智能体协同、人机策略协同；在参数量上也超越11.8亿的Gato达到13.2亿；与Gato追求在虚拟空间中无限衍生任务能力不同的是，DB1更注重在产业中落地，成为企业环境中的超级大脑。”

图源：谜题科技

以目前大热的AIGC（AI Generated content，人工智能生成内容）为参照，谜题认为自己属于AIGA（AI Generated Action，人工智能生成决策）范畴。

AIGC的核心是大语言模型，大语言模型是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本含义，完成多种自然语言任务，如文本分类、问答、对话等。

谜题所说的AIGA是指通过深度学习技术，在原有从数据中发现规律的基础上，再次将规律返回至产生数据的动作本身，生成新的数据从而实现迭代。在这个过程中，模型积累了“理解”能力和“决策”能力，这种能力需要在产业场景中落地，才能为企业带来价值。

AIGA以决策大模型为核心，谜题的决策大模型DB1是一个输入自然语言、图像、控制、机理、决策、仿真等多任务、多模态数据的预训练系统，通过结合产业场景任务进行微调，形成定制化的模型训练系统，帮助企业解决决策问题。

与当前主流的千亿参数大语言模型不同，DB1只有10亿级别，为此汪军向36氪介绍：“DB1主要面向ToB产业场景，和面向ToC通用场景的大语言模型不同，因此技术上暂不需要更大的参数；虽然DB1才10亿级别，但已经在产业落地实践过程中取得了较为惊艳的表现，以某电力公司设备自动化运维场景为例，谜题已经解决了其以前70%以上根本解决不了的问题。此外，‘决策’本身就是一件很难的事情，因此想要找到大量决策类数据用于训练，也是公司发展过程中必须面对的挑战，目前谜题的做法是除开源数据外，还构建了大量小模型来生产决策、轨迹和控制等数据变成大模型的学习输入。未来，随着DB1产业应用数据的不断扩大，参数规模也将随之变大，性能和表现定会提升，谜题更长远的目标是成为以决策大模型为核心的决策智能平台，去解决产业上的各类复杂问题。”

2022年，谜题合同收入过千万，6个合作项目分布在通信、自动驾驶、汽车、能源等领域，应用场景包括游戏智能、机器人控制、多智能体协同、自动运维及优化等。

在具体的应用场景中，DB1需要与ChatGPT这类聊天机器人协同才能完成任务。人类通过对聊天机器人下达任务，聊天机器人驱动DB1进行任务分解，并通过API操控其他系统完成执行。比如ToB场景下的机器协作控制、设备动态自主运维、企业自动化调度、软件开发测试、能源智能优化和超级RPA；ToC场景下的游戏生产和NPC智能及超个性化助理。

图源：谜题科技

为了实现这种交互，DB1的训练方向包括：与计算机交互且具有逻辑思维和决策能力、与互联网交互并实现自学习、通过API操控外部环境的能力。

之所以谜题能完成决策智能领域的人工智能模型研发，与其团队背景和资质有着紧密的关系。首席科学家汪军是伦敦大学学院（UCL）计算机系教授、上海交通大学-约翰·霍普克罗夫特客座教授、全球唯三的前华为AI首席科学家、阿兰·图灵研究所Turing Fellow，著有数百篇学术论文，多次获得最佳论文奖，还是原MediaGamma联合创始人，后被美国Beeswax于2020年收购。CEO郭宏博毕业于东北大学硕士学位，模式识别与智能系统专业，是原阿里云企业大脑负责人、百度AI平台产品负责人。据介绍，谜题团队近百人，其中博士学位员工占比近半。

DB1虽然取得了一定效果，但汪军也坦言决策大模型仍处于早期阶段，从技术到产品化，中间还有很长的路要走，也会遇到很多挑战，比如跨域任务采样权重敏感、跨域知识迁移困难、长序列建模困难、专家数据强依赖和决策类数据稀缺等。

在拓展市场时，谜题此前最大的难题是如何对外进行市场教育，但ChatGPT的火爆让该问题迎刃而解。目前，公司获客主要来自客户口碑传播和企业官方公众号。

不论是大语言模型还是决策大模型，背后都饱含着企业从自动化时代向超自动化时代发展的期望。在国内，不少RPA公司都开始通过并购、自研或合作的方式构建更多超自动化的能力，流程挖掘厂商也重点加注执行器的研发，以期满足市场需求，实现端到端的解决方案。在海外，Celonis是通过系统生成备选方案后由人进行判断，执行器驱动关联系统完成执行。未来，决策大模型会和大语言模型一起，推动超自动化实现闭环，降低人为参与和决策的占比，进一步释放人类劳动力。

谜题科技作为人工智能模型的企业之一，36氪将持续关注。据介绍，谜题正在进行千万美元融资，凡卓资本担任独家财务顾问。

标签：人工智能模型 DB1