对话竹间智能简仁贤:超亿元融资背后,为何要进军类ChatGPT?
导读:AI 技术公司竹间智能(Emotibot)宣布完成超亿元D轮融资,由金浦投资、金库资本、江苏文投、隽赐资本等联合投资,指数资本担任独家财务顾问。这是竹间智能成立8年来的第七轮融资,此前已引入了科沃斯、云晖资本、领沨资本、中银国际等机构。
随着人工智能(AI)聊天机器人模型应用ChatGPT红遍全球,这引发了资本入局国内类ChatGPT赛道。
3月1日消息,钛媒体App获悉,AI 技术公司竹间智能(Emotibot)宣布完成超亿元D轮融资,由金浦投资、金库资本、江苏文投、隽赐资本等联合投资,指数资本担任独家财务顾问。这是竹间智能成立8年来的第七轮融资,此前已引入了科沃斯、云晖资本、领沨资本、中银国际等机构。
同时,竹间智能还宣布,已经正式推出运用“类ChatGPT技术”的成熟生成式 AI(AIGC)产品,并即将开启新一轮融资。融资资金将用于完善 AIGC 新引擎的构建,把以ChatGPT为代表的大语言模型和AIGC技术全面融入竹间产品体系,全面焕新产品功能和服务模式,并正式将产品同步推向海外市场,从而成服务全球企业和用户的跨国自然语言处理(NLP) 技术能力的厂商。
在此之前,竹间智能其实是一家专注NLP、深度学习以及多模态情感识别的 AI 技术公司。那么,为什么成立8年之后的今天,竹间智能想要做类ChatGPT技术?到底是在“蹭热点”,还是有一些真实的技术应用?
带着上述疑问,公布此次融资前夕,前微软(亚洲)互联网工程院副院长、竹间智能创始人兼CEO 简仁贤(Kenny)接受了钛媒体App的独家专访,探寻本次融资下,竹间智能进军类ChatGPT技术产品的核心原因和 AI 行业的未来发展。
简仁贤对钛媒体App表示,竹间智能想要做国内第一家实用“类ChatGPT技术”的 AI 公司,并非在ChatGPT概念下“蹭热点”,而是以实用产品为导向,将类ChatGPT技术为基础的生成式AI和大模型技术开发新的智能化产品与融入现有产品体系中,将竹间长期的技术沉淀、系统产品和生态可以立即为客户产生价值,把最先进的技术能够让普通人都可以享受到,从而将 AI 技术平民化。
“我们不会成为中国的OpenAI,但我敢说的是,我们的产品一定是朝着将 AI 技术平民化的方向去做,这是我们成立竹间的初衷。我崇尚的是 AI 技术平民化,把一个个‘黑科技’技术变成随手可得、用得到的产品。”简仁贤表示,ChatGPT使人类开始更接近AGI(通用人工智能)的奇点。
竹间智能创始人及CEO 简仁贤在2021年WAIC大会上进行演讲
AI 时代的下一个奇点临近
发布短短五天,美国OpenAI公司研发的ChatGPT注册用户数就超过100万,两个月后的今天,月活用户已经超过1亿人次。
ChatGPT这一“风口”的热度已无须多言。
不仅如此,在简仁贤和其他 AI 行业专家看来,ChatGPT不仅仅是新形态的搜索引擎工具、语音助手这些功能性产品,它还让 AI 技术带来新的发展路径,距离 AI 时代的下一个新的“奇点” AGI 越来越近。
2月25日,中国科学院院士鄂维南提到,ChatGPT没有太多底层的创新,更多是工程式的成功;开放原子基金会TOC副主席谭中意则直言,在 AI 工程化方面,ChatGPT对全球 AI 业是一个巨大的利好,它从各个底层给大家带来巨大的信心,打开了巨大的用户市场。
实际上,ChatGPT这类聊天机器人技术起源于1950年。当时,号称计算机科学之父、AI 之父的艾伦·图灵(Alan Turing)发布一篇题为《计算机械和智能》——具有划时代意义的论文,提出了“图灵测试”实验,以尝试定出一个决定机器是否有感觉的标准——当你与对方文字聊天,是否能准确判断出对方是人类还是个机器人,如果你很难分辨出来,那就一定程度上可以说该机器是智能的。这也就是ChatGPT机器人的最早期雏形。
随着1956年“达特茅斯会议”上创造“人工智能”这个术语,全球共经历了三次 AI 浪潮。前两次 AI 浪潮中,不管是芯片“摩尔定律”速度跟不上 AI 的算力要求,还是数据量不够、算法不强、商业化不如预期,整个 AI 技术并未呈现机器特性。
直到2016年,谷歌DeepMind的“阿尔法狗”(AlphaGo)击败了韩国围棋冠军李世乭,以及机器学习的诞生,让 AI 算法、算力、数据“三驾马车”获得突破性技术进展。
但问题在于,机器学习利用循环神经网络(RNN) ——序列数据或时序数据的人工神经网络来处理文字,使得文字按顺序一个个处理,没办法同时进行大量学习。因此,2017年谷歌发布论文“Attention Is All You Need”,提出了一个新的学习框架Transformer,以解决此问题。它抛弃了传统的CNN(卷积神经网络)和RNN,使整个网络结构完全由Attention机制组成,从而让机器同时学习大量的文字,训练速度效率大大提升。
无论是ChatGPT的T,还是谷歌预训练语言模型BERT的T,均是Transformer的意思。基于此框架,OpenAI公司进行了新的研究学习GPT(生成预训练Transformer),其利用无监督学习技术,通过大量数据来形成快速反馈。2018年6月OpenAI发布第一代GPT,2019年11月发布GPT 2,2021年发布了1750亿参数量的GPT-3,不仅可以更好地答题、翻译、写文章,还带有一些数学计算的能力等。它的核心点是模型和参数数量。这种LLM(大型语言模型)可以通过学到的知识来转变领域。根据英伟达的预估,LLM规模每年增长10倍,AI 技术能力也随之增长。
竹间智能所研究的自然语言处理(NLP) ,是人工智能科学最重要的分支之一,它赋予计算机以与人类大致相同的方式理解文本和口语的能力,核心底层就是机器学习和深度学习技术。最近几年,NLP技术与Transformer、BERT框架关系越来越密切,两类技术结合能够解决很多文字和语义理解的实际难题。
2015年,曾带领过微软小冰、小娜等聊天机器人项目的简仁贤,一心想做出属于自己品牌的情感机器人,于是辞去微软亚洲工程院副院长的头衔,着手创立了竹间智能。公司以自然语言处理、情感计算、深度学习、知识工程等人工智能技术为基础,以打通长短文本的NLP技术为核心,自研通用技术底层,将 AI 能力惠及千行百业。
过去八年来,竹间智能的全栈式 AI 技术解决方案已累计服务了500多家大型企业客户,生态伙伴数量超百家,多个产品已在金融、制造、零售、医药、政企等多个领域实现跨行业、跨场景的规模化落地,赋能企业服务、销售、运营等业务前-中-后台全场景,助力企业数智化转型。竹间智能表示,目前其高度标准化的各产品模块都已经支持随时开放试用端口,产品驱动增长的PLG(产品带动增长)落地模式正不断激发竹间智能持续加速 AI 应用落地的潜能。
所以,为什么竹间智能如今要进军类ChatGPT技术方向?
简仁贤告诉钛媒体App,他认为ChatGPT有很大的赛道机遇,但目前仍存在一些挑战,包括算力训练与推理的成本高、数据需求高、训练要求门槛高,人才密度要求高,解决不了企业问题等,而竹间智能在其中能够解决实际的应用问题。
“此前我认为,大模型要商用还有一段距离,所以我们一直都在往商用大模型去研发、优化。如今在Transformer框架下,NLP能力获得了新的发展机遇。”简仁贤表示,随着ChatGPT的推出,大模型的技术演进达到拐点。经过8年的技术积累,目前竹间智能在多个开源大语言模型的基础上,通过大小模型融合的方式,自研构建生成式 AI 新引擎,全面升级底层技术平台,从而更好地解决实际问题。
自2015年成立起,竹间智能致力于语言模型,包括传统、监督式、统计式、半监督、无监督式的机器学习模型均有涉足,能够将合适的模型应用到解决企业的问题上,长久积累下来就成了竹间智能的底层NLP和语言模型的能力。
在简仁贤看来,大模型应用时代已经到来。“有些新的模型一块A100的GPU(图形处理器)芯片就能跑了,我们(类ChatGPT产品)已经能应用上了,可以解决很多的问题,企业不需要AGI,需要的是合适的模型。这样一来,产品和模型能够简单易用、规模化的将 AI 技术赋能各行各业。”简仁贤对钛媒体App表示。
基于目前生成式 AI 新引擎,竹间智能面向海内外市场推出了全新产品系列GeminiGPT,其中包括AIGC文案创作与智能写作产品Magic Writer、大语言模型为基础的新一代对话机器人KKbot、对话式大模型认知搜索产品ChatSearch等。此外,竹间智能正考虑大范围进行海外业务拓展,新产品还支持42种语言生成和互译,满足用户的跨语种需求。
“NLP时代已经到来,竹间智能全力拥抱大语言模型与生成式AI带来的技术迭代和行业变革,八年来的优势和积累将成为新机遇下最强有力的增长引擎,”简仁贤表示,ChatGPT的生成式 AI 和对话式 AI 引领了整个行业的变革,重构了人机交互模式。以ChatGPT为代表的 AGI 技术,正在成为人工智能的操作系统。对企业来说,如果不尽早采用最新的生成式 AI 技术,就可能在新一轮浪潮中失去竞争优势。
“创业公司才是大模型技术创新主力,不是大厂”
ChatGPT的全球爆红,让 AI 技术成为全球关注焦点。
根据研究机构Pitchbook数据显示,截至去年12月23日,已经有超过450家初创企业在研究 AIGC 技术,2022年相关融资金额也跃升至了13.7亿美元。到了2023年,微软100亿美元投资ChatGPT背后的母公司OpenAI,让整个行业迎来大爆发。
与此同时,各国科技巨头也在争相竞逐这块“大饼”,包括微软、谷歌、阿里、百度、腾讯、京东等科技巨头都纷纷宣布在做ChatGPT或AIGC相关业务。
不过,互联网巨头是否能发展下一个 OpenAI 还存有争议。清华大学创新发展研究院院长刘涛雄表示,从产业政策来看,美国很多技术是一棒接一棒,但中国互联网大厂不愿意去做一个20年以后才可能有作用的产品,而是追逐商业化。
简仁贤同样认为:“创业公司才是推动大模型创新的主力,不是大公司。”
简仁贤向钛媒体App解释称,很多人错误的认为只有大公司才能够推动大型模型的发展,但实际上,许多实用的大模型也都是从由创业公司来创新,逐步迭代发展出来的。例如 OpenAI、英国DeepMind起初都是创业公司,之后发展大模型之后再由大公司提供动力支持。OpenAI 过去几年在微软提供大量资金以及算力资源支持,而DeepMind也被谷歌母公司Alphabet所收购,之后也在资金和资源上面持续支持,才有办法继续开发这种大的基础模型。
在简仁贤看来,讨论“中国为什么没有ChatGPT”问题一点都不重要,“我觉得人生的意义在于不要去后悔,你连想都不要想,不要花任何一秒钟去想。要做的是,往前看,尽全力去思考新产品,让 AI 技术能够让每一个人都能用到,我们花了大量时间用在产品上,在应用上,而不是单纯只在研究方面。”简仁贤告诉钛媒体App。
“未来,我觉得在全球范围内会有更多具有自然语言处理能力的创业公司,利用自研技术拥抱大模型、生成式 AI 技术,开发出更多是用的产品。创业公司的行动力快,决策速度快,迭代快,所以我认为整个大模型的创新推动背后还是创业公司。”简仁贤表示。
简仁贤对钛媒体App坦言,目前竹间智能就是要一步一步去做,第一步就是把类ChatGPT技术设计成产品推出去,而且在未来10年内要做100个这类产品——这是他给团队的目标,“我们不是要做一个App去解决问题,而是用100个App解决100个不同的事情,每个App都是基于AGI的技术。”
随着 ChatGPT 订阅制的付费模式的到来,简仁贤认为,未来在新的芯片技术及微软的资源的助力下,加上新模型的进步,ChatGPT技术背后的成本门槛会越来越低,最终会使ChatGPT更加平民化。“OpenAI 可能有三年的时间就能达到(平民化)。我们的速度要赶上,ChatGPT催生的新产业的市场巨大,所有的人都需要一个更好用更智能的产品。”
简仁贤强调,要达到 AGI 的可能性比想象的要接近很多。“此前我认为可能这辈子都看不到,但我现在认为,5-10年内肯定可以看得到(AGI 技术的到来)。”