突然爆火的AIGC究竟是不是泡沫?
导读:今年7月,百度世界大会上李彦宏这样预言到:“未来十年,AIGC(人工智能自主生产内容)将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”
文 | 新眸
作者 | 顾煜
今年7月,百度世界大会上李彦宏这样预言到:“未来十年,AIGC(人工智能自主生产内容)将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”未曾料到,当时他的这番讲话,会让AIGC在之后几个月里成为一级市场的关注焦点。
红杉资本曾在今年9月联合GPT-3,发布了一篇名为《生成式AI:一个创造性的新世界》的文章,并且立刻引爆了AIGC赛道。“人们的梦想:生成式AI将创造和知识工作的编辑成本降至零,生产巨大的劳动生产率和经济价值,以及相应的市值。”按照他的理解,AI能够让人效突破现在技术条件的天花板,未来企业的增长将不再受制于人力和成本,企业的经营效率也会随之发生质变。
尽管AIGC处于刚起步的阶段,技术大范围应用尚未稳定,甚至没有特别精准地定位消费者的需求,但这并不妨碍资本和机构的加速入场:Stability AI宣布获得1.01亿美元种子轮融资,正式晋升独角兽行列;几乎同一时间,另一家人工智能独角兽公司Jasper也宣布获得了1.25亿美元的新融资。
一时间,全球范围内掀起了一股AIGC投资热潮,这背后的原因可以归结为:VC们认为,AIGC是AI算法的一次重大突破,意味着人类对于AI的运用不再被局限在某一特定功能,比如语音识别、智能推荐等,而是真正迈入了通用人工智能阶段,即人工智能可以像人类一样高效的完成智力任务。
这是一个很有趣的风向,因为在移动互联网时代,关于未来的畅想,已经进行过很多次,从当初红极一时的元宇宙和Web 3,就像给大众营造的一场终极幻想,跳脱出时间和空间的维度,充斥着对未来的无限期待,这也是很多极客的毕生夙愿。但,梦终有醒的那天,科技也要放在市场上进行验证,祛魅是一个周期的开始,也是一个周期的结束。
只不过,这次的主角换成了AIGC。伴随着文本、图片、视频以及三者跨模态相互转化方面的技术不断突破,我们所熟悉的AI行业,正意欲重构人类生产力和生产关系的变革,这究竟是一时昙花,还是一片新的蓝海,已经成了市场最值得讨论的话题。
AIGC真如想象中那般完美吗?未必
在就AIGC的想象力展开讨论之前,我们先了解下什么是AIGC。顾名思义,AI Generated Content,就是人工智能生成内容。归根到底,抛开那些复杂的概念,AIGC现阶段充其量只是人工智能模仿人进行内容生产的一种方式,它主要的技术难点有2点:一是语言,二是思维。
众所周知,思维和语言是人类特有的、区别于动物的重要标志,然而在2014年,以GAN(生成式对抗网络)为代表的深度学习法的提出,以及2020年GPT-3算法的诞生,逐渐打破了这个传统认知。自此以后,人工智能不仅能够模仿人的思维方式,而且能够理解并运用人类的语言。
这两者的结合,使得AI进入到真正意义上的通用人工智能阶段,几乎可以完成自然语言处理的绝大部分任务,比如搜索、问答、内容生成等。在这个基础上,AIGC的业务范围迅速扩张,据新眸不完全统计,过去2年间共计推出了约300多个应用,功能上也从文本生成拓展到视频生成。
尤其在今年,先有AIGC技术综合体虚拟人度晓晓参加了高考语文作文写作,在不到1分钟的时间里,创作了40多篇文章,并拿得专家打分48分的成绩,击败了75%的考生;后有由AI创作的绘画作品《太空歌剧院》获得了美国科罗纳州博览会艺术笔袋一等奖。突然间,AI替代人工的时代彷佛已经悄然来临。
但AIGC真如外界所宣传的那般完美吗?未必。
以百度度晓晓为例,虽然高考作文拿到了48分的成绩,但整体内容辞藻堆砌、立意较浅。对此,聆心智能的创始人黄民烈教授解释称,“目前文字生成主要捕捉的是,浅层次,词汇上统计贡献的问题。但长文本生成还需要满足语义层次准确、在篇章上连续通顺的要求。”
这似乎是AIGC遇到的通病问题。虽然今年被称为AI绘画之年,但就绘画质量上来看,远未达到艺术家的标准。因为现阶段的AI作画,主要是根据用户需求进行素材匹配,然后将其进行组合,但由于缺乏对图片整体框架的规划,导致绘画往往具有拼凑感——乍一看很夺人眼球,但细看之下又会觉得违和。
换句话说,现阶段AIGC仍然是效率工具,从事的是辅助生产工作。事实上,《太空歌剧院》的成功也证实了这一点,毕竟这幅画并非由人所创作,但也不是完全的AI产物,而是二者共同创作的结果。据悉,这幅画从开始到问世共经历了900多次的迭代,以及数周的挑选与调整。
长期来看,AIGC将持续辅助人类进行内容生产,与工业化进程中,机器扮演的作用类似,AIGC能够替代基础性的劳动过程,进而提高内容质量以及创作效率,但无法完成创造性、决策性的工作。毕竟,AIGC呈现出的内容,是计算机算法得出的最好结果,但人是多样的,最好的不一定是最合适的。
AIGC的应用场景会在哪里?
任何新技术的核心价值都是场景下的创新应用,AIGC也不例外。场景是技术应用的一个环境,也是检验技术能力的一个外部条件。越好的技术,越具有场景运用的普适性。因此,场景是检验AIGC的发展现状及未来的一个重要因素。
就目前来说,广义上的AIGC应用场景大致可以分为To B和To C两个赛道。在B端的的应用主要是通过“AI+”,来为各产业进行赋能,在C端主要是通过与人交互,进行内容生产,主要有包括AI驾驶、AI助手、AI辅助文本生成等。
今年7月的时候,科技狂人马斯克宣称已经成功将自己的大脑上传云端,不仅实现了人机对话,而且将大脑的数据进行了永久保存。按照他的构想,随着AIGC技术的不断发展,是可以建立起现实世界到数字世界映射,人类有望通过数字孪生,进而在元宇宙中获得技术上的永生。
不过,就像科大讯飞董事长刘庆峰说的:未来十年,人工智能将像水和电一样无处不在。但就眼下这个节点来说,这一预言似乎为时过早。
AIGC更是如此。按照AIGC的发展逻辑,主要可以分为3个阶段:一是AIGC内容生产技术完善阶段,能够实现文本、视频、图片生成以及三者的跨模态转换;二是具有多模态生成技术的聚合应用——虚拟人;三是AIGC内容生态聚合体——元宇宙。
就第一个阶段来看,首先是文本内容生成领域,由于AIGC存在逻辑以及情感理解的问题,只能在特定的场景下进行内容创作,比如营销号、新闻稿件以及剧情续写。其次,是图片生成领域,由于整体图片生成质量不稳定,难以进行商用,只能对图片内容进行部分编辑,例如美图秀秀等,但又由于AIGC识别图像精度有限而存在一定的问题。最后是视频生成,现有的应用场景主要包括视频剪辑、人脸替换以及背景替换等,因其原理和文本、图片相似,问题也一脉相承。
如果是虚拟人,主要的发展场景在视频以及客服领域。由于技术水平有限,虚拟人与人类并不能进行很好的交互,不管是B端的智能化客服,还是C端的实时互动,都存在答非所问、无限循环的问题,无法满足用户的多元需求。
放到元宇宙的话,AIGC在其间的应用就更像空中楼阁了。因为就目前来说,元宇宙自身的发展仍然受限于VR/AR/XR等技术设备才能为人所感知,更不用说其中AIGC所生产的内容了。
所以我们不难发现,现在的AIGC仍处于早期摸索期,发展的有限程度导致了目前应用场景的有限。也许未来技术的突破,能够不断扩展AIGC的应用场景,但短期内各企业能做的,只是优化模型,从而提高其与应用场景的适配度。
薛定谔的商业价值探讨
企业开发新技术,归根到底,是看这一技术是否具有商业价值,而投资一家企业,是看核心技术能否让其持续不断的赚钱。尽管有报告指出,AIGC未来将拥有广阔的商业前景以及变现空间,但就现在的AIGC赛道而言,既不赚钱也不可持续。
数据、算力、算法是驱动AIGC发展的三驾马车,要实现AIGC的发展,这三者缺一不可,但每一项的发展,都需要企业投入大量的资金,这就导致AIGC初创企业的经营成本居高不下。以新晋独角兽企业Stability AI为例,该公司为维护一个拥有4000块英伟达A100 GPU组成的算力群,总计花费超5000万美元。
较高的前期投入,要求了AIGC企业用户规模的迅速扩张。因为只有行业用户规模达到一定体量,才能够摊平成本,扭亏为盈。过去的经验表明,要在短时间内实现用户规模的快速增长,需要提供标准化的服务内容,毕竟标准的等于大众的,也等于最大规模的用户需求满足。
而且,AIGC自身的特点,其实也限制了服务标准化的进程。由于AIGC生成内容具有不稳定性,内容质量层次不齐,无法形成统一的质量标准,一定程度上限制了用户规模的扩张,也限制了AIGC企业的赚钱能力的提升。
不仅如此,由于AIGC赛道正处于摸索阶段,公司战略以完善技术水平、考察消费者需求为主,大部分技术没有完善到足以实际运用到生产之中,而小部分相对成熟的应用,也为了吸引顾客,而处在免费试用的阶段。这就意味着,AIGC技术本身缺乏变现能力。投入增多,而收入不够,使得众多AIGC公司处于亏损状态。
并且,这种亏损状态,长期内,并不会因用户规模的增多而得到改善。因为,一旦行业用户规模达到一定体量,大厂们必然会加速入场,此时行业竞争加剧,一方面会促进企业增加成本投入;另一方面也会导致企业收入减少。那时,面对着AIGC有限的变现能力,加上持续不断的成本投入,又有多少企业能坚持下来。
现在的资本,在AIGC领域的下注依然有些过于冒险。因为从事实上看,各初创企业并不能突破AIGC技术不稳定、应用场景单一化以及变现能力缺乏的障碍。真正要实现AIGC技术的快速发展,需要算力、算法的大幅提升,这都是难以预测的。