第四范式戴文渊:最适合大模型的商业模式是什么
导读:第四范式创始人、CEO戴文渊称上市绝不是公司的目标和终点。“我希望未来,提起戴文渊大家都不知道他是谁,但提到第四范式,所有人都知道这家公司,而创始人是谁则要再查一查。”
从2015年到2021年,第四范式获得了多家知名基金及国有银行的多轮融资,并从2021年8月开始,三次递交招股书,但至今还没有上市。
据IPO早知道报道,第四范式于2023年4月24日更新招股书,继续推进港交所主板上市进程。
在4月25日接受采访时,第四范式创始人、CEO戴文渊称上市绝不是公司的目标和终点。“我希望未来,提起戴文渊大家都不知道他是谁,但提到第四范式,所有人都知道这家公司,而创始人是谁则要再查一查。”
以下为戴文渊的采访整理,有删节。
01
ChatGPT带来的
不是技术突变,
是信心增强
ChatGPT的出现,对我们来说既是一个意外,也没有完全出乎意料。
大概在三四年前,即GPT-3出现时,我们就已经有了预期,只要达到一个临界点,大模型将会到达一个举足轻重的位置,但彼时我们很难预见它抵达临界点的具体时间。因此当它在今年实现爆发时,对我们来说确实很意外。
其中,ChatGPT的出圈对于整个产业是一个特别大的推动。技术的进步可能是线性的运动,但信心则是跳变的,当技术没有过临界点时,公众的信心可能趋近于0。
因此,在我看来,这一波风暴主要来源是信心的变化,技术上并没有特别大的突变。
例如AI绘画等相关应用,其实在去年甚至几年前就有了,如果在去年,大家对让人工智能替人画画,可能没有太多兴趣。但在今年,即便我们不主动提及,大家也可能追着问,想了解AI画画。
第四范式现在有一个100多人组成的研究院团队,相当于我们公司的“达摩院”。毫无疑问,大模型是我们绝不能错过的一个方向。
大概在2018年,Google推出BERT(模型)时期,我们已经开始做相关工作,虽然彼时BERT还有一定的局限性,但到了GPT-3之后,大家已经基本上看清楚技术路线的发展方向了。在这个过程中,我们一直有投入,但和今年相比肯定有差异,尤其在(技术的)临界点突破后,大家的精气神和信心都完全不同了。我们现在每天晚上都在加班加点工作,而且每天都可能有新的同事加入进来。
信心一直是困扰我们的问题。去年同一时间,如果我们推出“式说”1.0和2.0版本,应该不会有很好的市场接受度。这也导致,尽管我们在大模型层面已经有了很长时间的储备,但重视程度一直不够。
临界点过了之后,我们的第一反应就是赶紧把家里的东西拿出来产品化。于是我们在2月和3月分别推出了“式说”1.0、2.0版本,其实现在我们有好多能力还没有加到产品里面,还在逐步地往里面加。我们今天采访后,一两天时间,我们的研发团队又要拿出新的版本去做测试。我们现在每天都在加班。
在这过程中,我们遇到最多的问题就是“可控”。即什么样的事是可控的,什么样的事是不可控的,或者说客户能接受的可控与不可控的范围,都需要我们去打磨。例如用户要求AI实现某个功能,即使准确率是99%,这个也不能用,要实现100%。或者起码要做到,当告诉(AI)“你错了”,它有办法迭代更改,即“知错能改”。
并且我们也在对产品快速迭代,相当于我们今天采访结束后,只需要一两天,我们的幕后研发团队又能拿出新的版本去做测试。对于大模型的能力涌现,我们并不会表现得非常激动或敏感,在我们看来是自然而然甚至习以为常的事情,我们对于自己的大模型的能力评价就是“应该的”。
因此,我们在这波大模型的投入上没有一个明确上限,只要是我们的现金流可以接受的范围内,我们就会加大投入。对于最终产出的模型或产品,目前最高能提供到千亿(参数)规模。
02
大模型最先改变的
是to B领域
现在外界把AI分成1.0、2.0,我理解过去的AI,是点上的AI,大家可能在它达到1亿或10亿参数的时候,就可以接受了。现在大家讨论的AGI,是面上的AI,它的模型需要到一定的量级以上,才能够显现出我们可以接受的能力或水平。比如100亿规模参数以下的大语言模型,它的能力基本上不会被接受。
所以过去我们寻找的AI落地场景,如搜索引擎、资讯推荐、金融交易等,都要满足价值够大的条件。因为在过去,构建一个模型,只能在这一个点(场景)应用,比如搜索引擎只能搜索,现在,多模态大模型能力可以成为底座,上面接多个场景。这就意味着,在过去模型研发要参考投入产出比,这次大模型热潮的出现,是一次完全的升级换代。
过去的点上的AI是没有办法脱离软件独立存在的,如抖音的推荐算法不能直接给到用户,而是要放到APP里。
这也是我们现在看到的最大机会:AI有可能把整个软件产业再升级换代一次,包括to C和to B两个领域的软件。
而在大模型的落地应用层面,我一直以来的观点是,它最先改变的是to B行业。因为B端企业软件的起点较低,可改造空间更大。比如二维码支付在中国最先普及,但到了美国却没那么容易普及,因为美国的信用卡业务做得太好了,到处都可以刷卡。同理,中国的to C软件过去十几年已经被打磨到了比较高的水准,用对话框未必就一定更好用。
反观,B端企业软件面向功能导向、交互门槛更高。而AI大模型带来的新的(对话框式)交互模式,不仅有机会创造出一个交互极简、功能强大、自我迭代的新型软件工作流,提升B端软件的使用体验,而且在开发层面,之前B端企业软件都是基于菜单式的开发,每次一个功能升级至少是月级别的开发时间,现在AI改写数据和API的效率比原来高得多,在这种新的方式下,软件迭代的效率提速到以天为单位。
无论是用户体验,还是开发者体验,都得到了飞跃式提升。
市场的反馈对我们也有很大的推动作用,ChatGPT出现后,客户对AI的包容度和信心相应提升。我们也在跟我们的客户同步推动技术产品的落地,如金融、能源、运营商、零售、医疗等行业。另一方面,技术的快速滚动也加速了我们新增客户的效率,我们现在每天都会有新客户进来。
相比于过去软件领域的盈利方式,我认为最合适(大模型)的商业模式是算力,AI的算力是不可被忽视的领域,如每一次去访问ChatGPT都消耗了几毛钱的算力,我觉得目前这是非常合理的计算方式。
至于to C领域,我们暂时还没有一个明确的商业计划。但在这方面,我们也是持open的态度。
04
一家快速迭代的to B公司
我觉得很有意思的一点是,最近几个月,我们这家to B(科技)公司的工作模式,越来越像一家互联网公司。
过去,我在互联网公司工作时,大家追求的都是快速迭代,每天都会不停地产出新的东西,然后做实验去试,再根据结果的好坏不停地迭代。
虽然第四范式是高科技公司,但我们本质是一家做to B业务的公司,因此过去我们的迭代以及反馈周期,和原来的to B公司是一样的。甚至我们每年更新两个大版本,在to B的软件企业里面已经算迭代得特别快的。
过去我们根本不敢想象每个月迭代一次,甚至每天迭代一次,但在ChatGPT的交互形态下,我们现在从产品到技术研发等各个阶段,都被改变了。
此前我们研究部门做出的算法,可能要经过工程化、产品化再到解决方案,然后才能推向市场。整个环节可能需要少则一年,多则2~3年。但现在,AI让我们研究团队做出来的东西,可能在一两天后就能进入到产品阶段。不仅仅是我们,整个世界都是这样,GPT-3.5进化到GPT-4也很快。
我觉得对于团队来说,这种感觉也非常不一样,以前我们100多人的研究院团队,外界可能不太需要知道他们的存在,因为研究的内容在至少一年内都不会产生商业价值,也不会推向市场实现商业化。在这一年的时间里面,我们只能自己给自己一个积极的反馈与信念。
但现在整个形势变化后,只要新的东西一出现,立刻就可以被大家看到,或者对产业产生影响。我们其实非常enjoy这种方式,因为我们都是互联网公司出来的。现在我们公司的运转非常像互联网公司模式,以前互联网公司都是不断迭代、不断试错的一种形态,迭代试错会让产品能力越来越强。我们现在也是如此,我们不会完全将产品打磨成熟,而是将α版或β版给到客户,我们一起打磨,因为客户内部也在每天迭代、改进。
最近,我个人的工作状态可以称之为“夜以继日”,几乎所有的时间都在工作。这主要是“腾讯会议”带来的。以前安排会议,同事会问我,“你什么时候在公司?”现在他们问的都是:“你什么时候不坐飞机?”一旦连了卫星电话,可能以后坐飞机与否都不需要问了。
对于公司的未来发展愿景,我在刚创业的时候就和其他创始人聊过这个话题。我希望未来,提起戴文渊大家都不知道他是谁,但提到第四范式,所有人都知道这家公司,而创始人是谁则要再查一查。海外有很多公司创始人都“隐身”了,就像IBM,外界都不太记得创始人是谁了,包括微软现在也不太需要比尔·盖茨,但公司还在很厉害地继续往前走。创业公司可能很少有人能够走到这一步,我们希望有一天第四范式能走到这一步。所以这是我们创立第四范式的目标:不是为了让我成功,而是让这家公司成功。