翊翎资本范维肖:想投资人工智能?这些需要知道
导读:我们基金的名字叫翊翎资本,从2016年2月开始,翊翎资本着手在人工智能领域进行布局。
我们基金的名字叫翊翎资本,从2016年2月开始,翊翎资本着手在人工智能领域进行布局。
以下是我个人在人工智能投资过程中的一些心得。
算法、数据、算力:人工智能的“三驾马车”
追根溯源,数据是人工智能的基础。
早期,人类经历了数据的采集、清洗、标记、存储、计算,经历了大数据的代际。通过数据,人类知晓过去发生什么,还知晓发生的原因。
借助于人工智能对数据的增力作用,人类又知晓未来发生了什么,还能对未来做自动优化。
从最早的“基础+激活”到“分析+人工决策”,未来的自动决策、自动控制是个更重要的过程。看待整个人工智能发展史,现在是非常重要的时间点,要清醒地识别一个边界,判断其属于过去还是未来。我们应该在这个边界线的附近寻找更多机会。
人工智能有三个支撑基础:算法、数据和算力。算法是核心。
我们见过很多所谓的黑科技。为什么叫黑科技?因为它跟当下保持一定距离。黑科技如果距离当下过远,往往可能是跨过了科技树的发展过程,跟产业没有融合,就会产生大问题,比如说不能产生有效数据,不能进行有效判断。
数据用来训练算法,我们通常把这个过程叫“喂数据”,把数据叫“奶妈”。没有数据,再好的算法也很难进行有效升级。在过去几年中,我们特别幸福地经历了大数据时代。现在的特征是,各个行业大量数据沉淀积累,数据开始与科技产生碰撞。过去我们不遗余力、不择手段地去获取数据,而在数据红利期,数据极大丰富,精度提高,这也是大数据时代留给我们的一个最好的基础。
目前的算力是基于GPU的计算效率。与传统CPU时代相比,GPU有了大幅提升,以前算一个东西需要2-3年,迭代效率太低,GPU出现之后,像亚马逊便开始提供硬件工厂,让大家通过租用方式去构建集群,节省了人力和硬件成本。算力提速,AI的产出就刺激很多商业领域进行革新,这些革新反过来又驱动数据和算法的持续提升。
算法、数据、算力相互促进,它们所带来的红利现在来看还是不明显。2016年Facebook、Google一起将这些东西以开源方式奉献给社会,降低了AI行业的进入门槛。
如何寻找人工智能产业链的投资逻辑
如何投人工智能项目?我们总结出了一个棱镜法则。
棱镜法则涉及到光的色散原理。透过一个形状为等边三角形的玻璃棱镜,白色的光从左侧照进来,通过两次折射产生光谱。这个折射过程很好地透视了我们翊翎资本的一种投资逻辑,有助于我们较为容易地剥开算法、科学、技术、产品的外衣,看到人工智能产业链的投资逻辑。
从春运看碎片化数据的价值
人工智能发挥价值过程中的第一个推进器叫数据增益。
人工智能仅用于有数据的行业。这个行业积累的数据是否全?精度是否够高?是否愿意拿出来被用?这几点是决定着我们判断人工智能产品能否有效果的第一个推进器。
现在是一个大数据极大丰富的年代,“极大丰富”说的不是量,而是指利用率,这是数据本身的核心之一。很多业务场景都是基于现有数据去构建上游业务场景,业务场景引来新数据的产生。
我们发现,数据孤岛化和碎片化的情况越来越严重,一家大厂商去融合各种各样数据的可能性太低。我有数据,不会给别人;数据越多,我越不会给别人。
数据碎片化过程中有很多机会,也有很多商业领域的正向循环,这是我们最为关注的。能否在我们所投的大数据公司乃至整个数据产业链条里找到现有数据对于AI技术有增益的方向,这个对我们来说很重要。
用大数据展示春运迁徙路线。
举个例子。
春运是全国性大难题,春运本身逻辑不在于我们怎么去优化运输环节,春运的本质问题是运力不足,解决这个问题需要修建更多轨道、投放更多火车,但在非繁忙闲置时间,这些投入造成的浪费究竟有多大?
还有个问题是,春运系统越优化,春运就越拥堵。为什么?大家24小时不停地往回赶,每个人都想回家,这些底层的诉求都不会因为技术和数据的变化而变化,这是问题的核心逻辑。
所以有时候,那些所谓“极大丰富”的客流数据在春运领域里作用真不大。但这些数据放到地方是有用的。诸如山东这样的省份,一个城市里高达11.7%的人口都在外地务工,为了应对这些人在春节集中返乡,这些地区水电使用量等数据的早期预测很重要。也就是说,春运数据用在其他领域反而是合适的。
但春运数据怎么公开?这个事就变得非常非常折腾,理论上是公开不了的,特别是关系到隐私问题。
现在中国数据开放程度在全球排名很靠后,排到八九十位,美国排在第八位。数据的开放程度与对人权及对个人的隐私的尊重成正比。只有保护隐私才能够去开放。这一点从侧面说明了数据碎片化一定会越来越加重。
场景增益要做顶层机构调整
第二个推进器叫场景增益。
移动互联网领域有着严重的To C逻辑,而To C消费类互联网服务讲究沉浸感,大家绞尽脑汁为了增强用户体验而完善产品,比如帮助用户查询时间缩减一秒,帮助用户在使用APP时少翻页、少点击,获取更准确结果。这些都是产品的提升。但AI正处于婴儿阶段,现在就进入商业环境,对场景的增益有多强?这个问题值得认真思考。
场景增益决定光谱的价值。
还有一个需要理解的场景叫马赛克。我们用一个比较污的话题来讲这件事儿。
现在有很多人在做图片鉴黄,一个国家部门找我们咨询,说有人在做图片鉴黄,识别率是98%,这种技术该花多少钱去买?合不合适?
利用人工智能的深度学习技术来鉴黄。
98%是什么概念?是给你100张色情图片,有两张检测不出来。假如说新华网用这样的技术,它一定要保证它的网站内容绝对不会出现任何差错。所以98%的识别率在这种场景下没有用。
反过来,另一家小公司也做图片鉴黄,给它100张图片,能识别出3张来,保证这3张图片100%一定是黄色图片,人工只需要鉴定其余的97张就好了。
场景落地的时候,企业端看的是投入产出比。我投入极低价格,帮我解决一部分价值,对我来讲就是个极大效益。
所以到了场景增益的时候,我们要做的是顶层结构的调整,这个顶层结构的调整从两边来讲,一边是做AI的公司,一边是应用AI的公司。
早期AI公司都是To B的增益,我们一定要去理解产业上的一些问题,知道产业症结在哪儿,进去之后能够对这件事有极大增益作用,我才能去拿到数据,持续在上面做学习和改进。
AI应用型公司也是一个投资方向,看哪些产品可以去附着到AI上来变成增益。在这个过程中我们需要不断切换,从一级市场、二级市场、一级半市场三个部分去切换着看这件事儿,不同事情在不同市场下一定是不同的。
我个人估计,一级市场和二级市场的收益差在逐渐降低,这个数据一旦加速,迭代周期就会缩短。所以在这个时候要找到需求侧的投资,因为它会在场景落地时产生极大的项目价值。
无人驾驶:换一种思路
底层结构的更改方面,我们在去投资一些AI类、技术类公司时,一定要看到它在商业上的一些思考和方式。
这里举一个相对比较集中的例子:无人车自动驾驶。
从传统意义上来讲,我们对于无人车的认知已经不再仅限于怎么躲避障碍路、怎么躲避行人、遇到紧急情况时怎么保证驾驶人和行人安全。现代自动驾驶里边应用最成熟的是uber,它去年收购了一家公司叫otto,专门研究货车的无人驾驶。他们的思路是要把无人驾驶变成火车:前边一个驾驶员开车,后边八辆无人驾驶大卡车全都跟着,这也是为什么现在大家都说这家无人驾驶公司做的科技叫跟随式技术,它根本不是自动驾驶,而是跟随。
跟随其实是没有错的,这就是顶层结构性调整推动事物回到底层做重新认知,再把它推到商业环境中来。
我们研究自动驾驶,如果都考虑让它像人一样学驾驶,是一种思路,但这种东西的研究可能会非常非常的慢。实际应用过程中,落地场景会遇到各种障碍。做无人车很难,但是做火车就简单多了,铺一条轨道就可以。
传统人类驾驶用的是地图。无人驾驶项目的核心投资点也应该在地图上。这种技术在国内被称为高精地图,在国外叫Mapping。Mapping制图技术更重要一些,因为无人车驾驶是基于这种轨道的方式来思考。
技术服务化,服务商品化,服务组合共振化
现在很多大公司都在把AI服务化,比如百度就把很多关于图片鉴黄、语音识别、自然源处理等技术以API的方式开放,任何人只要会写几行代码,就可以将其调用出使用。在这个代际过程中,慢慢会出现技术服务化、服务商品化和服务组合共振化的现象。
比如现在很多公众号都变成机器人,用户可以通过语音形式跟服务号说打车,当他按住语音键说“我要打辆车去东直门”时,后台要经历哪些过程呢?
第二层是自然源处理的过程,通过理解这个语言,来判断打车从这儿要到东直门的这件事。
第三层是要跟用户做更多交互过程,比如是否通过技术化手段自动叫辆滴滴专车过来,然后告诉用户车来了。
当下的市场环境推动了越来越多人出来在AI领域创业,所涉及领域也越来越细分,创业者在AI应用方面既可以只选一家,还可以选择多家,组合出一套解决方案,通过组合,以解决C端消费者的需求。
底层数据不共享,前端入口不开放,中间层协同效应很重要
百度不可能开放底层数据出来给任何人用。腾讯也是如此,前端的入口不开放。现在腾讯拿着微信架在大家前边,在上一代社交网络的这一波浪潮里边,大家都明白,做产品做C端产品一定要往前做,更靠近用户端。
跑在所有人的产品前面,这是在做To C类产品的时候的相对比较重要的一个法则。已经把C端用户牢牢抓住的人,在前端入口上也不会去开放出来的。我们看微信这几年产品变化的节奏,也能清晰认识到这一点。
在中间的协同效应过程中,我们能够把数据从其他地方汇合过来,利用技术的方式去不断产品化,利用不同产品组合,变成一个解决方案,然后再打向用户。所以中间的这个过程我认为是一个比较大的投资空间。
“云”引入的平台机会
聚合AI服务的平台很有可能出现有价值的投资标的。
首先,这类平台能够更方便地让应用层把更多AI技术服务以更低成本汇过来。
做过企业的都知道,企业做大了之后,最关心对于复杂度的控制。而复杂度不会平白无故地降低,只能把全部精力都放在“有效的控制复杂度快速增长”这一点上面。各种AI和数据的引入有助于提升企业内部服务,但成本非常高。而聚合AI服务的平台可以让企业以更低成本快速嫁接AI服务,应用到企业的落地产品中来。
其次,这类平台给了企业一个选择,方便企业数据可以更方便地在云与云之间迁移。这些都是未来AI服务不断向密集化、碎片化方向发展过程中出现的平台机会。
这类平台可能跟AI关系不大,跟数据关系也不大,它是一个综合体。
这是我们认为的另一个投资方向,在过程中找到这个中间层的空间,在这个空间层里边去找每一类企业。
SoC:算力前置带来的投资机会
过去这些年,看来看去,大疆也好,机器人也好,都有很硬的应用场景,SoC是这个窄小领域里边很重要的一点。所谓SoC,可以理解为具有计算能力的芯片。
举个例子。
我们投资的公司里有一家是基于人脸识别的技术做会员信息采集,客户一进到房间里,药房助理通过人脸识别,就可以完全知道客户信息。
这样的场景用起来,会有一个问题:企业所使用的人脸识别技术来自于第三方公司,第三方公司在云端,通过摄像头采集完数据要回到云端,云端再把计算结果回过来,这就导致至少一两秒的时间延迟。
还有个问题是:同样一个客户,如果在摄像头前面反复出现10次,就必须要为这10次远程服务的调用付出成本,因为摄像头没有任何计算能力,每次都要跑到后端计算,这是一个很大的资源浪费。
后来技术方就拿一块价值一千多块钱的平板电脑,在里面写一个程序,将其架在摄像头后边,才算把这个问题解决了。但如果安一个芯片,五六块钱就可以解决。芯片还能做计算加速,我们将其叫做算力前置。
新交互可能是最大的投资机会
《三体》里边有个很著名的法则叫“黑暗森林”。黑暗森林理论认为,稀缺资源是安全的,不要暴露给别人。在新的AI代际里边,我个人认为,新交互是稀缺资源。2016年,微软、Facebook、谷歌、苹果都对这类交互类平台做了投资布局。
我们经历了人跟PC的交互,后来变成人跟移动设备的交互,未来我们将通过屏幕去进行交互。
新的交互方式没有明确界面,张嘴开聊就能解决问题。而解决问题的通道和能够解决的能力是两回事。比如说我们现在在办公室里放个音响,它背后能帮我们打车、订酒店、订机票,但是接触的可能是不同服务商。所以这个音响是个入口,背后由多种服务来组合而成,前边的入口为后边导流,自己能做就做,不能做给别人,以共赢方式去打造一个比较密集的服务矩阵。
Facebook也在尝试去开放广告的接口SDK等,这些方式现在没有一个明确的产品场景,无法直接让人看懂,但对于早期投资方来说,这个交互有可能是最大的机会。