AI认知进阶手册
导读:没想到吧,高大上的AI(人工智能)核心技术基础 ——机器学习,其实模仿的是人类学习的套路:模型+内容(数据)+……
没想到吧,高大上的AI(人工智能)核心技术基础 ——机器学习,其实模仿的是人类学习的套路:模型+内容(数据)+……
作为一名创业者或者投资人,你该了解的机器学习常识是怎样的?世界顶尖AI学者邢波教授给出了系统的解答。
✦ 目前的人工智能,或者说以深度学习为代表的一些方法论的研究,更像是古代的炼金术,而不像是现代的化学。
—— 邢波
邢波,师从机器学习泰斗级学术大咖 Michael Jordan ,卡耐基梅隆大学机器学习和医疗中心主任,2017年机器学习学术水平排名世界第一。
同时,他还是生物化学与计算机科学的双料博士,创立了通用机器学习平台Petuum,并获得了软银投资。
授课老师|邢波
卡耐基梅隆大学计算机科学学院教授
通用机器学习平台 Petuum 创始人
20年前,当我刚进入这个领域的时候,人工智能还处在谷底,是一个比较冷门的、不被重视的状态。那个时候,这个专业叫 ——机器学习。
这是人工智能的核心技术基础。
事实上,我更喜欢这个名字,因为它把“人”这个词给去掉了,免除了很多不必要的误解。
我就是用一台计算机或者一种设备,来学习某一种能力,这个能力是人的能力,还是其他的能力,并不重要,从而使得这个工作本身更加稳健和专注。
什么是机器学习?
P、T、E
人在学习什么东西呢?
人的学习可能要更高级一点,它其实包含了对环境变化所做的预测,甚至是预测后面的规则,是人所感兴趣并希望学到的。
比如说我们对自然科学知识的学习,就包括了学习它的法则、流程或者语法这些不同的规则,这些都是我们从数据或者从知识环境里面,可以获得的一些学习的套路。
学多了以后,你就会发现,有时候就变成机械化,你不想,就可以反应了。
同样的道理,机器学习的定义是这样的 ——
它关注的是怎么能够建立一个通过体验,自动提升自己功能的计算体系或者计算系统。这个计算系统能够通过跟环境交互的体验,自动提升自己的能力。
再详细点说,机器学习的计算系统,包括三样东西:
P就是性能(performance),机器学习非常重要的一件事儿就是性能,就是“好不好”。
T就是任务(task),到底是做什么事。
E就是体验(experience),实际上就是数据或者是获得数据的过程。
接下来的一个关键问题是,机器学习实际上是怎样发生的?
基本上来说,机器学习的流程需要三大因素:
一个是要有“环境”,环境里面有数据,数据里面包括了音频、视觉、行为等各种各样的数据,还包括了体验;
然后就是“感知”(learning),实际上是把这些数据形式化、抽象化,然后再了解里面的关联,甚至了解里面的一些因果关系。数据的表征里面能够获得对于预测的应对关系;
最后,学完了以后就需要来做“决策”。
决策的本质就是在一个特征空间里面做边界的划分。
✦ 举个例子,如何区分南方人和北方人?
由于时代的变迁,如果仅从饮食习惯、外形和身材等维度去区分,不是很容易,但如果增加一个维度或者边界,比如说个北京话绕口令,这个问题就容易解决了。
整个过程的完成,通常无法依靠数学解析,而需要使用适当算法实现一个递归循环的过程,不断地迭代以后希望它能够收敛。
为什么说“希望”收敛呢?在很多情况下,依据数学方程的形式和决策,试了很多次还是收敛不了,那这种情况下就只能看运气了。
所以,选择用什么样的方程,选择最有效的决策,使用什么算法,甚至在什么计算设备上实现,实际上对于机器学习的最后结果的质量是有很大的关系的。
作为一个研发人员,需要具备比较充分的理论知识,才能在算法或者方案不太灵光的时候能够有足够的知识储备找出替代方案,所以知识体系很重要。
怎么实现机器学习?
掌握4个要点,拥有更强的实战能力
实现机器学习的手段相当丰富。所以,一个成熟的工程师和研发人员,只有具备系统地结构化的知识储备,才能有更强的实战能力。
所以,在长期教授机器学习的过程中,我有意识地把机器学习的手段,进行了分类,就好比一个书架,把每不同的书给放在不同的层里面。
简单讲,是这样的:
① 起点,即选择“目标方程”。
举个例子,假设要培养小孩,有人会要他上私校、弹钢琴、学数学、参加奥赛……这就是所谓的优化小孩能力的算法。
那最终目的是什么呢?
这个最后想要达到的结果就叫“目标方程”,比如说这个方程最后是小孩考上了大学,或者成为一个成功的企业家。
② 结构
模型本身,变量之间,有不同的架构和关联。
③ 限制
这个模型是可以在无边界的情况下自由选择?还是只在一个空间里,做有限的选择?
有时候,“限制”是好事,可操作性强一点。但有时候,也会损失很多机会。
比如送小孩儿上学,需要选学区,还有价格的考量,这些都是限制。
④ 算法
用哪种方法论来实现“目标方程”?包括不同的数学技巧,就好比培养人,是让他学琴还是学数学,来达到育人的目的。
⑤ 停止条件
什么时候该停下来呢?
比如说,是直到小孩考上哈佛才停下来,还是到了30岁就停下来?
总之,你不能永远地训练下去,需要有一个跟价值或者跟回报相关的停止条件。
怎么实现机器学习?我们再来用“神经网络+深度学习”来说明一下。
它的起点非常非常朴素 ——人工神经元,神经网络就是好几个神经元变成了一个网络。
✦ 什么是人工神经元?
在人的大脑里,有一个元件叫神经元,它是一个细胞,包含了细胞核、突触。经过神经学的研究,发现突触实际上就像导线一样,可以跟其他的神经元产生接触,获得信号。而细胞核实际上是一个激活机制,当信号强度达到一个比较高的水平以后,它的离子开关就被打开了,这样可以产生一个电击的信号。
后来,人们用数学的方式,模仿生成了一个有类似功能的组件,即人工神经元。
到了工程层面,可以把抽象的数学描述变得更具体化、可操作化。
比如有3个自变量(年龄、性别、阶段)的输入。然后它可以进入下一个神经元,在进入的过程中它其实可以被加权,这叫权重。
中间是隐含层,输出还没看到的部分。
最后还有一个所谓的阀门函数。
比如这个函数是一个生存概率,它健康还是不健康,这就是一个函数。可以把整个的过程当成一个F,自变量就是X,结果就是Y,但这个F是用了一个多级的组合加权重加域值的方法来定义的F,是一套组合动作,而不只是一个简单的方程,就不是一个简单的线性边界了。
你看,就这一个神经网络模型,就把感知和决策都放进去了。
所以,深度神经网络并不神秘,这个深度神经网络里面有很多很多层,根据经验来决定到底多少层是最好的。
总之,深度学习整个的设计,大致是模仿了很多人、动物,或者是一个能够想象的、靠谱的神经系统对于物体的认知过程。
✦Tips:
这些关于“深度学习”的误区,你一定要警惕
作为机器学习的技巧之一,到目前为止,深度学习获得了巨大成功,甚至有人认为,深度学习是全能冠军,所有的任务,深度学习都能有很好的效果。
但事实真是这样吗?以下的认知“误区”,需要你特别注意:
1. 深度学习,只是机器学习的技巧之一。
除此之外,还有概率图模型、度量学习、核方法等,但是这些手段,并没有获得足够的重视,从而导致产品研发和商业化遇到困境。
2. 目前的人工智能,或者说以深度学习为代表的一些方法论的研究,更像是古代的炼金术,而不像是现代的化学。
我们对中间的道理、原则、原理了解的还非常少。
举个例子:
为什么大家最近关注的芯片工业,在中国还无法突破很多技术瓶颈?
除了工艺设备的限制,另一个重要原因是因为很多时候我们习惯的研发方式是反向逆推。
比如说我们拿到一块进口芯片,设计很精密,通常的做法是,用显微镜把电路全拍下来,拿给工程师,让他如法炮制,最后造出来一个在形式上一模一样的芯片。
但是,如果中间出了小问题,比如某个地方的照片没有照清楚或者某个地方加工的工艺不够,出现了一些小瑕疵,整个芯片就突然一下子不工作了,或者效果很差,工程师就抓瞎了,因为他也不知道怎么来调、怎么优化。
原因是什么呢?
因为逆向制造的过程,不包含对原理的了解,所以一旦出错,很难恢复。
同样的道理,在深度学习领域也是这样。突然换了一台设备,某个连接跟原来实现算法的情况有点不太一样,算法就会莫名其妙地失效,或者产生一个奇怪的不可预测的反应。
比如特斯拉出现的几个自动车事故,就是因为突然出现了原来训练集里面没有的图像,这并不是所谓的功能递减,而是一个彻底的失败,就是因为深度学习内部的一些原理还没有搞清楚。
这就像在现实生活中,比如说教育小孩儿,为了让他40岁能做总裁,你会不断地让这个小孩儿去学钢琴、学奥数、学古文等各种各样的东西。但是,这些因素跟40岁能否成为总裁是否有因果关系,并不十分清楚。
这就是目前深度学习面临的最严重的问题 ——
训练过程与目标方程中间的因果关系并不是很直接,所以一旦失败,调错就非常难调。
3. 机器学习领域的研究远未饱和,但遗憾的是,现在学校、工程界或者整个的社会层面,这种打破砂锅问到底的欲望不是很强烈,资源也不是很多,所以造成了深度学习的应用瓶颈。
4. AlphaGo的胜利是一个可以预料的结果,不必恐惧。
小结:
什么才是好的机器学习?
注意,它得是一个能被全面分析和表达的东西,它需要能够被人类理解和感知。
为什么我现在对很多深度学习系统,持有一定的保留态度?因为很多的结果,还不能被解释,当出现功能失常或者事故的时候,你很难去做一个诊断或者手术性的改动。
而这个缺陷实际上对很多系统是致命的,为什么?
因为这会使整个研发和部署成本变得相当庞大,而且是很多非专业人员望而却步的。
总之,从事AI领域,你需要谦虚踏实一点。
*本文根据5月12日邢波教授在混沌大学的课程整理而成,内容仅为全部课程的1/7。