深度解密阿里达摩院:如何让科技与商业共舞
导读:恐怕再没有一个科研机构被赋予这么诗意的名字,达摩院。
恐怕再没有一个科研机构被赋予这么诗意的名字,达摩院。
它来源于武侠小说,作为武学最高研究机构,达摩院代表了修为的最高境界。同样,科研也需要精进、执着和专注的精神。
或许是源于对武学的痴迷,2017年10月,阿里巴巴董事局主席马云将新成立的阿里研究院命名为“达摩院”,并宣布未来3年投入1000亿,研究自然语言处理、人机自然交互、量子计算、机器学习、基础算法等前沿科学领域。
从古至今,得人才者得天下。于国而言,他们掌握和创造核心技术,乃国之重器。
在中国前所未有地开放、加速引进全球人才的今天,中国科技巨头成了重要的国际人才承载平台,也是这一波人才红利的主要受益者。
在中国科技公司里,依托于前期人才的储备和后期达摩院规划的发力,阿里巴巴用数据、场景和技术优势,在全球人才争夺战中显示出强大“磁场”。
其实,作为阿里巴巴向“一家科技公司”转型的结晶。成立9个月以来,达摩院对外界而言,一直披着一层神秘面纱,这个机构有多少人,他们做过哪些事?他们怎么让前沿技术从实验室步入到公众的日常生活中?
据2018年留学人员回国服务工作部际联席会议公布的数字显示,2017年,我国各类留学回国人员总数达48.09万,创下历史新高。
更需思考的是,数量庞大的海归“大拿”得以在达摩院潜心“修炼进化”,在海归英才人数创纪录的当下,不少科技公司的核心海归高管和国外引进的人才接连离职。
科技圈纷纷议论,为何这些顶级人才到中国后,会出现“橘生淮北淮南之差”?答案就在技术观和价值观上。
“皇冠”下的科学家群体
故事先从最近的一系列科技赛事说起。
在刚刚结束的计算机视觉知名赛事Pascal VOC comp4目标检测大赛上,冠军来自中国的达摩院。而在这之前,达摩院自主研发的新一代语音识别模型——DFSMN,刚刚打破了全球语音识别准确率纪录,被谷歌等国外巨头在论文中重点引用。
同样是近期结束的国际顶级机器翻译大赛WMT上,达摩院领先众多国外巨头与学术研究机构,连夺英文-中文翻译、英文-俄语互译、英文-土耳其语互译5项第一。
再往前,今年一月,在美国斯坦福大学发起的机器阅读理解顶级赛事SQuAD上,阿里巴巴凭借82.440的精准率打破了世界纪录,并且超越了人类。赛后英国《每日邮报》的标题是:世界上最难的阅读理解测试中,阿里巴巴的AI破天荒地战胜人类!
人们看到的是在成立不到一年时间,达摩院已经在国际顶级技术赛事上,获得了近20项世界第一。但很少有人知道,达摩院在顶尖科学家上也是是“星光熠熠”。
阿里巴巴集团首席技术官、达摩院院长张建锋(行癫)
金榕,美国密歇根州立大学终身教授,世界大数据、人工智能专家;华先胜,国际电气与电子工程协会院士(IEEE Fellow),视觉识别和搜索领域国际级权威学者;施尧耘,世界顶级量子科学家;任小枫,曾是亚马逊级别最高的华人科学家和最年轻的资深主任科学家之一,也是计算机视觉领域的世界级专家……
悄无声息,已经有数百名科学家和专家学者活跃在达摩院。
达摩院在国际顶级机器翻译大赛WMT上取得的五项第一,就是由司罗团队斩获的。
司罗,达摩院机器智能技术实验室自然语言处理首席科学家。自然语言处理是一种使机器理解人类语言的AI技术,广泛应用于搜索引擎、智能客服、商业智能和语音助手等领域。
由于这项技术处于人工智能金字塔的顶尖——认知智能,也被誉为人工智能皇冠上的明珠。
而司罗和团队,就是制造这颗明珠的人。
2006年从卡内基梅隆大学博士毕业后,司罗就进入普渡大学计算机系任教,专注于机器学习和NLP等领域的研究。2012 年,凭借100多篇顶级学术论文,他成为普渡大学计算机系终身教授。
谈及回国加入阿里的原因,司罗给出的答案是:跳出学术研究的小圈子,“第一次看到自己的技术被数以千万的用户使用,这种兴奋是无法用言语形容的。” 他体会最深的是,在学校他是一个赋能学生的角色,但跟产业界的人在一起,他能感受到自己的作用和影响力被放大了。
阿里巴巴是司罗发挥能力的理想地,“大部分人工智能都需要技术、场景和数据三要素的支撑,自然语言处理尤其如此。在这三要素上,企业要比学术界有优势,阿里在这三块的优势更是领先全世界同行。”
达摩院的研究方向主要锁定在前沿技术领域,而达摩院的科学家们,也是这些领域的佼佼者。
目前,阿里巴巴拥有25000名技术研发工程师、近千名研究员和多名入选MIT TR35杰出青年创新人才,这种集产品、学术、研发一体的创新人才梯队,使得这家企业拥有强大的科技推动力,在资本、技术、人才等方面也已具备了探索科技未来的基础。
“技术研发绝不是为了发论文”
除自然语言处理外,同属认知智能行列的就是语音识别。为此,达摩院机器智能技术实验室还吸引了很多语音识别与智能语音交互领域的科学家。
作为达摩院机器智能技术实验室智能语音交互的首席科学家,鄢志杰表示相比其它AI技术,智能语音虽然相对成熟,但要进一步突破现有技术门槛,并与应用场景深度融合,难度非常大。很多中国公司也缺乏自主创新的战略耐心,但他从阿里看到了这种决心,于是在2015年加入了达摩院机器智能技术实验室的前身,iDST。
此前,鄢志杰在微软亚洲研究院工作了近8年,主要工作偏重学术研究,比如写论文、在公开标准数据集上做一些算法方面的提升。但鄢志杰很想让自己的研发成果更早落地成为产品,被更多人使用,从而听到来自用户的直接反馈,推动技术的进一步发展。
在阿里,达摩院并不是一个纯研究部门,它和业务和商业紧密相连,既有学术思维,也有产品思维和商业逻辑。
鄢志杰介绍说,他在阿里的实验室有三类人。一是算法研究,二是做算法落地,三是推动产品化的工程技术人员。这三类人结合到一个组织下,能让算法的研究成果迅速被产品化。
与一般公司在研究、产品等不同部门之间进行技术转化不同,达摩院集合了前沿技术探索到产品化落地的完整职能。以阿里自主研发的语音识别模型DFSMN为例,鄢志杰称,从算法的验证结束到最后铺开到阿里云上开放给开发者使用,整个过程只用了约1个月。
阿里巴巴集团首席技术官、达摩院院长张建锋(行癫)
上海地铁语音售票机也使用了阿里语音识别技术
司罗介绍,大多数科学家刚到阿里时,还是技术思维多一点,但达摩院更希望技术能与产品、业务一起共舞,让技术在业务中发挥支撑与引领作用。技术人员只有更深入了解业务情况和业务需求,才有可能更好地将技术能力释放出来。
所以阿里为这些科学家们准备了一份见面礼,包括司罗和鄢志杰在内的新入职科学家被要求深入一线,到一线技术部门去锻炼。阿里的科学家被要求向业务同事学习商业模式,向产品同事学习产品理念,向客服同事学习用户喜好。诸如司罗就被派往阿里巴巴的搜索事业部。
甚至,很多研发人员还成了“猪倌”。为了探索智慧农业(000816,股吧),阿里人工智能养猪团队的十几名研发人员,在猪场陆陆续续呆了几个月。通过阿里的AI技术,给每一头猪建立了自己的档案。通过视频图像分析技术,记下了记录猪的体重、进食情况、运动强度等等。如果一只猪长卧不起,那人工智能就会判断它是怀孕还是病了。这种下到一线的做法,也被达摩院机器智能技术实验室主任金榕戏称为“上山下乡”。
“阿里的技术研发,绝不是为了发论文,而是要成为业务发展的眼睛。为未来的业务而研发。”鄢志杰说。
每天7.5亿次背后的世界需求
用户可能没有意识到,许多前沿的AI技术已经被应用于淘宝、天猫等阿里几乎所有的产品线上。
记者了解到,达摩院已经成功搭建了包括自然语言处理、语音识别等多个通用技术平台,用于支撑阿里巴巴整个核心技术体系。而司罗所领导的自然语言处理团队,则肩负着构建阿里巴巴整个自然语言处理技术平台的使命。
全球化是阿里集团未来20年三大核心战略之一。越来越多的人开始在阿里经济体上进行全球买和全球卖。让天下没有难做的生意,首先要让大家在语言沟通上零障碍。
以阿里巴巴国际站为例,七成买家以英语沟通,剩下30%为西班牙语、俄语、土耳其语等小语种。阿里对卖家的调研数据显示,大约96%的卖家对小语种无能为力。这就催生了机器翻译的巨大需求。而达摩院的机器翻译技术恰恰填补了这一业务空白,对阿里在俄罗斯、土耳其、西班牙、巴西等地的发展起到有效的支撑。目前阿里的机器翻译每天被调用的使用次数已高达7.5亿次。
此外,菜鸟物流通关、阿里云国际社区、飞猪旅行翻译助手、钉钉社交口语翻译等一系列产品也都应用了这一技术。
这才只是达摩院技术带来的巨大商业价值的冰山一角。
“别样”达摩院
在科技驱动发展的这个时代,对核心技术的掌握,尤其是在基础科学、颠覆性技术领域的突破,这将决定企业能走多远,更决定国家的竞争力。对于要做102年企业的阿里巴巴而言,加大对科技创新研究的投入,走科技驱动的发展路径,成为一种必然。“达摩院”由此创立。
马云对达摩院的发展提出三个要求,“活得要比阿里巴巴长”、“服务全世界至少20亿人口”、“必须面向未来、用科技解决未来的问题”。
希望汇聚全球顶尖的科学力量,潜心研究面向未来的核心科技,这是达摩院的目标,真正做到“侠之大者、利国利民”。
在研发体系上,达摩院已经形成了短中长三个层次的研发体系,分别是面向未来3-5年的前沿应用技术、面向未来5-10年的原创性基础技术、以及面向未来10-20年的前瞻性基础技术研究。
马云在达摩院宣布成立当天发表演讲称,研究不应该是Research for fun(为快乐研究),也不应该Research for profit(为利润研究),而是Research for solving the problem with profit and fun(为解决问题研究并带来利润和快乐)。
“For fun走得太远,for profit走得太近,都走不长。一个企业做得多大,在于企业解决多大的社会问题。这是阿里巴巴思考的逻辑。” 马云说道,“解决社会问题”是阿里巴巴始终贯彻的技术研发逻辑,阿里巴巴已经不是一家普通的商业公司,要成为一家技术驱动、技术和商业完美结合的公司。