当前位置:首页 > 投融资 > 产业 > 科技前沿 > 正文

AI研习专题:面向共享出行的群体智能技术与应用

来源:中国人工智能学会 发布时间: 2021-04-06 16:29:17 编辑:夕歌

导读:近期的人工智能技术突破主要聚焦于有效地模拟个体智能,尚未能很好地解决大规模群体进行智能协作的技术瓶颈,因此,群体智能技术作为一种通过汇聚激发大规模参与者完成真实复杂任务来涌现超越个体智能的新范式亟需被探索。

摘 要

近期的人工智能技术突破主要聚焦于有效地模拟个体智能,尚未能很好地解决大规模群体进行智能协作的技术瓶颈,因此,群体智能技术作为一种通过汇聚激发大规模参与者完成真实复杂任务来涌现超越个体智能的新范式亟需被探索。本文重点关注群体智能技术最典型、最具实际价值应用之一的共享出行,首先探讨大规模共享出行场景中几大群体智能技术前沿问题,包括组织架构设计、行为模式挖掘、激励机制设计与协同决策优化,介绍相关的前沿研究工作;然后以滴滴出行为应用案例阐述群体智能技术的真实应用场景;最后对其未来发展做出展望。

关 键 字

人工智能;群体智能;共享出行

0 研究背景

近年来,人工智能技术的发展经历了剧烈变革,也取得了重大突破。我们看到了以 AlphaGo为首的一系列夺人眼球的技术革新产物,但与此同时,也意识到目前人工智能的发展面临着难以落地的瓶颈。究其原因,人工智能的主流范式往往过于强调对个体智能的模拟,最终局限在了求解边界封闭、约束静态和目标单一的问题上。而在现实生活中,随着互联网的高速普及,每天都有数以十亿计的网民人群在进行着数据信息的碰撞、交流与连结。在这种环境下,智能系统的边界从封闭走向开放;智能构建的约束从静态走向动态;智能应用的目标从简单走向复杂(见图 1)。为了刻画这种新的智能范式,群体智能技术应运而生。所谓群体智能,就是指通过特定的组织结构吸引、汇聚和管理大规模参与者完成任务时,所涌现出超越个体智力的智能。群体智能的思想古已有之,早在古希腊城邦时代,人们就开始聚集在广场上通过多人投票等方式进行议政,我国自古也有“众人拾柴火焰高”的谚语。近现代以来,随着系统科学与电子计算机的发展,也出现了许多早期的具有群体智能思想的研究,如克雷格·雷诺兹提出的集群智能的概念、钱学森等首创的综合集成研讨厅体系、维克托 • 莱瑟提出的多智能体系统,以及近年来越来越受到关注的众包技术等。在传统群体智能思想与前沿人工智能技术的启发下,一套新的基于互联网的群体智能技术正在逐步形成。

图 1 主流人工智能 vs 群体智能

群体智能技术作为一类新型技术的总称,讨论其具体的研究内容离不开应用支撑。群体智能技术在多个领域都有着广泛的应用,如军事侦察、传染病防控和社会行为分析等。而本文将重点关注其中最为典型,同时也与人们日常生活最为相关的一类应用,即共享出行。所谓共享出行,是指社会群体在相同或不同时间段共享车辆,并根据自身出行要求支付相应费用的新型交通方式。其代表性企业, 如 Uber 和滴滴出行等公司都设有多种类型的共享出行业务,如滴滴出行的快车、专车及拼车业务。随着移动互联网的普及与发展,共享出行所涉及的群体规模开始不断扩大。据统计,截至 2019 年,滴滴出行用户总数已突破 5.5 亿,年运送乘客 100亿人次。在如此大规模的真实共享出行场景下,如何更加有效地激励、协调群体参与者(如乘客与司机)从而给人们提供更加方便快捷的出行服务成为了研究的重点,群体智能技术则是解决这一类问题的关键。本文首先着重探讨面向共享出行的群体智能技术的几大前沿问题与研究现状;接着以滴滴出行为应用案例,阐述群体智能技术的真实应用场景;最后讨论目前尚存的研究问题与未来的研究挑战。

1 前沿问题

如上所述,面向共享出行的群体智能技术主要研究如何通过激励群体、调控群体等被动或主动的方式来优化出行服务;同时,有效的激励与调控手段也离不开对群体的组织与行为的理解作为支撑。因此这里详细探讨四个前沿问题。第一个是如何对群体的组织架构进行设计与优化。一个高效的组织架构是群智得以涌现的先决条件。在共享出行中,对司机群体设计合理的组织架构往往能激发更高的出行服务效率。第二个是如何对群体的行为模式进行挖掘与预测。共享出行中的参与者,无论是司机还是乘客都具有行为自主不确定的特点,因此为群体的行为建立可靠的预测模型往往能帮助决策者更好地统筹与管理大规模群体,群体行为模式也成为了研究中必不可少的一环。组织与行为二者联系密切,群体的组织形式决定了对群体行为模式的研究范畴,而对群体行为的预测也影响着群体组织架构的设计方法。在设计了组织架构及理解了行为模式的基础上,第三个前沿问题便是如何设计合意的激励机制引导群体。司机与乘客作为理性个体,往往会为了追求个人利益的最大化(如单次订单收益),而牺牲群体的利益(如全局收益)。激励机制的作用便是为群体提供理性激励,以引导其完成群智系统设计目标,是吸引和汇聚司机或乘客持续参与以实现群智涌现的重要环节。与此同时,群智系统的个体也并非完全自主不可控,如平台可以对司机发出派单任务,因此除了激励机制以外,第四个是如何对群体进行高效的协同决策,其旨在为群体在完成目标的过程中提供关键且持续的决策支持,从而最终达成群智涌现的目标。激励机制与协同决策同样密不可分,构成了由激励机制影响决策,再由决策结果反馈激励机制,从而进行更新与优化的回路反馈关系。下面围绕这四个前沿问题展开更为详细的阐述。

1.1 组织架构设计

组织架构的研究传统的多智能体系统理论早已涉及对智能体,例如在多个机器人协同完成某项任务时,设计层次式组织架构来实现高效的任务分配、信息传输与结果汇聚等。然而到了互联网环境下的共享出行领域,智能体由简单可控的机器人变为了自主性强、特征复杂、成员异质的司机或乘客群体,其数量也由传统的一般不超过 10 个变为了成千上万甚至上百万、千万,且成员实时流动,其动态性远远超过传统多智能体系统讨论的范畴,因此给组织架构的优化设计带来了巨大的挑战。

目前,在共享出行领域,组织架构设计的典型问题之一是司机组队问题,即如何把司机群体划分成若干队伍从而更高效地完成订单任务。在司机组队问题中,核心要点是决定队伍的结构与组成以最大化全局效率等优化目标。例如,需要决定采用一个队长多个队员,还是只有队员没有队长的结构;同时还需要决定队伍的人数,以及安排哪些司机加入哪些队伍等。为了求解组织架构的优化问题,首先需要对团队不同成员的贡献建立综合评价体系,例如每个司机在不同时间段的接单效率等,从而形成个体与全局目标间的联系。而后,需要建立个体间复杂偏好的约束关系,例如,许多司机更愿意与自己的同乡或是有相似爱好的司机组队。同时也需意识到,在以上工作基础上求解的最优队伍组织架构只适用于静态场景,而忽略了司机具有动态流动、上下线时间不定的特点。因此,最后还需要设计动态评价策略,并针对组织内关键节点可能的突发情况设计高鲁棒性调控措施等。目前,滴滴出行在司机组队问题上已有静态场景下的初步成果,但是许多问题尚未解决,群体组织架构设计在未来仍有很大研究空间。

1.2 行为模式挖掘

行为模式挖掘的研究与群体组织架构设计相辅相成,组织架构所采用的多种贡献和偏好评估方法都离不开对行为模式的理解,同时对行为的预测也能反作用于组织架构的调控。一般意义下对人类行为模式的挖掘分析,一直都是传统数据挖掘和机器学习领域的研究热点与重要方向之一。在移动互联网与物联网的发展推动下,智能手机、智能穿戴设备和街道摄像头等每天都会产生大量的人类行为数据,一些现有研究领域,如移动群智感知与时空众包都涉及了对此类行为数据的收集与分析,它们中的许多方法也同样可以借鉴到群体智能的研究之中。然而,在更加广义的群体智能技术研究中存在多种动态的数据源,目标模糊且多样化,群体行为模式间的关联往往更加深层复杂,并且还存在诸如隐私保护等多种限制,因此也给研究带来了一定程度的挑战。

在共享出行领域,行为模式的理解问题可以分为针对司机行为与针对乘客行为。司机的行为包括出车时间段、习惯性工作区域和日均收益等;此外,司机的个人画像和乘客的偏好等也可划入其行为的范畴。对司机行为的理解与预测的相关工作一般利用司机行为的历史数据建立机器学习模型,来预测司机未来的行为,使预测结果辅助如组队、派单等其他过程。乘客的行为同样可包括乘客的日常打车习惯和打车偏好等,可利用相似的方法进行建模与预测。共享出行中一类最典型的行为模式挖掘问题即供需预测,其致力于在大量历史订单数据基础上建立模型、预测未来城市的各区域各时段打车供需量,从而对司机进行提前派单以缓解供需失衡问题。部分代表性现有工作致力于全面的特征工程与针对海量数据的分布式算法的实现。然而,如今共享出行领域许多行为模式挖掘都需涉及大量司机或乘客的个人数据,在数据收集过程中面临着越来越多的隐私保护限制。如何在保护个人数据隐私前提下进行机器学习的建模与预测是目前联邦学习所重点关注的问题,也是未来在群体智能行为模式挖掘中的一大挑战。图 2 示出了一种联邦学习框架。

图 2 一种联邦学习框架

1.3 激励机制设计

对群体组织架构的设计与行为模式的挖掘为群智系统的平稳高效运行提供了先决条件,而针对群体的激励机制设计与协同决策优化则是系统持续稳健运行的关键。合理的激励机制能均衡和高效地引导个体的行动,从而为整个群体注入可控的动力来源。群体智能技术下的激励机制设计相比传统的博弈论与机制设计,同样具有许多新的区别与挑战。传统机制设计中激励对象的效用函数一般都是已知的简单函数,激励对象的数量比较少,并且激励机制的动态性较低。而在群智激励中,激励对象的效用与偏好十分复杂,无法用简单函数来近似,激励对象数目巨大,并且由于环境实时动态变化,传统的激励机制很难发挥稳定作用,达成群智的持续涌现。

在共享出行中,激励机制的现有工作大致可以分为基于定价的激励机制与基于奖励的激励机制,其中前者占目前研究的大多数。基于定价的激励机制指平台通过向乘客收取合理的费用和向司机支付合理的报酬来激励乘客和司机参与的激励方式。最基本的定价激励方法即是基于固定价格的激励机制,现有研究大多基于拍卖理论(如VCG 拍卖等),从而提出优化特定目标的定价机制(如社会福利最大化、乘客个体公平性等)。在固定价格机制基础上的浮动价格机制,则是更进一步考虑了动态场景下价格需要不断自适应调整的情况。基于奖励的激励机制目前现有研究较少,而更常见于滴滴出行、Uber 的营销政策中,如司机奖励活动、乘客会员制度和红包优惠等。纵观现有的共享出行激励机制设计相关研究,大多数仍停留在传统机制设计的理论层面,而忽略了群智环境带来的算法实用性与如何落地的挑战,这将是未来应该研究的重点之一。

1.4 协同决策优化

如果说激励机制是被动地对群智系统进行干预与引导,那么群智协同决策则是一种更加直接与主动的调控手段。它可以看作是在激励机制的基础上对群体资源进行全局性的再优化与分配,使群体能协同高效完成任务,也是群智涌现中最为关键的一步。如果缺少协同决策,通过激励机制自组织在一起的群体只会是一盘散沙,无法实现资源的最优

化配置。不同于传统的资源配置与决策算法,在群智协同决策中,智能体能力不一、任务多样且难度不同,无法用传统方法来简单建模。此外,如何提供自适应、强鲁棒性的持续决策也成为了新问题。

目前,在共享出行中,最普遍的两种协同决策方式是订单派遣与路线规划,其现有研究多数来自于时空众包中关于任务分配算法的研究。首 先,订单派遣,也即是由平台通过特定的分配算法将每个订单派遣给指定司机,以期望达成诸如最大化成交率和用户出行体验等优化目标。该问题可被建模为最大化或最小化加权二分图匹配问题(见图 3)。

图 3 订单派遣问题的二分图建模方法

早期基于静态离线场景下的求解方法往往忽略了真实应用中群体的动态性与边界的开放性特征,2016 年 Tong 等首次提出了使用在线双边加权二分图匹配模型来建模该问题,此后也有类似通过组合优化来求解的方法。随着群智环境的复杂化与规模的扩大化,后续开始出现依靠历史数据辅助协同决策的强化学习算法,包括基于多智体强化学习的大规模订单派遣算法。另一大类问题,即路线规划,是共享出行中另一类典型应用——拼车的核心问题。其旨在拼车业务中为每位司机规划一条满足某些约束条件的路线(如乘客容量约束),从而实现最优化特定的目标(如最小化司机行驶距离或最小化乘客等待时间等)。同样,由于静态场景难以契合实际,近年来研究主要都关注动态场景,而动态场景的问题求解效率成为其一大挑战;多数工作都致力于优化其核心操作,即插队操作来降低时间开销。2018年Xu 等首次提出基于动态规划的插队算法,将时间复杂度从平方复杂度降低为线性复杂度,并进一步提出了基于线性时间插队操作的通用框架和统一的优化目标。然而,目前的研究仅针对单个司机进行优化而忽略了多位司机间可能存在的协同或冲突问题。如何提高决策算法的协同性,以及如何保证在大规模群智环境中的算法运行效率仍是未来研究的潜在方向。

2 应用案例

下面结合具体应用案例,阐述上述前沿问题在现实中的落脚点。在共享出行领域,例如滴滴出行的快车、专车及拼车业务普遍存在供需不平衡的问题,因此,如何制定高效的打车订单分配方案,以实现降低乘客通勤成本,提高司机收益,提升社会整体效益是非常关键的。基于群体智能技术的司机组队与订单协同分配的任务调度系统,可以让司机通过组队合作进行协同决策,使供需方得到较平稳的匹配结果,从侧面提高网约车群体的整体运力,进而实现高效的订单分配。整个任务调度系统大致分为四步。

第一,队伍组织架构的设计。可以利用群体组织架构设计方法决定每个司机队伍的组织结构,例如,每个队伍的司机数量,以及队员分配到具体队伍的分配原则等,以提高系统整体的执行效率。

第二,供需行为的模式挖掘。在确定了司机组织结构后,还需要对不同组织结构在真实系统中运行的供需行为进行分析与预测,把学习到的行为模式进一步反馈给组织架构部分来优化。

以上两个步骤通过联合互补,实现根据实际运输需求把司机合理地分配到不同队伍中的目标。

第三,奖励规则的制定与完善。根据司机队伍订单完成状况设计奖励规则来激励司机,例如,不同时间段对应不同奖励,在高峰时间段接单更多的司机队伍可以获得更丰厚的报酬,以此来更好地激励司机接单。在激励司机的同时,也可以针对乘客群体设计更人性化的价格机制,从而引导乘客选择合理时段出行。

第四,匹配决策的学习与优化。进行司机队伍间的协同决策,决定在各个时间段具体把哪些订单分配给哪些司机,为此需要设计高效的匹配算法来进行均衡的群体资源分配。

后面两个步骤体现了群智激励机制设计与协同决策之间的回路反馈,二者共同作用来提高系统效率。

上述司机组队与订单协同分配的任务调度系统通过群体智能技术高效地整合了司机群体的资源,分析与预测了供需行为,并通过回路反馈机制不断提高系统效率。该系统已被真实部署于滴滴出行平台(见图 4),它有希望在未来极大地缓解“打车难”的问题,使涌现的群体智能受惠于人们的日常出行生活。

图 4 共享出行应用案例

3  未来挑战

目前,关于群体智能技术的研究方兴未艾,共享出行作为最具潜力的落地应用之一,虽然已有部分早期的研究成果,但与真正的大规模群体智能还相去甚远。下面简述面向共享出行的群体智能技术的四类潜在未来研究挑战。

(1)动态自适组织架构的设计问题。现有的针对共享出行中群体组织架构的研究较少,且都局限于求解静态的司机群体组织架构,而忽略了司机上下线时间的动态变化性。因此,如何设计一种适应群体成员动态变化的自适性组织架构将会是一个重要的问题。

(2)时空大数据挖掘中的隐私保护问题。目 前,大多数利用乘客或司机历史行为数据进行数据挖掘与机器学习的工作,都忽略了采集数据过程中可能面临的个人数据隐私泄露问题,而联邦学习给这一类问题提供了潜在的求解思路。未来,研究如何使联邦学习技术服务于时空大数据的共享与挖掘,将会为隐私保护前提下学习与预测群体行为提供一条新出路。

(3)更加动态与多样化的共享出行定价机制求解问题。现有的共享出行定价机制较为单一,割裂了普通拼车与打车的定价场景,因此脱离了用户一般会同时在多种出行方式间取舍的实际情况。研究在多种出行方式间弹性变化的混合定价机制将有利于更好地平衡供求关系,缓解打车难等一系列问题。

(4)大规模协同决策算法的效率保障问题。共享出行应用在许多城市都涉及海量的用户与司机群体参与,而出行服务往往需要秒级的响应时间。因此,未来无论是针对订单派遣,还是路线规划的协同决策算法都必须考虑如何提升面对海量群体时的运行效率,从而使算法真正具有落地意义。

4 结束语

本文介绍了群体智能技术的诞生背景,并依托其最典型的应用之一——共享出行,详细阐述了其前沿问题与相关研究现状;同时以现实场景的应用案例揭示了这项技术所具有的巨大应用落地前景;最后展望了未来具有潜在价值的研究问题与挑战。总而言之,在移动互联网技术与共享经济飞速发展、人类群体的联系越来越紧密的今天,面向共享出行的群体智能技术作为一项贴近现实生活的新范式,将会受到学术界与产业界越来越多的关注。

(参考文献略)

选自《中国人工智能学会通讯》

2020年第10卷第7期  AI研究前沿与群体智能计算专题