滴滴研究院副院长叶杰平近日在上海一场内部分享会上详细解读了滴滴大脑,这也是首次对外部披露较为完整的滴滴算法世界。
滴滴大脑由三部分组成
叶杰平将滴滴大脑这个智能系统分为三部分,分别是大数据、机器学习和云计算。
其中大数据就像工业革命时代的煤一样举足轻重,人工智能需要数据进行训练,纵观应用级深度学习的成功案例,他们都获得了海量数据,像谷歌和Facebook这样的公司都可以获取大量数据,这种优势让他们可以创造更有效的新工具。
机器学习则是人工智能的核心,一套系统通过机器自我学习的方式来实现人工智能,算法则是机器学习的关键要素。滴滴搭建的核心算法模型,可以帮助实现更准确的预测能力、智能的调配能力,提高效率降低成本,达到最优运力调度。
云计算提供强大、灵活的计算能力,滴滴的业务场景对计算要求和实时性都非常高,用户输入一个目的地,最佳合理调度都由滴滴大脑以毫秒级的速度来计算,例如通过滴滴云计算搭建了大规模实时分单处理平台,可以实现多维度最佳订单匹配。滴滴平台已经有数万台服务器,未来两年服务器规模将达到数十万台。
叶杰平揭秘的算法世界,是滴滴大脑最为核心的技术之一,滴滴研究院解决的技术难题,包括供需预测、路径规划、智能派单等都离不开算法,此外在提高用户乘车体验上,也引入了人工智能,比如服务分和机器判责等功能背后都是通过复杂的机器学习算法技术来实现。
每两秒进行一次判断
每一次分单,就如同下棋,需要考虑之后N步的走法,也就是预测未来,滴滴大脑每2秒进行一次全局的判断,在迅速的大量计算中,完成全局最优的智能派单,对于这些背后的技术,叶杰平在这次内部分享中作了详细解读:
1、供需预测
大数据的神奇之处就在于可以通过搜集到的数据,进行处理分析后,得到规律,然后利用这个规律来对未来进行预测。
最近比较有名的例子是一套名为MogIA的人工智能系统成功预测出川普将成为美国总统,这套亮相于2004年的系统,也曾经对以往三次总统选举进行过成功预测。去年,开发者设计的算法又一次准确预测出了最后关头共和党方面取得的后起势头。大数据还可以预测天气、预测地震,甚至预测你会不会生病等,而在交通方面,大数据预测的能力就极为重要,可以预测什么时间什么地方会拥堵。
大数据预测的关键是足够多的高质量的数据。当前滴滴在交通领域的数据量全球第一,每日峰值订单超过2000万单、每日处理数据超过2000TB,覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度,它所掌握的巨大的真实数据除了帮助预测路况外,还能对供需进行预测,供需预测越准确,越能更好的解决供需不平衡问题。
滴滴目前对15分钟后供需预测的准确度已经达到了85%,基于这样高的准确率,平台可以调度司机满足未来的打车需求,有效降低未来该区域供需不平衡的概率。甚至可以畅想,有一天滴滴将能精准地知道,星期五夜晚,雨天或雪天,港丽酒店门口有多少乘客需求,附近有多少运力?
2、路径规划
路径规划和ETA两项地图技术是实现智能派单的关键,也将直接影响到司乘双方的使用体验。
通过海量历史数据,可以对未来路况做预测,实现A点到B点的路径规划,它是派单的核心,工程师围绕最低的价格、最高的司机效率和最佳交通系统运行效率来做算法。
ETA指预估任意起终点所需的行驶时间,要求精准性。滴滴是国内第一家把机器学习成功应用到ETA的公司,这是解决“订单高效匹配”和“司机运力调度”的关键技术。当前滴滴ETA可以预测每一单出行的时长以及预估在每一个路口前的等待时长。有了这项技术,可以在更合适的时间对运力进行更好的调度。
3、智能派单
用滴滴叫车,和搜索的逻辑不同,网上的商品、资讯等信息都是静态停留在那里,计算方式只是将这个商品、信息挖掘出来即可,而滴滴的计算则类似于动态打靶,车辆永远在运动当中,要在众多运动的车辆中,给乘客一个最优的选择,不光是距离,时间也是。也就是实现平台效率和用户体验最大化。智能派单对订单量和司机数进行预测,然后通过大规模分布式计算来实现上述的最优撮合。
为了实现这一目的,供需预测、动调调价、路径规划以及服务分的算法技术要一起发挥作用,他们最终为实现最优派单而服务,他们的算法都将结合到智能派单系统中,帮助在动态环境中撮合乘客与司机的交易。
据悉,目前高峰期滴滴平台每分钟接收超过3万乘客需求,每两秒钟作一次订单匹配,每一次发单背后,滴滴大脑运算次数达到百亿次级别。
4、服务分和司乘判责
滴滴使用大数据技术来预估每个司机的服务分值,包括乘客打分、乘客评价以及取消率等因素,并利用算法模型来计算不同服务水平的司机对用户产生的长期影响。
滴滴在2016年9月上线服务信用体系后,司机拥有个人专属的服务信用档案和服务分值,为乘客提供优质服务的车主可获得更高的服务分,从而获得更多的订单和收入。目前服务分已与滴滴的智能派单系统结合,在距离、车型等条件类似的情况下,系统将优先派单给服务分较高的车主,帮助服务优良的车主获得高的收入。上述服务信用体系就是利用人工智能建立算法模型来实现,该信用体系上线后,用户投诉率和订单取消率都显著下降。
保证安全体验,服务分是手段之一,提高司机服务质量,用大数据机器学习模型来计算司机当前服务分,通过交易引擎系统来保证服务分高的司机收入越高,司机就有动力来提高服务。
叶杰平表示,算法世界犹如一个浩瀚的星空,没有边际。因为没有一个算法是通用的,每个具体问题就需要一个算法,如何结合业务场景找到最合适的算法是一大挑战。
“算法已经变得非常重要,随着每天数据量迅速增大,现有算法不分昼夜都处理不完,可以说现在算法的分析速度远跟不上数据的产生速度,算法和计算平台需要越来越快的速度。”
他主要研究随机性在计算中的作用,以及协议设计和密码学,奠定了当今大部分数字基础设施的基础。
广州安滴科技有限公司已正式成立,注册资本4.2亿元。
会上明确,探索建设国家级数据标注基地,充分发挥地方配套支撑作用,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,促进区域人工智能产业生态发展。
滴滴出行全年净利润为5.4亿元。经调整EBITA亏损为21亿元。