首页 > 新闻 > 专题文章

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

单日处理8亿个包裹,他说这是大数据的骄傲 | 数据科学50人•丁宏伟

DT财经 2018-03-20 16:56:27

责编:盛倩倩

如今,我们每个人都在谈论“数据科学”,哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学领域的科学家、从业者们又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学从业者,希望能让你们了解这些神奇的人和他们神秘事儿,为你们一窥数据科学的未来与未知。

令人惊叹的“菜鸟速度”

每年的天猫双11购物节,都是一次“全民买买买”的狂欢。

家住上海嘉定区朱桥镇的刘先生,早早就在自己的购物车里添加了雀巢咖啡、饼干、坚果等零食,希望能在双11的时候第一时间抢到自己心仪的商品。11日0点刚过,他就立刻完成了付款。

4分钟内,刘先生选购的商品被贴上了菜鸟电子面单,从仓库中发出;12分18秒,包裹就已经被送到他家门口。当快递员敲响刘先生的家门时,他甚至还在“血拼”。

从下单到签收,菜鸟的物流体系只用了12分钟就完成了商品的整个配送过程。“菜鸟速度”是如何做到这么快的呢?菜鸟的数据掌舵人丁宏伟说,这是大数据的“预见”所带来的力量。

换句话说,在刘先生下单前,菜鸟的大数据就已经能大概预估到他将要买什么东西了。

“首先,我们会根据整个电商体系的流量情况,对商家行为和消费者行为建模,预测双11每个城市每个社区对不同品类商品的需求。”丁宏伟告诉DT君。接下来,他们会把数据反馈给商家,辅助商家备货,并根据需求把货物配置在不同地区的仓库中,做到 “单未下货先行”。

作为国内物流大数据领域首屈一指的科学家,丁宏伟在这一领域已经了十多年了。2001年,他从清华大学硕士毕业,之后远赴法国深造,在法国国家计算机研究院(INRIA)获得了运筹学博士。在完成自己的研究生涯后,丁宏伟果断从学界转入工业界,在IBM工作了近10年,一直从事数据科学领域研究和物流供应链优化应用。2014年,他正式加入菜鸟,担任首席数据科学家,领导菜鸟的大数据业务。

丁宏伟个子很高,为人谦和,谈吐优雅,经常穿着一身休闲西装。比起严肃的“科学家”称谓,他看起来更像一个有丰富经验的“业务Leader”:讲起数据的话题时极接地气,几乎不会拽术语的、扯概念。

图片说明:菜鸟首席数据科学家丁宏伟接受DT君专访

“数据科学家,我认为它必须要具有行业属性。因为数据的终极价值还是需要体现在和业务场景相结合的地方。”丁宏伟认为,一个好的数据科学家应该到行业中去理解业务并实现数据的价值。随着互联网的发展,各个行业的数据出现了井喷式的增长,这就给他们这些“数据科学家”提供了表演的舞台。

在领导菜鸟大数据之前,丁宏伟曾帮助行业领先企业规划供应链网络,优化生产排程计划,优化商业设施选址,常常需要综合考虑生产数据、地理位置数据、门店数据、社区数据等多维数据。

今天,丁宏伟领导的菜鸟团队面对数据量和数据维度都更加复杂——他们最高峰时要处理单日8.12亿个包裹的所有动态数据,这可能是全球物流领域最“大”的数据了。

“双11当天有8.12亿个包裹,这些包裹在后续每一天都会发生多次的状态变更,为了实现对这8亿多个包裹的实时监控,我们需要对超过200亿条数据进行实时去重、关联、分析等操作。能实时高效处理和分析这样量级的数据,我们感到非常骄傲的。”在回顾菜鸟在双11的表现时,丁宏伟自豪地告诉DT君。

双11独特的业务场景其实只是菜鸟网络的一部分,丁宏伟说到,他计划的智慧物流体系可不仅只是“快”而已。

双十一第一单背后的物流智慧

在广东惠阳的菜鸟仓库中,数千平方米的厂房,几乎看不见什么工作人员。

广阔的空间里,上百个外形酷似扫地机器人的AGV(Automated Guided Vehicle,无人搬运车)正在有条不紊地将货物搬来搬去。

图片说明:忙碌在广东惠阳仓库中的的菜鸟物流机器人

AGV又被称为无人搬运车,是一种自动化的无人驾驶机器人,被广泛地应用在各个行业。仓储业是AGV最早应用的场所。1954年世界上首台AGV在美国的南卡罗来纳州的Mercury Motor Freight公司的仓库内投入运营,用于实现出入库货物的自动搬运。目前,世界上约有几十万台各种各样AGV运行在几千座大大小小仓库中。

“每个机器人,需要去把货架顶起来,然后按照整个拣选优化或者检验顺序给到分拣员,实现‘货找人’。这个过程中,它要对多智能体协同、路径优化、图像识别、避免碰撞等各种数据问题的进行综合考量,从全局做出判断,这是智能物流比较大的一个应用场景。”丁宏伟说到。

在丁宏伟看来,智能物流的“智能”本质在于:通过各种技术能力获取全局的实时的高质量的各类物流要素的数据信息,来进行更合理更优化的决策。

大数据的“大”就在于一个“全局性”的把握。

菜鸟要把握的“全局”不仅在于自动化的机器人仓库,它更看重在整个物流供应链上的全局优化。“这也是菜鸟平台的特性所在。”丁宏伟强调。

“因为每一个物流合作伙伴,其实都是整个物流链路里重要一环。物流之所以难,是因为它的链路特别长,跨越很多公司,也在地域上有很大的跨度,所以它的数据获取和分析都面临很大困难。”丁宏伟认为,作为一个数据平台,菜鸟在连接了各方合作伙伴后,能够站在全局的角度,为每个物流链条上的角色提供建议。

通过融合运筹学上的混合整数规划、线性规划,以及大数据领域的机器学习、深度学习等方法,他从发货、揽收、仓储、配送等环节对物流体系进行优化,降低服务成本,提高效率。同时,再结合消费数据、地理位置数据等,又能够对消费者的行为进行分析预测,从而反哺、指导商家的物流行为。

丁宏伟说,之前很多商家在做线上、线下的销售时,使用的是两个独立的渠道,管理效率较低。在智能物流模式下,他们能将线上和线下的数据和流程全部打通,让商家可以看到全网的库存、销售等情况。“然后,我们帮助商家进行仓库配置,在不同层级的仓库大概备多少货,我们会基于这些数据,帮商家把他的货品一路往下沉,根据不同的地区、不同的需求,把它存在不同的层次。”通过对全局的把控,在不影响销售的情况下,他们曾帮助客户降低了38%的库存量。

正是有了这种全局的数据能力,菜鸟才能帮助物流合作伙伴在12分钟内把快递送到上海的刘先生家中。不过丁宏伟也强调,电子面单这样的基本信息化服务依然非常重要,因为物流数据的信息化是智能物流的基础要求。

大数据和AI:灭旧与创新

如果你行走在杭州的阿里园区里,你会不时看到一个外形酷似《星球大战》中R2D2的机器人,带着快递,来回穿梭在楼宇和商店间。它碰到行人会避开,能够自己坐电梯,十分智能。

图片说明:2017年6月13日,杭州,菜鸟智能配送机器人小G在杭州铁路运输法院办事大厅忙着配送文件;图片来源:视觉中国

这是菜鸟网络设计的末端配送机器人小G,它能够自主完成快递的“最后一公里”,将包裹送到收件人的面前。

小G是菜鸟应用图像识别、深度学习等人工智能技术设计出来的智能机械产品。除此之外,在上文提到的机器人仓库里,包括AGV机器人、机械臂等,菜鸟已经在物流领域的各个链条上开始大量使用人工智能和机器人技术了。

一方面,机器人能够极大减轻人类的劳动强度,提升工作效率;但是另一方面,一些原本属于人类的工作,可能会被机器人所“抢”走。

对此,丁宏伟认为,我们不用太过担心。“蒸汽机出现的时候,很多纺纱工人看似失业了,但实际并没有,他们会演进成为蒸汽机的操作工人。”丁宏伟以历史上的工业革命为例,认为人工智能的出现虽然会影响到一些特定岗位,但是也会创造很多新的岗位,整体上人工智能还是会推动行业的进步。“AI让我们效率更高、成就感更好,整个体系更有价值,所以我们应该乐观地看待它。”

丁宏伟认为,AI和大数据不仅不会威胁到人类员工,还能一定程度上帮助他们。

快递员是物流行业中普通人接触最多的群体,他们的工作强度很高,不管刮风下雨,每天都要去送快递,基本全年无休,备受挑战。“快递员是很辛苦的一群人”,丁宏伟认真地说。由于压力大,快递员的流动率非常高,很多人常常做不到半年就离开了。如何改变快递员这种情况呢?丁宏伟认为,大数据可以在其中做很多事情。

这其中的关键,就是信用——大数据可以帮助人们建立信用体系。缺乏信用就会增加社会体系的交易成本和运行成本,影响生活体验。

丁宏伟介绍说,在流动性强的物流行业中,快递员普遍缺乏一个回馈机制,也就是没有所谓的“信用”数据。一个快递员的服务体验好、工作能力强等特质并不能给他们带来更高的收入和更稳定的工作,其中缺失的重要一环就是“信用”。

“让服务好、能力强的快递员,有一套数据在背后支撑他,让他们工作得体面,在行业里走得更好更远。”一套好的评价机制和一个良性循环的职业环境,才能为从业者提供最贴心的保障。这也是菜鸟网络正在做的。

一路走来,丁宏伟面对的数据量越来越大,维度越来越复杂;但是不变的是,他始终从场景出发,秉承自己数据科学家的理念。

采访结束后,DT君不免有所感慨,中国在电子商务领域的全球领先性和规模效应催生了大数据在物流领域的应用与发展,虽然,人类离完全的人工智能时代还有很远的路要走,但似乎也已经看到了智能物流正在朝我们走来,这背后绝然离不开数据科学力量的支撑。

数据侠门派

丁宏伟,清华大学硕士,法国国家计算机研究院(INRIA)运筹学博士。曾在IBM工作了近10年,从事数据科学领域研究和物流供应链优化应用。2014年正式加入菜鸟,担任首席数据科学家,领导菜鸟的大数据业务。

关于数据科学50人

“数据科学50人”项目是DT财经旗下数据侠计划重点内容产品,旨在与数据科学领域KOL共同挖掘数据内容的价值。我们从商业数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。

举报
一财最热
点击关闭