首页 > 新闻 > 历史数据

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

人类行为能被预测吗?

第一财经日报 2012-10-10 01:13:00

责编:群硕系统

只消给巴拉巴西一些你的数据,他便能预测你明天出现在哪里,会做些什么事情。你信吗?

 

“人类行为93%是可以预测的”,《爆发》封面上的这句话,着实吓了我一跳。显然,作者艾伯特-拉斯洛·巴拉巴西已经准备好更新我们对人类行为的陈旧认识了。换句话说,只消给巴拉巴西一些你的数据,他便能预测你明天出现在哪里,会做些什么事情。

巴拉巴西是全球复杂网络的研究权威。网络科学研究的是丰富多彩的真实复杂网络,却用到大量的数学、物理工具,探索各种网络现象产生的机制,并试图解释或控制它。世界著名科技杂志《科技新时代》就曾发出这样的评论,“巴拉巴西可以控制世界”。

全书从一位环球旅行者、艺术家哈桑·伊拉希开始。这位美国人被自己人——移民局、FBI盯上了,原因是他在全球旅行轨迹过于诡异。随后,他成为一名“自我监视者”,将自我监视的过程变为一桩行为艺术,人人都可以查看他正在哪里,做些什么。作者却指出,即便不进行“自我监视”,我们仍将处于一种不断变化却日趋精密的被监视状态中。只要愿意,你的一举一动总能在某个数据库里留下线索。

想想吧,你登录微博、购物网站,使用各种商场会员卡、信用卡、手机……每一种信息都变为数据,汇聚到大数据时代中来。政府、金融、零售、网络媒体都需要它,以帮助做出合理决策。数据在被分析后,广告商便知晓如何在正确的时间找到正确的客户发表正确的内容,购物网站便知晓了如何将用户黏在网站上,并将用户感兴趣的商品源源不断地推送。

《爆发》到底讲了些什么?通过大量的铺垫性论述,作者认为人的行为不像水中的花粉微粒那样随机扩散,所谓的“每个人都有成名15分钟的机会”并不准确。总之,人类行为是“随意的、不可预测的、偶然的、无法确定的、不可预知的,以及无规无序的”,是完全错误的。

真相到底是什么?答案是人类行为93%是可被预测的,这些行为的发生则遵循着冥律分布。冥律本是个数学统计概念,其典型的例子便是帕累托定律:大部分人都很穷,极少数人掌握着大部分财富。也就是说,每出现一个比尔·盖茨,意味着一大群穷人的诞生。作者认为,冥律分布意味着爆发点的出现。理由是,短时间的活跃与长时间的耽搁相互交替,这与帕累托定律是一脉相通的。

我们在大部分时间里都是闲散着,却可能在极短时间内完成大量事务,这便是典型的爆发点。如何理解“爆发”呢?举个例子,一位读者突然连续三天购买《第一财经日报》——可能是为了连续追踪某条重要报道,然后很长一段时间里不会购买它,像是完全忘记了这份报纸一样。

针对爆发的起点、轨迹与频率,作者进行了完尽的阐述。拿起点来说,处于数据洪流中的个体,要想在“爆发”中生存,必须懂得设置优先级别,才能在有限时间里,剔除无关紧要的事件,将它们埋没在“长时间的耽搁”里,转而在“短时间的活跃”里集中注意力,完成真正重要的事情。而爆发的频率,作者更愿意用熵来定义它。熵用来描述一个体系的混乱程度,如果你每天都是在几个规定地点(住所、办公室、餐厅)规律出现,那你的熵值非常低,如果你每天行踪不定,没有固定规律,那你的熵值会比较高。总之,只要追踪到个体足够多的数据,便会计算出熵值,便能对行为进行一定的预测——要想预知未来,先了解过去。作者据此进行的一项实验就发现,不管年轻人还是老年人,所有人的生活圈可预测程度都差不多。不过,与女人相比,男人的可预测程度要低一些。

至此,“揭开人类行为背后隐藏的模式”这一全书意图,终于清晰起来。不过,爆发背后隐藏的真正原因是什么,作者并无过多的分析。《爆发》直白无误地指出,爆发的世界里没有“黑天鹅”,没有所谓的随机与偶然。在发现澳大利亚之前,欧洲人认为所有天鹅都是白色的,常用“黑天鹅”来描述不可能存在的事物。当黑天鹅出现那一刻,这个信念不攻自破。因此,黑天鹅代表着不可预测的稀有事件,尽管意料之外,却又改变一切。“黑天鹅理论”便是对习惯性的有限生活经验里,发生的意料之外的重大冲击。《爆发》试图更进一步,用冥律分布来破解“黑天鹅”,却未提供更多可参考的坚实依据。

巴拉巴西原本是匈牙利人,书中隔章穿插着16世纪初匈牙利十字军的一段血腥征战史,用来辅证人类行为可预测这一观点。遗憾的是,这段奇险的历史却在大量繁琐的人名称谓、读者并不熟悉的宗教贵族集团里,失去了原本的价值。《爆发》让人喜欢或讨厌的第一条原因,倒很可能便是这段十字军历史。作者真的没有必要耗费三成的笔墨纸张,用如此冗长的例子,来完成一件并无过多辅证价值的事情。

“爆发”这一概念令人耳目一新,全书却并不易读。这与作者行文的极大跳跃有关,内容的专业性也有关系。当然,幸亏出品方的设计,让原本艰深且有些专业的《爆发》,很好的在条块化内容中被分隔,使阅读不至过于艰辛。我所担心的是,并不算合理的分隔,反而使内容显得支离破碎,读者只能在划定的条框或加粗的文字里,寻章摘句式地快速阅读了。

这本《爆发》虽具话题性,其观点却并无过多的实验数据作为支撑,更多的则是像在讲故事。作者认可冥律分布,认为人类是习惯的产物,所以很多行为可以预测。但能否精准预测人类行为,作者也并无多少信心,毕竟人类的生活里充满了波动与分叉点。

与很多研究大数据的专家一样,作者对数据的未来不无忧虑。数据是一把双刃剑,既便捷了我们,也暴露了我们——我们的未来极易被人掌握。谁将负责我们的信息安全,谁又可能从中获利,隐私在哪里,成为全书最后一部分的诘问,也是对大数据时代的一个警醒。政府与公司是否会变成小说《一九八四》里的老大哥,无形中监视并预测着我们的一切行为?这是一个待解的问题。

作者的上一本畅销书《链接》提出了清晰无疑的观点:在互联网上我们不是随机链接在一起。“互联网是由少数高链接性的节点串联起来的,极少数的几个点拥有海量点击,而绝大多数网站只有寥寥可数的人造访。”这一观点,无疑适用于微博。大V总是极少数的,可每发布一条微博,便具有极大的转发数量。大多数微博用户都是普通的,粉丝数量稀少,发一条微博也只有三两评论。

总之,《爆发》的思想性逊于《链接》,让人领略了一些别样风景,科学洞察力却不够。它会是一本畅销的话题书籍,但未必比“黑天鹅”走得更远。

举报
一财最热
点击关闭