首页 > 新闻 > 阅读周刊

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

数字、数据、统计图表:如何辨识科学外衣下的新派胡扯

第一财经 2022-06-30 11:43:09

作者:彭晓玲    责编:李刚

美国两位学者花了多年时间对数据进行研究后,发现鲜为人知的一面:数学和统计学其实经常打着科学的幌子胡扯,数据只不过是一些不实信息的精致伪装。

如果用“数据说明”为关键词在百度上进行搜索,会出来上亿个相关网页。在互联网时代,“用数据说话”的思维深入人心。这些来自各行各业的数据,被不断升级更新的数据可视化软件制作成精美的散点图、极坐标图、桑基图等,出现在跨年演讲的PPT、最新的医学期刊以及媒体上,以此证明作者观点的严密和准确。

美国两位学者花了多年时间对数据进行研究后发现:数据往往只不过是一些不实信息的精致伪装。

这两位学者分别是美国华盛顿大学生物学系教授卡尔·伯格斯特龙(Carl Bergstrom)和信息学院副教授、公众知情中心主任杰文·韦斯特(Jevin D.West),根据他们的研究写成的《拆穿数据胡扯:信息驱动世界的生存指南》一书最近出版了中译本。伯格斯特龙虽然是生物系教授,但也对信息领域很感兴趣,其中一个研究方向是信息如何大规模地在生物和社会系统中流动。在第一章中,他就通过卷尾猴发出虚假性信息抢夺食物、渡鸦会向同类隐蔽食物等,试图说明自然界中“胡扯”无处不在,只不过人类的水平更高。

他们把人类的胡扯分为两种,一种属于“文科”的老派胡扯,靠的是花哨的修辞和华丽的词藻;一种属于“理科”的新派胡扯,用数学、科学和统计图表来制造严谨、准确的印象,披上科学的外衣。与前者相比,这种胡扯更隐蔽,尤其糟糕的是,科技的提升不仅没有清除胡扯现象,还让问题变得更泛滥。《拆穿数据胡扯》聚焦的正是这种新派的“理科”胡扯。

以常见的通过横轴或者纵轴来进行数据说明为例,看起来轴上提供的数据很客观,实际上设计者对图形所传达的信息有很大的控制权,通过有选择地改变坐标轴的相对比例,可以让数据传递他们希望传递的任何信息,“要么是无中生有,营造出一种相关性的假象;要么是放大群体之间的微小差异”。

2015年,美国《国家评论》在推特上发布了一张全球气候变暖的数据图片,看起来从1880年到2010年全球气温都比较稳定,根本没有科学家所说的全球变暖。但是美国国家航空航天局戈达德空间研究所绘制的一张全球气温变化图则显示,全球变暖的趋势明显加剧。为何两张数据图片上显示的内容差距这么大?作者认为,这正是推特上那张图的作者“阴险的一面”,他故意把纵轴上的温度变化数字拉得很大,以10华氏度为一个划分单位,而NASA的温度划分则细到以1华氏度变化为单位,自然结论大相径庭。

“为什么新派胡扯总是利用数字、统计数据和数据图表粉饰那些可疑的论断,给它们披上了一层合理的外衣呢?遗憾的是,这个问题本书作者没有研究。”中国科普研究所创作研究室副研究员姚利芬说。她认为,这是近代以来对自然的数学化造成的。“自然的数学化”的本质,并非是使用数学的语言描绘大自然和人类社会,而是把整个世界看成是使用数学的。在西方,这种传统由来已久,起源于毕达哥拉斯–柏拉图传统,他们认为数学或者理念是世界的本质。在近代,伽利略宣称大自然这本书是用数学写成的。因此,哪个学科越能用数学的语言进行描述,哪个学科就越“科学”,也就越不容置疑。

《拆穿数据胡扯》的另外一大重点则是教读者辨别和反抗胡扯。作者认为需要学习才可以绕过“科学”外衣之下数据的迷惑,从而揭穿背后的胡扯本质。同样,他们也列举了不少方法,诸如质疑信息来源、小心不公平的比较、从数量级考虑,等等。

比如2017年年初,特朗普政府制定了一系列限制赴美旅行和移民的政策后,产生多方面影响。当年3月,美国国家广播公司新闻节目在推特上称,“留学生入学申请人数下降了近40%”,这个消息被广为传播,但是两位作者却对“灾难性的”影响产生怀疑,挖掘出消息的源头是来自NBC晚间新闻节目报道,但两者之间意思有明显分歧。再进一步去找报告引用的原始材料后发现,是NBC社交媒体的负责人曲解了原始材料的意思,把“40%的学校收到的申请人数下降”转换成“留学申请人数下降了40%”。

不过,在信息爆炸的互联网时代,作者提出的那些“科学地对抗科学的胡扯”的方法,效果究竟如何,清华大学科学史副教授胡翌霖是持保留意见的。“一方面,顶尖的科学家和顶级科研杂志的编审者们都很难做到火眼金睛,我们这些普通读者只是读了几本科普书,能获得多高的辨识力呢?另一方面,一些辨别胡扯的技巧或许也是双刃剑,例如‘质疑信息来源’中主张要多去追究信源的来路和动机,思考他们要‘兜售’什么。但是如果对‘兜售者”充满怀疑,既可能妨碍谣言的传播,同时也有可能妨碍谣言的澄清。”

至于如何反抗胡扯,两位作者则呼吁要敢于当面指斥,因为这是一种“道义上的责任”。不过考虑到这样做可能会引发令人不悦的后果,他们又强调“一定要把你的时间和精力花在那些愿意参与的人身上”。

胡翌霖说,与作者针对如何辨识胡扯时提出的“多思考,少分享”相比,驳斥胡扯或许才是他们认为真正重要的事情,鼓励大家在辨清胡扯时不要默不作声,而是用得体的方式勇敢地站起来驳斥。毕竟,如两位作者所说的,“很多胡扯会给人类的健康和繁荣、科学的诚实性和决策的民主性带来严重的后果”。

《拆穿数据胡扯:信息驱动世界的生存指南》

[美]卡尔·伯格斯特龙、杰文·韦斯特 著

中信出版集团·鹦鹉螺2022年3月版

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭