首页 > 新闻 > 评论

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

算法监管:管什么、管多紧、怎么管

第一财经 2022-07-07 13:02:25 听新闻

作者:刘鹏    责编:任绍敏

这是一场碳基生命与硅基生命的博弈。

几周前参加的一场研讨会,嘉宾与以往那些“峰会”大不相同:有法律专家,有经济学者,有互联网码畜(我),也有行业协会的朋友。这种白龙庙英雄小聚义般的氛围,缘自当天的有趣话题:算法推荐与个人信息保护。这次会议围绕《个性化广告合规发展白皮书》的发布展开,该报告由《财经》商业治理研究院与中国社科院大学互联网法治研究中心联合发布,各路专家们碰撞出了很多有趣而深入的观点,我试着从个人视角聊一聊。

算法推荐的规范、个人信息的保护,我们统一简称为“算法监管”,是近几年互联网最被关注的热点之一。然而,每个人都在谈,却没人真正知道怎么搞,每个人都认为别人在搞,所以声明自己也在搞。这种热烈而迷茫的局面因何而起?我们恐怕得站高一点,才能看明白。

迄今,人类社会经历了两次演化进程上的重大变化。上一次是认知革命:因为有了认知虚拟概念的能力,人类可以组织大规模协作,从而摆脱了缓慢自然选择的限制,以知识的形式传承和进化解决问题的方法。今天,我们正在亲历另一次重大转变,即算法革命:方法的探索与进化,已经可以通过算法建模的方式,在须臾之间超越人类数千年的社会积累。所以,AlphaGo才可以从懵懂的状态开始,在数小时内训练出战胜围棋世界大赛八冠王柯洁的程序。

关于算法监管的种种热议与困惑,其实都根植于此:如何用人类决策时代建立起的管理体系,来规范和约束算法决策?如果没有范式上的升级,这件事如同让黑猩猩指挥人类战争一样,必然是南辕北辙。说得时髦点,这是一场碳基生命与硅基生命的博弈。听到这儿有读者要蹦起来了:算法是人设计的,算什么生命?殊不知,此问已经蕴含了算法监管中的一大困惑,咱们一会再说。

从这个角度理解,对算法监管中的一些问题,我们就要回到更根本的视角重新思考,这个更根本的视角主要涉及算法监管“管什么”“管多紧”“怎么管”几个方面。

算法监管该管什么

我有一个根本诘问:到底怎样才算侵犯隐私?我的意思,并不是这条信息算隐私,而那条不算,而是说我们判断这个问题的时候,根本的标准是什么?“使用”与“侵犯”的边界又在哪里?

举个例子,你把自己的照片加载到PhotoShop,点了一键美颜,然后得到一张“明星化”的照片,高高兴兴放到简历上去了。在这个过程里,有一段算法程序(美颜)得到了你的个人数据(照片),并且产出了服务于你的新数据(明星化照片),这个过程算侵犯你的个人隐私么?

这里的关键问题,在于把算法看成是有生命的,还是无生命的。如果是后者,那就与一台你操纵的缝纫机无异,缝纫机侵犯人的隐私,那是有点行为艺术的说法。而根据目前我们对于算法的普遍认识,将其视为具备自主意识的生命体,恐怕比较牵强。所以,算法用了你的信息,跟某个人看了你的信息,两者有本质不同。

当然,现在的算法多运转于云端,这无疑加重了“对面的机器是人是鬼”的疑虑。然而问题本质没变。为了避免“隐私保护”这个概念无限泛化,以便追寻切实可行的监管方案,个人认为这一概念的认定,应该遵循如下原则:在用户同意的前提下,将其个人信息提供给算法予以加工,并将得到的结果服务于其本人的产品体验,不应当视为侵犯隐私。

其实,我们今天监管的总体方向,跟这个也是吻合的。在现有法规下,用户可以通过“Opt out”的方式关闭系统对自己数据的记录和访问权。而如果用户对此并不介意,那么对面那个机器人,其实并不能把你怎么着。当然,如果平台把你的用户信息提供给了其他合作者,就违反了上面的原则,自然是要被严格监管。

可能有人会抬出魏则西事件来讨论,这难道不是用户信息滥用的后果么?咱可得擦亮眼睛,此事的根本在于广告客户的资质与品控问题:就算是一点个性化也没有,可是广告库里全是莆田系和老军医,这种悲剧会少得了么?

在上述原则下,到底哪些该管、那些不该管,是需要好好斟酌的。如果只要是机器用你的数据就算侵犯隐私,那所谓监管,其实是无从下嘴的。

算法监管该管多紧

讨论起算法监管时,有些学者,总是脖子冲南脸冲北,似乎这事往死里整就行了。作为一名互联网码畜,我觉得此事还要仔细斟酌,不要矫枉过正。因为,算法监管在保护用户权益的同时,也会带来高昂的社会成本。

利用用户个人信息的的功能,对于今天的数字产品已经不是锦上添花的能力,而是整个互联网的基石。为什么这么说,我们来说几个个性化创造的关键用户价值:

一是使用的便捷性。使用个人信息的首要受益者,是用户本人。比方说,你在家里大屏上爱奇艺的片子看了一半,到地铁上打开手机自动就接上了;把这个场景变得智能一点,很多浏览器都会预测你要看的下一个网页,预先加载出来免得转圈等。这些功能极大地方便了用户,也不可避免要用到个性化。

二是内容的独特性。就拿人人都在刷的短视频来说,肯定有人对算法用他的数据做推荐不爽;可是如果内容变得千篇一律,恐怕更多用户会不满意。正是有了个性化的内容推送能力,才让互联网变得丰富多彩。

三是商业的可归因性。正是由于互联网上的用户点击链路可以追溯,商家才能精准地归因客户,甚至能够通过数据反馈反向驱动产品设计生产。这带来了万亿级的数字广告市场,也拉动了后面规模更大的产业。

可以说,数字产业的核心能力,就是个性化能力,其总体社会影响功远大于过。当然,个性化也带来了隐私顾虑、信息茧房等问题,但那是前进中的坎坷,并不是社会的倒退。

所以,算法决策虽然是新事物,却并非洪水猛兽,监管也要像大禹治水一样,宜疏不宜堵。如果抡起大棒乱打一气,把数字产业全都阉割了,用户也没尝到啥甜头。

算法监管该怎么管

既然要管,先要认清算法决策与人类决策有何根本不同。

我们来比较一下小孩子学围棋与AlphaGo有何不同。小孩子送到围棋班,老师教他定式、收官、手筋,然后通过实战熟习这些“基础知识”,提高水平;可AlphaGo不是如此,他全然不懂什么定式手筋,只是在规则确定的“地多者胜”目标下,建立起一个庞大的神经网络,靠着弹指之间左右互博成千上万次的蛮力,在“什么都不懂”的状态下炼成绝世高手。

所以,碳基的人类决策,是先建立一个个知识点,然后把它们综合起来做判断;而硅基的算法决策,是个快速演进的巨大黑盒,对它来说最重要的就是目标函数,而像定式、手筋这样的中间态特征,连AlphaGo的工程师都不知道到底发生了啥。一言以蔽之:人类决策是自下而上的知识驱动,算法决策是自上而下的目标驱动。

这么看来,如今出台的很多规范和条例,多数还是在以管理人类决策的方式监管算法决策。举个例子:前些日子,有部门要求美团提供在确定订单应该多长时间送到用户手中时,都用了哪些参数,又是怎么计算的。这事就有点没管到点子上。

对美团来说,外卖的调度过程,十有八九是神经网络在决策,原理和AlphaGo差不多。订单多长时间送到,好比下棋用的某个定式。它可能只是神经网络训练得到的一组参数,并非预先的人为设定,更不是固定的规则。没准明天模型一更新,就全变了。

在算法决策“目标第一性”原理下,真正该管的是算法的“目标函数”。对美团而言,是在优化用户的平均等待时间?还是骑手的平均收入?还是平台的总利润?如果目标函数是平台利润,那再怎么监管那些具体的特征参数,都无济于事。你把这儿按住了,庞大的神经网络绕个弯,还是能达到同样的目标。

这也是我在研讨会上提到的核心观点:监管算法,一定要找到有效了解其目标函数,并且合法地在目标函数上直接动刀子的方式,才有可能有用。如果就是头痛医头,脚痛医脚,这个不许干,那个改一改,到头来除了留下一大堆法规和条例,怕是没什么用。

简单总结两点:首先,绝不能拿监管算法当个人类精英或组织来管,必须要搞清它的根本规律,才有可能不流于形式。其次,算法决策不是数字时代的撒旦,它也有天使的一面。想回到没有算法决策的时代,是不可能了。只有平衡好产品体验、产业发展与用户隐私,在遵循数字经济规律的基础上,才能管到产业和用户双赢的点上。

另外,从国际竞争来看,个性化广告与推荐是国际数字经济竞争很重要的核心领域,我们要正视其作用甚至积极布局。中国互联网企业能够自立,甚至走出国门展现竞争力,也是因为个性化与算法决策能力有了质变。从这个角度看,隐私保护照着欧盟的GDPR(通用数据保护条例)来,仍然值得商榷。欧盟的现状是,自己没有网络服务的主导权,还不如卡严点,多罚点。

(作者系数据分析专家、《计算广告》作者)

举报

文章作者

一财最热
点击关闭