【百佳讲坛】将匠心注入机器算法

第一财经科技刘佳2017-01-11 20:04

评论0

在新闻资讯领域,人工编辑和机器算法究竟谁更重要?

对于这个问题,今日头条创始人张一鸣毫不犹豫地选择了后者。他在最近接受采访时再次强调了今日头条不设总编辑以及算法没有价值观。在他看来,今日头条不是一家媒体公司,而是一家科技公司,如果头条有主编,他不可避免会按照自己的喜好去选择内容,而头条做的就是不选择。。

豌豆荚联合创始人、轻芒联合创始人王俊煜却在知乎上呛声:“技术是有价值观的,取决于你想用来做什么;面对现实不意味着沉沦于现实之中; 普通人今天也不仅仅需要娱乐,他们除了娱乐以外,也还需要更多。

今日头条的竞争对手一点资讯,则是挖来了互联网新闻的教父陈彤。用陈彤自己的话说,未来要在算法的基础上加入新闻理念和情怀。

而总编辑陈朝华刚刚离职的搜狐,以及腾讯、网易都想要“人工+机器”两者兼得。按照搜狐的说法,搜狐对新闻内容展示方式进行了调整,采用“编辑流+推荐流”的模式。但两者究竟怎么结合,目前外界还没看到一条清晰的路径。

 

事实上,如果把这几件事联系起来看,背后其实是同一个问题:在新闻资讯领域,如何处理人工编辑和机器算法之间的微妙关系?

十几年前门户崛起时,有匠心的编辑和有经验的内容团队无疑最重要。陈彤曾用一本《新浪之道》解构网络新闻运作,其中举例道,在“9.11”恐怖袭击发生时,新浪网编辑在事件发生之际捕捉到最早的信息,事件发生9分钟后发布了第一条新闻,并且将这条快讯放置在新浪首页和新闻中心首页重要位置,。这是中国大众传媒对“9.11事件”发出的第一条报道。

而现在的信息碎片化时代下,连门户自己都已经被称作“传统媒体”,甚至连接 wifi 的 app、手机垃圾清理工具都塞满"新闻"。伴随着新闻热点的多元化,海量的新闻内容来满足读者对资讯的阅读需求,如果继续单纯依赖人工编辑,受到内容数目的限制,内容分发效率确实不高,而且,人工编辑往往集中于最热门的头部内容,往往“千人一面”,更长尾的内容则很难再有精力覆盖。

机器算法正好擅长这些难题,一方面,它通过采集海量的信息,然后通过数据挖掘,智能分析出每时每刻最热门最值得用户关注的资讯;另一方面,推荐引擎会根据用户对用户浏览、收藏、转发、评论新闻资讯的行为不断进行分析,再结合其阅读喜好、习惯、阅读时间、阅读位置等多个维度,建立起个人用户模型,两者结合后,智能地为用户推荐越来越精准的个性化信息。当你使用次数越多,针对你的个性化资讯推荐就变得越准确。

简单来说,就是把搜索与推荐的技术优势最大化地嫁接在新闻客户端上,通过上亿级别的因素组合来挖掘、分析数据,寻找各种规律间的联系,分析用户兴趣并推送其所需信息。

因此,在张一鸣眼里,今日头条不是做新闻,而是做信息的获取,做法思路和过去完全不一样,现在完全是从满足用户需求的角度,而不是取决于主编的才华。

可以看到的是,基于海量数据的机器学习算法无疑令分发效率显著提高。但与此同时,算法提供的内容对用户的价值是否也有相应的提升?

特别是,如果一味依赖话题数据指标和话题相关性的算法分发,由于读者猎奇心或是出于心理最微妙的兴趣使然,追求槽点和趣点的声音占据了大多数,这就让信息趋于片面。舆论“狂欢”的背后,随之而来的可能就是标题党、涉黄新闻、无营养的鸡汤文大、耸人听闻的低劣内容等大行其道。

 

举个简单的例子,出于当你在头条点击一条“原配暴打小三”或是某类犯罪新闻,系统根据你的浏览记录,每天自动为你源源不断地推送相似单一的内容。而这正是因为“聪明的算法”。

这也是外界对于头条类个性化推荐新闻App的批评之一:你不能用算法一味迎合读者的低级趣味。

正如凤凰网CEO刘爽所言,“海量读者因为非常耸动的标题被吸引过去,看了以后立刻走人,虽然他个人的体验很不愉快,但他点击这个行为留下来了,被算法捕捉到,所以形成了恶性循环,越多的人被吸引,它也会给这个新闻更多的权重,所以会推荐开去,这严重影响了阅读的体验。”

除了可能把大众阅读的口味引向低俗化,另一个可能随之而来的问题还有,如果一味迎合用户兴趣,“千人千面”的个性化浪潮是否会形成信息孤岛,从而挤压掉他们真正感兴趣或者培养新兴趣话题的生存空间,他们感知新事物的机会越来越少。?

美国芝加哥大学教授凯斯•桑斯坦曾在《网络共和国》讨论过类似的情形:为每个读者量身定制的“个人日报”式的信息选择行为,会导致网络茧房的形成。当个人长期禁锢在自己所建构的信息茧房中,久而久之,个人生活呈现出一种定式化、程序化。长期处于过度的自主选择,沉浸在个人日报的满足中,失去了解不同事物的能力和接触机会,不知不觉间为自己制造了一个“信息茧房”。

而且,至少目前来看,机器的算法还不是万能的。

此前,Facebook曾把其推荐最热内容的“趋势话题(Trending Topic)”撤掉人工编辑,改为全部机器算法执行, 希望由此降低主观因素对推荐内容的影响,结果不过还不到 3 天,完全依靠演算法筛选热门新闻的趋势话题,让一则关于美国大众新闻主播梅根•凯利(Megyn Kelly)的假新闻登上版面,更导致一张普利策获奖照片被算法认定是情色图片直接删除而成功激起民愤。

对于人工编辑而言,要想避免这些错误非常容易,但 Facebook 筛选趋势话题的演算法依赖于这一话题相关文章和贴文数量,相对来说较容易让假消息、骗点击标题的新闻登上版面。

从趋势来看,未来算法技术必定走向人工智能化,依靠它们能够解决的事情包括对用户画像、洞察的判断……但在技术背后,如何注入人文情怀?至少优秀内容人的直觉、经验和匠心仍然不能被替代。

编辑:彭海斌

评论

关闭广告