中心动态

仪器分类


大夏传播讲坛第九期|祝建华:新闻推荐系统中的科学、技术和伦理之争

2018-12-24

12月19日下午,大夏传播讲坛第九期在传播学院405教室举行。本期讲坛邀请了香港城市大学媒体与传播系及数据科学学院祝建华教授,围绕“新闻推荐系统中的科学、技术和伦理之争”主题做了学术报告。传播学院副院长陈虹教授出席并主持此次讲坛,武志勇教授,赵路平副教授、林哲元副教授、陆鹏程副教授以及传播学院在读本硕博各年级同学参加并聆听报告。


陈虹教授主持本期讲坛

祝建华教授分享“新闻推荐系统中的算法”


新闻推荐的原理、起源及三派之争


讲座伊始,祝建华教授首先指出,当前机器学习/人工智能在新闻传播中的主要应用集中在新闻采集、新闻制作和新闻发布三大环节。新闻推荐系统,作为机器学习在新闻发布环节的应用之一,具有三个鲜明特点:(1)新闻推荐系统与用户的距离最近,是各类技术与用户之间的界面;(2)新闻推荐系统使用非常广泛,大约有百分之八九十的新闻媒体、平台都在不同程度地使用推荐系统;(3)新闻推荐系统与用户的接近性和使用的广泛性,也使之备受关注和争议。

随后,祝建华教授用通俗易懂的方式,为同学们简要介绍了推荐算法技术。“推荐,实际上就是个‘排序’问题。”他认为,推荐算法技术在对新闻进行“排序”时,通常考虑三种因素,即 总体热度(Global popularity)、用户个人偏好(User preference)以及好友圈协同过滤(Collaborative filtering)。由此,可以得出新闻推荐的基本模式是R=w_1GP+w_2UP+w_3CF。不同的新闻媒体或平台,通过对这三种因素设置不同权重,形成各自的新闻推荐。祝建华教授进一步解释道,当用户首次使用时,我们称之为冷启动(cold start),此时的新闻推荐主要基于总体热度(GP)。一旦有个性化的“点击”之后,便会给用户个人偏好(UP)赋予较高的数值。如果用户将自己的通讯录等信息授权给媒体平台,那么在新闻推荐时,便引入了好友圈协同过滤(CF)。但是,通常而言,媒体平台能够收集到用户好友圈的信息少之又少,大部分的新闻推荐是GP与 UP 的结合,并根据用户对每次推荐的采纳而不断更新调整。

谈到新闻推荐算法的来源,祝建华教授表示,推荐技术主要经历了四个阶段:最早可以追溯到搜索引擎,通过输入关键词,推荐网页。第二阶段是电子商务,根据产品与产品间的相似性、朋友也购买的产品等,进行产品推荐。第三阶段是社交网站的好友推荐,通过算法推荐用户可能认识的人、有共同兴趣的人等。第四阶段便是在线媒体的新闻推荐,新闻推荐是在产品推荐、好友推荐发展较为成熟的基础上开始应用的。

随着推荐技术应用范围的不断扩大,也引发了关于新闻推荐系统的争论,主要有三种声音:技术派、道德派和科学派。祝建华教授指出,技术派,主要是做推荐系统、新媒体业内人士,他们认为推荐是个“好东西”。站在技术派的角度来讲,新闻推荐系统提高了效率,提供了个性化服务,帮助用户应对信息过载,也有利于用户之间的交流互动。道德派认为,推荐是个“坏东西”。算法决定内容,使用户接触的新闻种类日益狭隘,造成“信息茧房”,甚至导致社会两极化。而科学派认为,推荐是个前所未有的“新东西”,需要通过进一步实证、检验和评估。

如何理清这团乱麻?

近年来,关于新闻推荐系统的研究不少,但由于方法、数据上的缺陷,对于推荐系统的效果是正、还是负,是强、还是弱,结论往往相互矛盾。那么,如何才能理清这团乱麻?祝建华教授提出了四种探讨这一问题的角度:提倡实验精神、改进评估方法、基于历史考察以及另寻理论框架。

祝建华教授认为,科学精神的核心是实验精神。实验容许犯错,实验结果需要全面、客观、准确地评估,同时,实验需要足够时间走完整个过程。为便于同学们理解,祝建华教授还以药品实验流程为例进行对比说明,药品实验需要经过动物实验、病人实验和健康人实验三个阶段检验药品的有效性和副作用。药品实验尚且需要近十年的时间才能得出确切结论,更何况新闻推荐系统研究与之相比要复杂得多,需要更长时间的观察与研究。

在现有新闻推荐系统的研究中,祝建华教授也指出了在研究方法上存在的问题:(1)缺乏控制干扰变量:或许由用户的选择性接触造成,与推荐算法并无关系。(2)样本偏向活跃用户:大约80%的点击率是由20%的活跃用户所贡献的,而活跃用户又最有态度和立场,更容易分化、极端。(3)观察时间太短:无法过滤初始好奇、久而厌倦等用户体验因素,深入细致研究新闻推荐系统的性质需要多年时间。(4)研究内容偏于政治领域:娱乐、消费、健康等领域同样值得关注。

祝建华教授还从历史维度进行了相关考察和分析。他表示,社会极化或社会撕裂现象,在历史上早已有之,同时也已被博客、微博、Facebook、Twitter、Snapchat等反复验证。譬如,Adamic等学者分析了美国民主党与共和党在博客中的政治对立;Conover等学者分析了在twitter上的社会极化现象。此外,祝建华教授还以1954年—1994年美国民意为例,分析得出随着时间的推移,民众关心议题也日益多元化。就极化和多元问题,祝建华教授指出,这也许只是文字游戏。不同学者采用不同性质的词汇描述同样的现象,从正面解读就是多元,倒过来,从负面解读就是极化。

“影响受众观看新闻最为重要的两个要素,是其‘重要性’与‘离奇性’。”祝建华教授认为,事件影响的人数越多,重要性越大;事件发生的概率越低,离奇性就越高。将这两个指标交叉,我们可以发现,重要性和离奇性均较高的就是头条新闻,而此类重大新闻容易引起争议,导致意见两极化(polarization);奇异性高而重要性低的就是花边新闻,正如尼尔•波兹曼在《娱乐至死》所提到,大量的娱乐新闻容易导致趣味琐碎化(trivialization)。

讲座结尾,祝建华教授总结道,新闻推荐是否有效,我们尚不清楚,新闻推荐是否有害,我们更不清楚。但是可以确认的是,信息茧房历来存在,源于用户的选择性接触,未必导致社会极化,更可能助长兴趣琐碎化;社会极化也早已有之,源于社会深层矛盾,主要发生在精英阶层和利益相关群体。

传播学院同学向祝建华教授提问


在交流互动环节,在座同学们就“除新闻推荐系统外还可使用的技术手段”、“‘多元’到‘极化’的转变原因”以及“算法新闻的其他研究方向”等问题与祝建华教授进行了深入探讨与交流。直至讲座结束,同学们仍然意犹未尽。

最后,祝建华教授与在场师生合影留念。祝建华教授的精彩讲座,令同学们为收获颇丰、受益匪浅,也为今年大夏传播讲坛画上了圆满的句号。

祝建华教授同传播学院师生合影留念



大夏传播讲坛,是传播学院的品牌学术活动。通过不定期邀请海内外知名专家、学者以讲座形式与师生进行交流互动,旨在介绍和展示新闻传播学研究的理论前沿和行业动态,提升和促进传播学院学生学术视野和科研氛围。欢迎各院系师生踊跃参与!

文|李皓青图|曾文新