Page 68 - 大数据时代新闻传播的创新与实践研究
P. 68
大数据时代新闻传播的创新与实践研究
Research on Innovation and Practice of News Communication in the Era of Big Data
二、新闻分发系统:算法分发及其后果
传统媒体时代,新闻的生产和分发结合的非常紧密,直到新媒体普及之后,
新闻的生产系统才和新闻分发系统分离开来。传统的新闻分发所要实现的目标是
要将合适的内容通过尽可能多的渠道分发给尽可能多的受众。这一目标需要通过
人对传播目标的规划而实现以及人的行动而落实。而在人工智能时代,分发的主
体由人过度为算法,算法决定将什么样的内容通过何种渠道分发给哪些人。然而,
算法并不能完美的复刻算法设计者或者算法使用者的意志,并且算法又可能自设
计之初就带有设计者的偏见。传统分发力的截除以及算法自身的缺陷会导致一系
列后果。
(一)算法黑箱:分发内容未知及其风险
目前的人工智能技术核心在于机器学习,第一代机器学习是监督式学习,第
二代机器学习是无监督式学习。监督式学习是第一代机器学习,指具有固定模板,
通过向其不停的喂养相关的数据,数据量越大,机器就越智能,比如击败了李世
石的 alphago; 无监督式学习指没有固定模板,机器自发地从海量数据中学习,分
析数据并建模,比如 alphago 的增强版 alphazero。对于无监督式的机器学习,算
法进一步走向黑箱化,输入和输出均未知。在这种情形下,新闻分发系统面临以
下风险。
其一,数据做假。由于算法并不能理解因果性,算法的建模分析都是建立在
相关性的基础之上。因此,当算法在获取了大量的数据,发现两个变量之间存在
很强的相关性时,也不能说这两个变量之间存在因果性。如 Jigsaw 公司的传播
总监 Dan Keyserling 所言 , 环保记者通过人工智能发现某地区的四个监控点均呈
现出了石油开采和森林退化之间的相关关系,然而当记者深入调查发现,森林退
化的原因实际上是火灾和伐木。人工智能所采集的数据和输出的结果都是客观的,
但人们在理解这些数据时却可能利用其造假。上述案例好在记者通过调查澄清了
事实,没有让事件的影响扩大化。若机器人自动将这些采集到的数据组合成一篇
稿件,将强相关关系等价于因果。随后新闻分发系统便将这篇稿件发布出去,则
会在事实上造成了假新闻的传播。其根源则在于算法分发系统中的人对其传播内
容的未知。
其二,分发算法的黑箱化。从目前已经公开的算法来看,大多分发算法都有
·56·

