Page 68 - 大数据时代新闻传播的创新与实践研究

P. 68

大数据时代新闻传播的创新与实践研究
Research on Innovation and Practice of News Communication in the Era of Big Data

二、新闻分发系统：算法分发及其后果

传统媒体时代，新闻的生产和分发结合的非常紧密，直到新媒体普及之后，

新闻的生产系统才和新闻分发系统分离开来。传统的新闻分发所要实现的目标是
要将合适的内容通过尽可能多的渠道分发给尽可能多的受众。这一目标需要通过
人对传播目标的规划而实现以及人的行动而落实。而在人工智能时代，分发的主

体由人过度为算法，算法决定将什么样的内容通过何种渠道分发给哪些人。然而，
算法并不能完美的复刻算法设计者或者算法使用者的意志，并且算法又可能自设
计之初就带有设计者的偏见。传统分发力的截除以及算法自身的缺陷会导致一系
列后果。

（一）算法黑箱：分发内容未知及其风险
目前的人工智能技术核心在于机器学习，第一代机器学习是监督式学习，第
二代机器学习是无监督式学习。监督式学习是第一代机器学习，指具有固定模板，

通过向其不停的喂养相关的数据，数据量越大，机器就越智能，比如击败了李世
石的 alphago; 无监督式学习指没有固定模板，机器自发地从海量数据中学习，分
析数据并建模，比如 alphago 的增强版 alphazero。对于无监督式的机器学习，算
法进一步走向黑箱化，输入和输出均未知。在这种情形下，新闻分发系统面临以

下风险。
其一，数据做假。由于算法并不能理解因果性，算法的建模分析都是建立在
相关性的基础之上。因此，当算法在获取了大量的数据，发现两个变量之间存在

很强的相关性时，也不能说这两个变量之间存在因果性。如 Jigsaw 公司的传播
总监 Dan Keyserling 所言 , 环保记者通过人工智能发现某地区的四个监控点均呈
现出了石油开采和森林退化之间的相关关系，然而当记者深入调查发现，森林退
化的原因实际上是火灾和伐木。人工智能所采集的数据和输出的结果都是客观的，

但人们在理解这些数据时却可能利用其造假。上述案例好在记者通过调查澄清了
事实，没有让事件的影响扩大化。若机器人自动将这些采集到的数据组合成一篇
稿件，将强相关关系等价于因果。随后新闻分发系统便将这篇稿件发布出去，则

会在事实上造成了假新闻的传播。其根源则在于算法分发系统中的人对其传播内
容的未知。
其二，分发算法的黑箱化。从目前已经公开的算法来看，大多分发算法都有

·56·

63 64 65 66 67 68 69 70 71 72 73