Page 79 - 大数据时代新闻传播的创新与实践研究
P. 79
第三章 大数据时代传统新闻生产的变革
第三章 大数据时代传统新闻生产的变革
第一节 大数据对传统新闻生产的挑战
一、概念的界定
(一)大数据
如今,新闻传播学界和业界对于大数据这一概念还没有一个完全统一的定义。
在世界范围内最早提出“大数据”这一名词的是全球知名咨询公司麦肯锡,其在
2011 年发布的《大数据:创新、竞争和生产力的下一个前沿领域》报告中声称:
“大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据
集。”:而在舍恩伯格的《大数据时代》一书中,其认为“最初,大数据这个概
念是指需要处理的信息量过大,已经超出了一般电脑处理数据时使用的内存量。”
通过对以上关于大数据概念的分析我们不难看出,所谓的大数据,顾名思义,
主要指的是一种海量的数据,这种海量的数据超过了我们目前常规计算机所能存
储和承受的范围。而本文当中所讲的大数据,其不仅仅包括传统意义上海量的数
据集,其还包括了基于这些大数据的相关技术,包括海量数据的收集、分析加工
等等。
为了更好的了解大数据,我们首先应该明确的是大数据的特点。目前,学界
和业界比较认可的说法是由 IBM 公司提出的,它们认为大数据总体上一共有四
大特点,也称“4V”,即 : 第一,数量大(Volume),这主要指的是大数据需
要收集和分析的数据量非常的大,已经成原来的 TB 级别,上升到了 PB 级别;
第二是类型多样化(Variety),这主要指的是数据来源的多样化,数据的种类和
格式十分丰富;第三,是速度快(Velocity),这主要指的是大数据技术需要实
时快速的对数据进行分析和收集,比传统的数据收集速度更快。第四,准确性高
(Veracity),这主要是指通过大数据收集到的信息都是十分真实和客观的,是
·67·

