Page 13 - 大数据时代计算机信息处理技术研究
P. 13
第一章 大数据技术概述
壳运动。”这种广泛性、根本性的变革必然将引起人类生产、交往方式的变革,
社会管理方式、结构的变革,也必将呼吁与之相应的法律制度的变革。
(一)相关的概念界定
英国教授维克托迈尔的《大数据时代》一书深入浅出的讲解,则使得大数据
这一概念广泛被人们所认知,并引发人们对这一信息时代变革性现象的关注。现
在,大数据已经作为最炙手可热的概念之一,成为大众所津津乐道的一种信息获
取与表达的方式,人们几乎可以将生活中的各种事情都与这样的大范围数据加工、
提炼,最终形成有用信息的过程结合起来。但大数据毕竟是一个技术性概念,现
实中的一些提法如局域网联通,其实严格上并不属于大数据的范畴。因此对于被
过于泛化的大数据概念,有必要进行梳理。
“大数据”这个概念早在 1980 年,著名未来学家阿尔文·托夫勒便在《第
三次浪潮》一书中,就将“大数据”热情地赞颂为“第三次浪潮的华彩乐章”。
2001 年,高德纳(Gartner)公司在一份研究报告首次使用了“大数据(Big
Data)”这一概念。大数据是指那些大小已经超出了传统意义上的尺度,一般的
软件工具难以捕捉、存储、管理和分析的数据。但是具体多大的数据才能称之为大,
并没有普遍适用的定义。一般认为,大数据的数量级应该是“太字节”(2×40)的。
由此可见,大数据是强调数据容量的急剧增长,达到了一个与传统数据本质性不
同的级别,这是大数据同传统意义的数据在概念上最大的不同。“据统计,全球
数据量出现爆炸式增长。即使在遭遇金融危机的 2009 年,全球信息量也比 2008
年增长 62%,达到 80 万 PB(1015 字节),2010 年增至 120 万 PB。据 IDC 预测,
至 2020 年全球以电子形式存储的数据量将达 32ZB(1021 字节)。以 120 万 PB
数据为例,如果将其刻录在 DVD 上,再将这些盘片堆叠起来,可从地球到月球
垒一个来回!”这一级别的数据量将是传统数据从统计量上来看根本无法企及的,
这从根本上揭示了大数据同传统数据相比,已经有了完全不同的性质。从数据到
大数据,是巨大的变革。
大数据的来源及其宽泛,这也是为什么可以不再界定大数据的外延——因
为大数据是无所不包的。全球数据量出现爆炸式增长,数据成了当今社会增长最
快的资源之一,几乎人们生活的一切都可以用数据来予以描述,无论是在现实社
会里的地理位置数据,还是网络空间中的浏览痕迹,都可以被量化、被记录、
被数据化。大数据主要来自互联网世界与物理世界,互联网的大数据主要是基于
·5·

