Page 9 - 大数据时代信息安全及保护
P. 9
第一章 绪论
第一章 绪论
第一节 大数据概述
一、大数据的概念
(一)大数据的概念
1.大数据的定义
目前,虽然大数据的重要性得到了大家的一致认同,但是关于大数据的定义
却众说纷纭。大数据是一个抽象的概念,除去数据量庞大,大数据还有一些其他
的特征,这些特征决定了大数据与“海量数据”和“非常大的数据”这些概念之
间的不同。一般意义上,大数据是指无法在有限时间内用传统IT技术和软硬件工
具对其进行感知、获取、管理、处理和服务的数据集合。科技企业、研究学者、
数据分析师和技术顾问们,由于各自的关注点不同,对于大数据有着不同的定
义。通过以下定义,或许可以帮助我们更好地理解大数据在社会、经济和技术等
方面的深刻内涵。
2010年Apache Hadoop组织将大数据定义为,“普通的计算机软件无法在可
接受的时间范围内捕捉、管理、处理的规模庞大的数据集”。在此定义的基础
上,2011年5月,全球著名咨询机构麦肯锡公司发布了名为“大数据:下一个创
新、竞争和生产力的前沿”的报告,在报告中对大数据的定义进行了扩充。大数
据是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据
集。该定义有两方面内涵:①符合大数据标准的数据集大小是变化的,会随着
时间推移、技术进步而增长;②不同部门符合大数据标准的数据集大小会存在差
别。目前,大数据的一般范围是从几个TB到数个PB(数千TB)。根据麦肯锡的
定义可以看出,数据集的大小并不是大数据的唯一标准,数据规模不断增长,以
及无法依靠传统的数据库技术进行管理,也是大数据的两个重要特征。
大数据价值链可分为4个阶段:数据生成、数据采集、数据储存以及数据分
析。数据分析是大数据价值链的最后也是最重要的阶段,是大数据价值的实现,
·1·

