Page 9 - 大数据时代计算机信息处理技术研究
P. 9
第一章 大数据技术概述
第一章 大数据技术概述
第一节 大数据的概念及其特征
一、大数据与大数据时代的内涵
(一)大数据
大数据是由巨大的数据量构成的,运用常规的技术工具不能实现一定时间内
的收集和处理的能力。大数据的技术就是通过计算机技术的运用从大量的数据信
息中提取有价值的部分。
大数据的数据储存单位不再适用以往的吉字节(GB,Gigabyte)十进制的信
息计量单位或太字节(TB,Terabyte)的万亿字节,数据量极大,数据存储量升
级至 PB(1024TB)、EB(1024PB)、ZB(1024EB)。国际数据公司 IDC 在《数
据时代 2025》中预测到 2025 年相比 2016 年的数据量将增加 10 倍。
大数据在处理存储在计算机上的基本结构型数据信息的基础上,还需要处理
庞大的非结构数据信息,比如互联网终端使用者通过基础设施应用传输文字、图
片、实时视频等,通过信息管理系统进行数据的操作进而产生数据库、操作日志
等信息数据,通过远程设备和传感器等记录用户在使用过程中的数据,或者自然
变化需要观测的天文数据。
虽然大数据储存的数据量呈倍数增长,但是对企业或社会是否能够创造信息
和价值需要进一步深入筛选和分析。大数据的价值密度是依托数据集作为基数,
虽然价值较低,但是低的价值密度不能否认数据中存在的价值,需要通过精密的
算法精加工,将处理后的数据运用到决策过程中。
数据信息的计算效率是大数据广泛运用的核心要素。外部环境的快速变化,数
据信息每时每刻都在产生,对有效信息的快速传输和处理提出高要求,大数据时代
相较传统的数据处理速度和有效性大幅上升,为数据的运用和分析提供重要的支撑。
·1·

