Page 27 - 大数据时代计算机信息处理技术研究
P. 27
第一章 大数据技术概述
定理和定律,希望一窥大数据的“真容”。
二、大数据时代的机遇和挑战
(一)大数据时代的机遇
大数据技术改变了数据发掘方式和数据应用方式,很多新兴产业的发展都依
赖大数据技术。大数据时代为信息安全、云计算、物联网等新兴技术提供了发展
环境。大数据技术对信息安全的高度要求,加快了信息安全产业的发展,计算机
信息处理技术保障能力重新回到大众的视野。
(二)大数据时代的挑战
大数据时代提高了数据挖掘的要求。数据收集必须全面、可信;数据存储必
须廉价、可靠;数据处理必须准确、快速。大数据已经被各行各业视为宝贵财富,
无数的企业持续关注着大数据的无限潜力,这种情况导致计算机信息安全时时刻
刻受到威胁。部分黑客开始故意攻击存储了大量信息的数据库,非法泄露用户数
据。由于我国尚未形成有关大数据的完备立法,数据信息的所有权和使用权界定
不明,而且个人数据一般都涉及个人隐私,无法使用单一法律解决违法犯罪问题。
大数据是海量、多种、复杂数据的集合,为大数据提供安全保护必须采取特殊的
防护手段和预防措施。具有优越性特点的数据技术逐渐成为黑客们争相进攻的目
标,这显著提高了信息安全防护的难度。大数据技术是一种新兴技术,发展大数
据技术必须培养新的专业人才。任何行业培养人才都需要一定周期,大数据人才
的培养速度已经严重落后于大数据技术的发展速度。中国大数据应用面临巨大的
创新人才缺口。
三、大数据时代下的计算机信息处理技术
(一)DEEPWEB 数据感知与获取技术
DEEPWEB 技术主要用于构建深层网络空间,其特点是信息规模大、信息变
化快、访问方式特殊。DEEPWEB 技术充分挖掘数据价值,对数据进行抽取和整
合,最终产出高质量数据集合。
(二)分布式数据存储
分布式数据存储技术由谷歌公司的 GFS 技术实现,在百度、IBM 等公司广
泛应用。分布式存储技术使用列形式存储数据。列存储相比行存储,数据压缩程
·19·

