Page 27 - 大数据时代计算机信息处理技术研究
P. 27

第一章  大数据技术概述




              定理和定律,希望一窥大数据的“真容”。

                  二、大数据时代的机遇和挑战

                  (一)大数据时代的机遇

                  大数据技术改变了数据发掘方式和数据应用方式,很多新兴产业的发展都依
              赖大数据技术。大数据时代为信息安全、云计算、物联网等新兴技术提供了发展
              环境。大数据技术对信息安全的高度要求,加快了信息安全产业的发展,计算机
              信息处理技术保障能力重新回到大众的视野。

                  (二)大数据时代的挑战
                  大数据时代提高了数据挖掘的要求。数据收集必须全面、可信;数据存储必
              须廉价、可靠;数据处理必须准确、快速。大数据已经被各行各业视为宝贵财富,
              无数的企业持续关注着大数据的无限潜力,这种情况导致计算机信息安全时时刻

              刻受到威胁。部分黑客开始故意攻击存储了大量信息的数据库,非法泄露用户数
              据。由于我国尚未形成有关大数据的完备立法,数据信息的所有权和使用权界定
              不明,而且个人数据一般都涉及个人隐私,无法使用单一法律解决违法犯罪问题。
              大数据是海量、多种、复杂数据的集合,为大数据提供安全保护必须采取特殊的

              防护手段和预防措施。具有优越性特点的数据技术逐渐成为黑客们争相进攻的目
              标,这显著提高了信息安全防护的难度。大数据技术是一种新兴技术,发展大数
              据技术必须培养新的专业人才。任何行业培养人才都需要一定周期,大数据人才
              的培养速度已经严重落后于大数据技术的发展速度。中国大数据应用面临巨大的

              创新人才缺口。

                  三、大数据时代下的计算机信息处理技术

                  (一)DEEPWEB 数据感知与获取技术

                  DEEPWEB 技术主要用于构建深层网络空间,其特点是信息规模大、信息变
              化快、访问方式特殊。DEEPWEB 技术充分挖掘数据价值,对数据进行抽取和整
              合,最终产出高质量数据集合。
                  (二)分布式数据存储

                  分布式数据存储技术由谷歌公司的 GFS 技术实现,在百度、IBM 等公司广
              泛应用。分布式存储技术使用列形式存储数据。列存储相比行存储,数据压缩程


                                                                                   ·19·
   22   23   24   25   26   27   28   29   30   31   32