Page 10 - 大数据时代计算机信息处理技术研究
P. 10

大数据时代计算机信息处理技术研究
             Research on Computer Information Processing Technology in the Era of Big Data


                 大数据的数据量庞大、数据类型多样化是数据在处理和计算的方法需要解决
             的重要因素,智能化的处理和分析过程为大数据的使用增加实际价值。大数据的
             复杂性是其核心特征,大数据的应用与场景的构建都基于其复杂性的处理与分析。
                 (二)大数据时代

                 “大数据时代”这一名称是由麦肯锡公司首次界定,在其公开的研究报告中
             系统说明了大数据在商业竞争中的巨大潜力,并逐一分析了大数据使用的具体场
             景。大数据的运用已不仅仅在商业经济中,在研究领域也广泛运用,对信息的处
             理和存储都带来了颠覆性的改变。在当前信息膨胀的背景下,数据表现出来的形

             式多种多样,经济现象可以通过大数据进行量化分析,社会现状通过大数据可以
             实现可视化,隐藏的问题能够更好地得以发现。

                 二、大数据的特点


                 大数据存在的具体五个特征,能够通过 4V+C 来描述,分别是 Volume、
             Variety、Value、Velocity 和 Complexity。
                 Volume 表示大数据规模巨大、数据量多的特性。在描述大数据时,常见
             的 GB 或者 TB 的数据储存单位已经无法再适用,而是通过 PB(1024TB)、

             EB(1024PB)甚至 ZB(1024EB)进行储存。国际互联网数据中心 IDC 预测,
             2020 年全球互联网数据量将达到 35ZB。因此,大数据的特点之一就是数据规模
             庞大。
                 Variety 表示大数据的数据结构多样化,数据类型复杂多变,不但包括常规

             的计算机处理的结构型数据,同时也包括大量的视频、文字、音频以及图片等非
             结构化的数据信息。互联网数据分布具有自身的特点,再加上云计算、物联网等
             技术平台的不断完善,信息数据的来源逐渐向多样化趋势发展,互联网数据来源
             逐渐增多。主要的数据来源有以下几个方面:海量的互联网终端用户在多种互联

             网应用中传递、应用图片、文字、音频、视频等多种类型的数据信息;各种互联
             网设备以及多种信息管理系统在运作过程中产生各种数据库、文件、操作日志、
             审计等等信息数据;近些年兴起的物联网信号采集设备和传感设备,如智能医疗
             设备所产生的各种生命特征数据、天文望远镜产生的大量天文观测相关的信息数

             据等。
                 Value 表示大数据具有价值密度低的特性。因为大数据虽然拥有庞大的数据


             ·2·
   5   6   7   8   9   10   11   12   13   14   15