Page 110 - 起重机械设备安全技术检验及评价
P. 110

Safety Technical inspection and Evaluation of Lifting Machinery and Equipment
             起重机械设备安全技术检验及评价


             样数据的的趋势。使用所有的数据可以带来更高的精确性,从更多的细节来解释
             事物属性,同时必然使得要处理数据量显著增多。
                  (2)数据类型多样

                  数据类型繁多,复杂多变是大数据的重要特性。以往的数据尽管数量庞大,
             但通常是事先定义好的结构化数据。结构化数据是将事物向便于人类和计算机存
             储、处理、查询的方向抽象的结果,结构化在抽象的过程中,忽略一些在特定的
             应用下可以不考虑的细节,抽取了有用的信息。处理此类结构化数据,只需事先

             分析好数据的意义以数据间的相关属性,构造表结构来表示数据的属性,数据都
             以表格的形式保存在数据库中,数据格式统一,以后不管再产生多少数据,只需
             根据其属性,将数据存储在合适的位置,就可以方便的处理、查询,一般不需要
             为新增的数据显著的更改数据聚集、处理、查询方法,限制数据处理能力的只是

             运算速度和存储空间。这种关注结构化信息,强调大众化、标准化的属性使得处
             理传统数据的复杂程度一般呈线性增长,新增的数据可以通过常规的技术手段处
             理。而随着互联网络与传感器的飞速发展,非结构化数据大量涌现,非结构化数
             据没有统一的结构属性,难以用表结构来表示,在记录数据数值的同时还需要存

             储数据的结构,增加了数据存储、处理的难度。而时下在网络上流动着的数据大
             部分是非结构化数据,人们上网不只是看看新闻,发送文字邮件,还会上传下载
             照片、视频、发送微博等非结构化数据,同时,遍及工作、生活中各个角落的传
             感器也时刻不断的产生各种半结构化、非结构化数据,这些结构复杂,种类多样,

             同时规模又很大的半结构化、非结构化数据逐渐成为主流数据。如上所述,非结
             构化数据量已占到数据总量的 75% 以上,且非结构化数据的增长速度比结构化
             数据快 10 倍到 50 倍。在数据激增的同时,新的数据类型层出不穷,已经很难用
             一种或几种规定的模式来表征日趋复杂、多样的数据形式,这样的数据已经不能

             用传统的数据库表格来整齐的排列、表示。大数据正是在这样的背景下产生的,
             大数据与传统数据处理最大的不同就是重点关注非结构化信息,大数据关注包含
             大量细节信息的非结构化数据,强调小众化,体验化的特性使得传统的数据处理
             方式面临巨大的挑战。

                  (3)数据处理速度快
                  要求数据的快速处理,是大数据区别于传统海量数据处理的重要特性之一。
             随着各种传感器和互联网络等信息获取、传播技术的飞速发展普及,数据的产生、



             102
   105   106   107   108   109   110   111   112   113   114   115