Page 111 - 起重机械设备安全技术检验及评价
P. 111

第三章  起重机械安全管理


               发布越来越容易,产生数据的途径增多,个人甚至成为了数据产生的主体之一,
               数据呈爆炸的形式快速增长,新数据不断涌现,快速增长的数据量要求数据处理
               的速度也要相应的提升,才能使得大量的数据得到有效的利用,否则不断激增的

               数据不但不能为解决问题带来优势,反而成了快速解决问题的负担。同时,数据
               不是静止不动的,而是在互联网络中不断流动,且通常这样的数据的价值是随着
               时间的推移而迅速降低的,如果数据尚未得到有效的处理,就失去了价值,大量
               的数据就没有意义。此外,在许多应用中要求能够实时处理新增的大量数据,比

               如有大量在线交互的电子商务应用,就具有很强的时效性,大数据以数据流的形
               式产生、快速流动、迅速消失,且数据流量通常不是平稳的,会在某些特定的时
               段突然激增,数据的涌现特征明显,而用户对于数据的响应时间通常非常敏感,
               心理学实验证实,从用户体验的角度,瞬间(moment,3 秒钟)是可以容忍的最

               大极限,对于大数据应用而言,很多情况下都必须要在 1 秒钟或者瞬间内形成结
               果,否则处理结果就是过时和无效的,这种情况下,大数据要求快速、持续的实
               时处理。对不断激增的海量数据数据的实时处理要求,是大数据与传统海量数据
               处理技术的关键差别之一。

                   (4)数据价值密度低
                   数据价值密度低是大数据关注的非结构化数据的重要属性。传统的结构化数
               据,依据特定的应用,对事物进行了相应的抽象,每一条数据都包含该应用需要
               考量的信息,而大数据为了获取事物的全部细节,不对事物进行抽象、归纳等处

               理,直接采用原始的数据,保留了数据的原貌,且通常不对数据进行采样,直接
               采用全体数据,由于减少了采样和抽象,呈现所有数据和全部细节信息,可以分
               析更多的信息,但也引入了大量没有意义的信息,甚至是错误的信息,因此相对
               于特定的应用,大数据关注的非结构化数据的价值密度偏低,以当前广泛应用的

               监控视频为例,在连续不间断监控过程中,大量的视频数据被存储下来,许多数
               据可能是无用,对于某一特定的应用,比如获取犯罪嫌疑人的体貌特征,有效的
               视频数据可能仅仅有一两秒,大量不相关的视频信息增加了获取这有效的一两秒
               数据的难度。但是大数据的数据密度低是指相对于特定的应用,有效的信息相对

               于数据整体是偏少的,信息有效与否也是相对的,对于某些应用是无效的信息对
               于另外一些应用则成为最关键的信息,数据的价值也是相对的,有时一条微不足
               道的细节数据可能造成巨大的影响,比如网络中的一条几十个字符的微博,就可



                                                                                      103
   106   107   108   109   110   111   112   113   114   115   116