Page 111 - 起重机械设备安全技术检验及评价
P. 111
第三章 起重机械安全管理
发布越来越容易,产生数据的途径增多,个人甚至成为了数据产生的主体之一,
数据呈爆炸的形式快速增长,新数据不断涌现,快速增长的数据量要求数据处理
的速度也要相应的提升,才能使得大量的数据得到有效的利用,否则不断激增的
数据不但不能为解决问题带来优势,反而成了快速解决问题的负担。同时,数据
不是静止不动的,而是在互联网络中不断流动,且通常这样的数据的价值是随着
时间的推移而迅速降低的,如果数据尚未得到有效的处理,就失去了价值,大量
的数据就没有意义。此外,在许多应用中要求能够实时处理新增的大量数据,比
如有大量在线交互的电子商务应用,就具有很强的时效性,大数据以数据流的形
式产生、快速流动、迅速消失,且数据流量通常不是平稳的,会在某些特定的时
段突然激增,数据的涌现特征明显,而用户对于数据的响应时间通常非常敏感,
心理学实验证实,从用户体验的角度,瞬间(moment,3 秒钟)是可以容忍的最
大极限,对于大数据应用而言,很多情况下都必须要在 1 秒钟或者瞬间内形成结
果,否则处理结果就是过时和无效的,这种情况下,大数据要求快速、持续的实
时处理。对不断激增的海量数据数据的实时处理要求,是大数据与传统海量数据
处理技术的关键差别之一。
(4)数据价值密度低
数据价值密度低是大数据关注的非结构化数据的重要属性。传统的结构化数
据,依据特定的应用,对事物进行了相应的抽象,每一条数据都包含该应用需要
考量的信息,而大数据为了获取事物的全部细节,不对事物进行抽象、归纳等处
理,直接采用原始的数据,保留了数据的原貌,且通常不对数据进行采样,直接
采用全体数据,由于减少了采样和抽象,呈现所有数据和全部细节信息,可以分
析更多的信息,但也引入了大量没有意义的信息,甚至是错误的信息,因此相对
于特定的应用,大数据关注的非结构化数据的价值密度偏低,以当前广泛应用的
监控视频为例,在连续不间断监控过程中,大量的视频数据被存储下来,许多数
据可能是无用,对于某一特定的应用,比如获取犯罪嫌疑人的体貌特征,有效的
视频数据可能仅仅有一两秒,大量不相关的视频信息增加了获取这有效的一两秒
数据的难度。但是大数据的数据密度低是指相对于特定的应用,有效的信息相对
于数据整体是偏少的,信息有效与否也是相对的,对于某些应用是无效的信息对
于另外一些应用则成为最关键的信息,数据的价值也是相对的,有时一条微不足
道的细节数据可能造成巨大的影响,比如网络中的一条几十个字符的微博,就可
103

