Page 108 - 特种设备检验检测技术研究
P. 108
特种设备检验检测技术研究
Research on Inspection and Testing Technology for Special Equipment
一的编码格式和展示形式,也可以进行较好的数据交换和传输。
3. 手动录入及转换方式
对于纸质的生产日志、维保记录、使用记录等和现场工作图片、音视频等信
息,则是一种非结构化数据,需要人工录入,通过计算机识别转换为可识别格式
的数据,再进行编码和传输处理。
4. 物联网数据
对于维保单位和制造单位,通过电梯物联网监测手段,实现对电梯的运行状
态和故障信息进行检测,检测的数据也是通过固定的格式传输至制造及维保单位
的数据库平台,这些数据实时性较强,结构化较好。
(五)电梯制造、维保、检验、使用的数据处理和分析
1. 数据处理
在利用大数据进行数据分析的过程中,会出现很多不符合要求的数据,例如
重复录入、错误录入、部分信息缺失以及异常数据等。数据预处理主要是将原始
输入数据中的无关数据进行删除,包括一些重复数据和平滑噪声数据等,同时筛
选掉与后期数据建模无关的无效数据,以及处理原始输入数据中的缺失值和异常
值等。这里主要采用 Python 进行数据预处理。
缺失值处理。在数据预处理过程中,往往会碰到电梯制造、维保、检验、评
估数据的缺失问题。缺失值是数据预处理阶段比较常见的问题。在进行数据分析
前,需要了解数据的缺失情况,需要根据具体的实际情况来处理缺失值。例如,
在电梯基础数据中电梯的地理信息会存在很大的缺失值,一般是利用地图软件的
API 提供的地理 / 逆地理编码功能,补全和完善相关信息。
重复值处理。在数据的采集过程中,由于数据来源多样化,录入和数据的整
合可能产生重复数据,采用删除处理。例如,在电梯基础数据录入和传输后,因
中文字符编码的问题,出现某某电梯(中国)有限公司,受半角和全角等影响,
呈现出数据的不同,需要进行统一化处理。
异常值处理。在数据预处理过程中,数据中有时会出现一个或几个数值与其
他数值的差异比较大,称之为异常值,会对后期的数据模型造成干扰,导致建模
结果差异较大,需要根据实际情况来判断删除或用其他值替换。例如,电梯速度
明显大于 10m/s,这些需要通过遍历查找出异常值,然后根据规则进行调整。
100

