Page 76 - 计量检测与质量管理探究
P. 76
Exploration into Metrological Testing and Quality Management
计量检测与质量管理探究
(二)关键技术
1. 多源异构数据处理技术
在专用测试设备计量中,由于数据来源广泛、结构多样,数据类型复杂,使
得这些数据无法互通。通过分布式数据库的构建来融合多源异构的计量校准大数
据,基于数据的结构特征和应用需求,以提高数据的质量和可用性为目标,开展
对多源异构大数据的优质萃取,对多源异构的数据进行清洗、选择和优化,解决
多源异构军事计量大数据“聚而不通”的问题。数据预处理包括消除来自不同数
据库或不同类型数据表示,在数据中加入新的数据项以发现更多的规律,将数据
分为训练集和测试集等方面。由于第一手采集数据都保存在原始记录中,因此,
数据预处理的前提是计量检定的原始记录电子化,并保证数据的完整性和真实可
靠性,为后面的大数据挖掘提供完整、正确的数据源。可针对不同来源、不同结
构的数据的低质性和冗余性,构建数据质量与可信度评估模型 ; 根据数据的结构
特征和表达模型,结合评估模型,研究高效低质数据清洗机制 ; 分析不同来源数
据的应用需求,研究海量信息中高效率的动态选择策略 ; 设计数据底层语义的提
取方案,研究数据的语义冲突消解机制和优化聚集方法。其次,可采用结构化特
征融合的方法对多源数据的特征属性和维度进行提取,再利用矩阵分解、贝叶斯
模型等机器学习建模技术,结合从数据中提取的特征属性,提炼隐含属性的统一
描述。最后对不同特征的多维且时空相关的多源数据进行降维优化,消除错误和
冗余数据。
2. 计量大数据挖掘与分析技术
如何获取专用测试设备计量检定数据潜在信息,实现计量业务辅助决策和专
用测试设备的健康状况分析及故障预测,是军事计量信息系统亟需思考和解决的
问题。利用当前和历史计量数据,综合运用智能评估与大数据分析技术,设计科
学合理的评估指标体系和运行监测方法,采用神经网络来构造计量辅助决策与质
量预测模型,实现专用测试设备性能趋势和计量质量的可视化及数据追溯。为解
决军事系统大量的测试设备运行环境复杂、实时数据量大、影响因素众多等故障
分析难题,可充分利用与设备故障率相关的历史数据(如设备故障记录数据、计
量校准数据),针对数据分析应用场景,不断通过改变分类、聚合和重组等多种
数据分析手段,设计符合其特征的数据挖掘算法(如 K-Means、神经网络、支持
向量机 SVM、决策树等),借助多维度和各检定项的关联规则,挖掘出影响设
68

