Page 27 - 水库安全运行管理理论与模式研究
P. 27
第一章 水工建筑物风险监控与安全评价
M=(m x,y ),其中 m x,y 是在每种尺度下计算得到的最大互信息标准值,矩阵 M
中的最大值即为最大互信息数。
给定有序数对 D,将坐标轴划分为 xxy 的网格,数据集中点落入网格的比例
近似视为概率分布,D|G。对每一个固定的有序数对 D,不同尺度的网格划分将
得到不同的概率分布 D|G。对 MIC 有如下定义:
①有序数对 D 上的特征矩阵 M(D),矩阵中的值定义为:
*
其中:I (D,x,y)表示所有尺度的网格中的互信息的最大值。
②给定样本数量为 n 的数据集,网格数量小于 B,则变量 X、Y 的最大信息
系数定义为:
0.6
其中:一般 B=n 。
4. 基于监测数据信息的客观评价法
客观评价方法是根据统计数据所提供的信息进行评价的,统计数据提供的信
息主要包括单个统计指标的数据波动程度和统计指标间的相关性程度两部分。数
据波动程度即数据的离散性,统计学中数据的离散性通常用变异系数来表示。对
一组统计数据来说,CV 越大,则离散性越大,说明该组数据包含的信息量大;
CV 越小,则离散性越小,说明该组数据包含的信息量小,当一组数据的离散性
小于我们规定的阈值时,则可认为该指标所能提供的信息量极小,在进行安全评
价时可以忽略该指标的影响。指标间的相关性程度包含了指标间线性、非线性的
相关性关系,指标间的相关性程度即指标间的信息重叠程度,本部分利用 MIC
求得各指标间的相关性。某一指标与其他指标的相关性程度越大,则与其他指标
的信息重叠度越高,说明该指标所独立的信息量越少,所以重要程度越低;若该
指标与其他指标的相关性程度越小,则与其他指标的信息重叠度越低,说明该指
标所独立的信息量越多,所以重要程度越高。因此将变异系数法与 MIC 相融合,
求得统计数据的客观评价值,具体步骤如下:
假定指标变量个数为 y,每个指标包含 X 个监测数据。
_ 15 _

