Page 18 - 数学建模算法与应用
P. 18
Mathematical Modeling Algorithms and Applications
数学建模算法与应用
2.6458 3.5119 4.5092 5.4467
(三)表示分布形状的统计量———偏度和峰度
偏度:
峰度:
偏斜度用于描述数据分布的对称性。当偏斜指数 g 大于 0 时,表示数据分布
向右偏斜,这意味着右尾更长,大于平均值的值的比例更高;相反,g 小于 0 表
示左偏,左尾较长,更多情况下该值小于平均值。如果 g 接近 0,通常认为数据
分布是相对对称的。
峰度是衡量数据分布模式的另一个重要指标,特别关注分布的锐度和尾重。
正态分布的峰度固定在 3。当 g 明显超过 3 时,这意味着分布有一个重尾,表明
存在远离平均值的更极端的值。因此,峰度可以作为评估数据偏离正态分布程度
的工具。
峰度和偏度相结合形成的测试方法称为 Jarque-Bela 测试。该测试利用样本
数据的偏度和峰度来评估这些数据是否符合正态分布特征,即在未知均值和方差
条件下数据的正态性。对于遵循正态分布的数据集,预期的样本偏度接近 0,峰
度接近 3。
通过 Jarque-Bela 检验,研究人员可以确定样本的偏度和峰度与其理论值之
间是否存在显著差异。在 MATLAB 软件环境下,具体步骤如下:
通过使用 jbtest 函数并传入数据向量 X,可以获得测试结果 h。当 h 等于 1
时,表示在 0.05 的显著性水平下,可以拒绝数据遵循正态分布的假设;如果 h
为 0,则支持数据遵循正态分布的观点。可以指定显著性水平 alpha,并通过调
用 jbtest(X,alpha)进行测试。调用 [H, P, JBSTAT, CV] = jbtest(X, alpha) 不仅返
回检验结果 H,还会给出检验的 P 值、检验统计量 JBSTAT 以及用于决策的临界
值 CV。这些额外的信息有助于更全面地理解检验结果。
例 试检验这些数据是否处于正态分布。
5200 5056 561 6016 635 669 686 692 704 7007 711
8

