Page 18 - 数学建模算法与应用
P. 18

Mathematical Modeling Algorithms and Applications
             数学建模算法与应用


                     2.6458  3.5119  4.5092  5.4467
                 (三)表示分布形状的统计量———偏度和峰度

                  偏度:



                  峰度:





                  偏斜度用于描述数据分布的对称性。当偏斜指数 g 大于 0 时,表示数据分布
             向右偏斜,这意味着右尾更长,大于平均值的值的比例更高;相反,g 小于 0 表
             示左偏,左尾较长,更多情况下该值小于平均值。如果 g 接近 0,通常认为数据

             分布是相对对称的。
                  峰度是衡量数据分布模式的另一个重要指标,特别关注分布的锐度和尾重。
             正态分布的峰度固定在 3。当 g 明显超过 3 时,这意味着分布有一个重尾,表明

             存在远离平均值的更极端的值。因此,峰度可以作为评估数据偏离正态分布程度
             的工具。
                  峰度和偏度相结合形成的测试方法称为 Jarque-Bela 测试。该测试利用样本
             数据的偏度和峰度来评估这些数据是否符合正态分布特征,即在未知均值和方差

             条件下数据的正态性。对于遵循正态分布的数据集,预期的样本偏度接近 0,峰
             度接近 3。
                  通过 Jarque-Bela 检验,研究人员可以确定样本的偏度和峰度与其理论值之

             间是否存在显著差异。在 MATLAB 软件环境下,具体步骤如下:
                  通过使用 jbtest 函数并传入数据向量 X,可以获得测试结果 h。当 h 等于 1
             时,表示在 0.05 的显著性水平下,可以拒绝数据遵循正态分布的假设;如果 h

             为 0,则支持数据遵循正态分布的观点。可以指定显著性水平 alpha,并通过调
             用 jbtest(X,alpha)进行测试。调用 [H, P, JBSTAT, CV] = jbtest(X, alpha) 不仅返
             回检验结果 H,还会给出检验的 P 值、检验统计量 JBSTAT 以及用于决策的临界

             值 CV。这些额外的信息有助于更全面地理解检验结果。
                  例 试检验这些数据是否处于正态分布。
                  5200 5056 561 6016 635 669 686 692 704 7007 711



             8
   13   14   15   16   17   18   19   20   21   22   23