Page 13 - 数学建模算法与应用
P. 13
第一章 数学建模基础知识
第二节 数据统计和分析方法
统计学关注的是那些受到不确定因素影响的数据集,它作为一门建立在概率
理论之上的实用科学而存在。统计推断的核心在于描述统计。描述统计的任务包
括数据的搜集、整理、加工及分析,旨在通过系统化的方式处理数据,以便发现
其中的趋势、特点以及数量关系。不论是小规模的数据集合还是成千上万的数据
点,研究者们都期望通过一系列关键指标来捕捉数据集的整体轮廓。熟悉数理统
计领域内的参数估计与假设检验等基本技术,是进行高效数据表述与解析的前提
条件。
一、常用统计量
统计学在数据分析与验证中扮演着关键角色,它是用来展现数据特性的工具。
宏观量指的是众多微观个体特性经统计平均后的结果,承载着统计意义上的平均
价值。然而,就单一微观实体而言,宏观量并不具备直接的实际含义。因此,尽
管描述宏观现象的物理量,例如速度和动能等,可以归类为宏观量的一部分,但
这并不意味着所有的宏观量都体现了统计平均的特质。换句话说,并非所有的宏
观量都能被定义为统计量。
(一)表示位置的统计量——平均值和中位数
平均值 ( 或均值、数学期望 ):
式中,X 表示统计中的样本。
中位数:将数据由小到大排序后位于中间位置的那个数值。
当 X 为向量时,算术平均值的数学含义为 ,即样本均值。在
MATLAB 中,可以利用 mean 求 X 的算术平均值。函数 mean 的调用格式如下:
■ mean(X)——X 为向量,返回 X 中各元素的平均值。
■ mean(A)——A 为矩阵,返回 A 中各列元素的平均值构成的向量。
■ mean(A,dim)——在给出的维数内的平均值。
例如,需要定义一个 4×3 的向量,并求取其算术平均值。可以在 MATLAB
命令窗口输入:
3

