Page 215 - 统计创新与高质量发展
P. 215
第八章 统计教育与培训:构建专业能力
集合。创建一个包含学生成绩的向量可以写作 scores <- c(85, 90, 78, 92, 88),其
中c()函数用于将多个值组合成一个向量。矩阵(matrix)是二维的同类型数据结构,
可通过 matrix() 函数创建,例如 matrix_data <- matrix(c(1, 2, 3, 4), nrow = 2, ncol =
2),这里创建了一个 2 行 2 列的矩阵。
数据框(data.frame)是 R 中用于存储表格数据的重要结构,它可以容纳不
同类型的数据列。创建一个包含学生姓名和成绩的数据框示例如下:
students <- data.frame(
name = c(“Alice”, “Bob”, “Charlie”),
score = c(85, 90, 88)
)
控制结构方面,R 语言也包含条件语句(if - else)和循环语句(for、while)。
使用条件语句判断学生成绩是否及格的示例如下:
score <- 85
if (score > = 60) {
result <- “Pass”
} else {
result <- “Fail”
}
print(result)
这段代码首先定义了变量 score,然后通过 if - else 条件判断,如果成绩大于
等于 60 分,则将 result 赋值为 "Pass",否则赋值为 "Fail",最后使用 print() 函数
输出结果。
2. 统计分析与数据处理包的学习
dplyr 是 R 中用于数据处理的强大包,它提供了一系列简洁易用的函数,极
大地简化了数据筛选、排序、聚合等操作。例如,从学生成绩数据框中筛选出成
绩大于 90 分的学生:
library(dplyr)
students % > % filter(score > 90)
在这段代码中,首先使用 library(dplyr) 加载 dplyr 包。然后使用管道操作符 %
> %,它的作用是将前一个表达式的结果作为后一个表达式的输入。filter(score
207

