Page 215 - 统计创新与高质量发展
P. 215

第八章  统计教育与培训:构建专业能力


               集合。创建一个包含学生成绩的向量可以写作 scores <- c(85, 90, 78, 92, 88),其
               中c()函数用于将多个值组合成一个向量。矩阵(matrix)是二维的同类型数据结构,
               可通过 matrix() 函数创建,例如 matrix_data <- matrix(c(1, 2, 3, 4), nrow = 2, ncol =

               2),这里创建了一个 2 行 2 列的矩阵。
                   数据框(data.frame)是 R 中用于存储表格数据的重要结构,它可以容纳不
               同类型的数据列。创建一个包含学生姓名和成绩的数据框示例如下:
                   students <- data.frame(
                     name = c(“Alice”, “Bob”, “Charlie”),

                     score = c(85, 90, 88)
                   )
                   控制结构方面,R 语言也包含条件语句(if - else)和循环语句(for、while)。

               使用条件语句判断学生成绩是否及格的示例如下:
                   score <- 85
                   if (score > = 60) {
                     result <- “Pass”
                   } else {

                     result <- “Fail”
                   }
                   print(result)

                   这段代码首先定义了变量 score,然后通过 if - else 条件判断,如果成绩大于
               等于 60 分,则将 result 赋值为 "Pass",否则赋值为 "Fail",最后使用 print() 函数
               输出结果。
                   2. 统计分析与数据处理包的学习

                   dplyr 是 R 中用于数据处理的强大包,它提供了一系列简洁易用的函数,极
               大地简化了数据筛选、排序、聚合等操作。例如,从学生成绩数据框中筛选出成
               绩大于 90 分的学生:
                   library(dplyr)

                   students % > % filter(score > 90)
                   在这段代码中,首先使用 library(dplyr) 加载 dplyr 包。然后使用管道操作符 %
               > %,它的作用是将前一个表达式的结果作为后一个表达式的输入。filter(score



                                                                                      207
   210   211   212   213   214   215   216   217   218   219   220