第一次练习课

练习内容

一、基础练习

  1. 将下列数字以向量的形式保存于变量 x

    37 45 45 46 29 44 30 42 43 39
  2. 根据公式

    \sum_{i=1}^n (x_i - \bar{x})^2 / (n-1)

    计算 x 的样本方差(此处仅可使用 mean() 函数和 sum() 函数)。

  3. 使用 var() 函数再次计算 x 的方差,确认结果和上一问一致。

  4. 假设 x 中的数值是十名大四女生的一分钟仰卧起坐体测数据。将 x 以数据框(data frame)的形式保存于变量 y,并将列名称设定为 Situp

  5. y 中添加一个空列,名称为 Score。(可利用AI工具或网络搜索了解操作方法)

  6. 查阅《国家学生体质健康标准(2014年修订)》中关于大三大四女生一分钟仰卧起坐的评分标准,并对 y 中的每个 Situp 数据进行评分,将评分结果保存在 Score 列中。(提示:数据所在区间的评分标准可以提炼为数学表达式)

二、数据的导入和操作

下载 fitness.csv 文件并回答下面的问题。此文件中包含了 145 名大四女生的假想体测数据,其中列名称 Lungcap 代表肺活量,Run 代表 50 米跑,Jump 代表立定跳远,Sitreach 代表坐位体前屈,Situp 代表一分钟仰卧起坐。

  1. 使用 read.csv() 函数将 fitness.csv 文件的内容导入并保存在 Fit 变量中。(利用帮助文件或网络搜索了解此函数的用法,并注意待导入文件在电脑中的保存位置)

  2. 计算每个学生的 BMI 指数并添加在 Fit 中。

  3. 利用 plot() 函数绘制 BMI 和肺活量之间的散点图。二者之间能观察到什么关系?

  4. 从上一问的结果中你是否能发现一个明显的异常值?利用条件判断的方式从 Fit 中找到该异常值对应的 ID。

  5. 将不包含上一问中异常值的数据保存在 Fit2 中,并重新绘制 BMI 和肺活量之间的散点图。利用 cor() 函数分别计算 FitFit2 中 BMI 和肺活量间的相关系数。剔除异常值前后相关系数是否有明显变化?

  6. 针对 50 米跑和立定跳远的成绩重复第 3~5 问。

作业

完成上面的练习,将答案(包括对问题的回答,以及对应的 R 代码及其运行结果)整理成报告形式并保存为 PDF 文件,通过微助教(网页版或移动端)提交。

提交截止时间:2026年4月8日(星期三)10:00

参考答案:点击下载