第一次练习课
练习内容
一、基础练习
将下列数字以向量的形式保存于变量
x。37 45 45 46 29 44 30 42 43 39 根据公式
\sum_{i=1}^n (x_i - \bar{x})^2 / (n-1)
计算
x的样本方差(此处仅可使用mean()函数和sum()函数)。使用
var()函数再次计算x的方差,确认结果和上一问一致。假设
x中的数值是十名大四女生的一分钟仰卧起坐体测数据。将x以数据框(data frame)的形式保存于变量y,并将列名称设定为Situp。向
y中添加一个空列,名称为Score。(可利用AI工具或网络搜索了解操作方法)查阅《国家学生体质健康标准(2014年修订)》中关于大三大四女生一分钟仰卧起坐的评分标准,并对
y中的每个Situp数据进行评分,将评分结果保存在Score列中。(提示:数据所在区间的评分标准可以提炼为数学表达式)
二、数据的导入和操作
下载 fitness.csv 文件并回答下面的问题。此文件中包含了 145 名大四女生的假想体测数据,其中列名称 Lungcap 代表肺活量,Run 代表 50 米跑,Jump 代表立定跳远,Sitreach 代表坐位体前屈,Situp 代表一分钟仰卧起坐。
使用
read.csv()函数将 fitness.csv 文件的内容导入并保存在Fit变量中。(利用帮助文件或网络搜索了解此函数的用法,并注意待导入文件在电脑中的保存位置)计算每个学生的 BMI 指数并添加在
Fit中。利用
plot()函数绘制 BMI 和肺活量之间的散点图。二者之间能观察到什么关系?从上一问的结果中你是否能发现一个明显的异常值?利用条件判断的方式从
Fit中找到该异常值对应的 ID。将不包含上一问中异常值的数据保存在
Fit2中,并重新绘制 BMI 和肺活量之间的散点图。利用cor()函数分别计算Fit和Fit2中 BMI 和肺活量间的相关系数。剔除异常值前后相关系数是否有明显变化?针对 50 米跑和立定跳远的成绩重复第 3~5 问。
作业
完成上面的练习,将答案(包括对问题的回答,以及对应的 R 代码及其运行结果)整理成报告形式并保存为 PDF 文件,通过微助教(网页版或移动端)提交。
提交截止时间:2026年4月8日(星期三)10:00
参考答案:点击下载