第三次练习课

准备工作

复习第五讲和第六讲的内容,并复现 Slides 中展示的结果。

练习内容

下面的问题需要用到 fpp3 包。

第一题

aus_production 数据集中选取水泥(Cement)的产量数据并回答下面的问题。

  1. 该序列的起止时间是什么?共有多少期?

  2. 利用 slice_head()slice_tail() 函数,将最后 40 个观测值设为测试集,其余观测值设为训练集。

  3. 针对训练集,分别利用均值法、朴素法、季节性朴素法和漂移法进行拟合,并对未来 40 期(即测试集中的时间点)进行预测。模仿教科书 5.2 节,绘制图表展示预测结果。

  4. 用 RMSE 和 MAE 测度比较模型的预测准确性。哪个模型表现得最好?

第二题

olympic_running 数据集中保存了 1896 至 2016 年间奥运会跑步类项目的冠军成绩(单位:秒),了解该数据集后回答下面的问题。

  1. 选取 1948 年及以后年份的男子 100米、200米、400米项目成绩,并绘制时序图。

  2. 考虑选择时间作为预测变量对冠军成绩进行回归分析。写出回归模型。对上一问中的项目成绩分别进行拟合,并报告时间项系数的估计值。从结果可知冠军成绩每年平均缩短多少秒?(注意数据的频度为四年)

  3. 利用残差诊断图和 Ljung-Box 检验分析上面的模型是否合适。

  4. 根据上面的拟合结果预测 2020 年的冠军成绩。分别给出点预测和 95% 区间预测。在 https://olympics.com/ 上查找 2020 年东京奥运会该项目的冠军成绩并进行对比。你的预测准确吗?

作业

完成上面的练习,将答案(包括对问题的回答,以及对应的 R 程序及其运行结果)整理为 PDF 文件,通过教学平台提交。

截止日期:2025年6月5日(星期四)23:00

参考答案