第三次练习课

准备工作

复习第四讲至第六讲的内容,并复现 Slides 中展示的结果。

练习内容

部分问题需要调用 fpp3 包。

一、成分分解

本题中继续使用 canadian_gas 数据集。该数据集包含了 1960 年 1 月至 2005 年 2 月间加拿大的天然气产量月度数据(保存在 Volume 变量中),数据单位是十亿立方米。

  1. 分别用传统分解法(加法模型和乘法模型)、X-11、SEATS、STL 法进行成分分解并绘图。比较各种方法的分解结果,并描述它们的区别。

  2. 针对前一问中五种分解结果中的剩余项分别绘制自相关图(注意不同分解结果中保存剩余项的变量名称)。各种方法是否有效去除了趋势和季节特征?

二、预测

本题中使用 aus_production 数据集中的水泥(Cement)产量数据。

  1. 该序列的起止时间是什么?共包含多少期?

  2. 利用 slice_head()slice_tail() 函数,将最后 40 个观测值设为测试集,其余观测值设为训练集。

  3. 针对训练集,分别利用均值法、朴素法、季节性朴素法和漂移法进行拟合,并对未来 40 期(即测试集中的时间点)进行预测。模仿教科书 5.2 节,通过绘图展示预测结果。

  4. 用 RMSE 和 MAE 测度比较模型的预测准确性。哪个模型表现得最好?

三、回归分析

本题中使用 energy.csv 中的数据。此文件中包含了 1953-2023 年间中国的人均能源生产与消费量(包括总量、原煤、原油、电力),但存在缺失值和说明性文字,在使用时需要注意。本数据来源于中国研究数据服务平台(CNRDS)。

考虑用回归方法对人均电力消费量进行分析。被预测变量为人均电力消费量,可用的预测变量为除了人均电力生产量和消费量之外的所有变量(人均电力生产量和消费量几乎没有差异)。综合利用学过的方法找出你认为最好的模型。

作业

完成上面的练习,将答案(包括对问题的回答,以及对应的 R 代码及其运行结果)整理成报告形式并保存为 PDF 文件,通过微助教(网页版或移动端)提交。

提交截止时间:2026年6月2日(星期二)23:00