第二次练习课

准备工作

复习第三讲和第四讲中讲过的内容,并复现 Slides 中展示的结果。

练习内容

一、时间序列数据和可视化

了解 tsibbledata 工具包(包含在 fpp3 中)中的 tsibble 数据集 global_economy,并回答下列问题。

  1. 此数据集的 index 和 key 分别是哪个变量?

  2. 选取中国自 1978 年起至今的数据并另存为 China_economy。然后计算每年的人口增长率(%),并将结果保存于 Popgrowth 列。(提示:可以利用 difference()lag() 函数)

  3. 利用 autoplot() 函数分别绘制 PopulationPopgrowthGDPGrowth 四个变量的时序图。(提示:可以利用 patchwork 工具包将多幅图合并)

  4. 计算用 CPI 调整的人均 GDP 并绘制时序图。(注意数据中 CPI 的单位)

二、自相关系数

第二章 2.10 节练习 9 中的图

第二章 2.10 节练习 9 中的图

上图(点击可放大)中分别绘制了四幅时序图(第一行中的 1, 2, 3, 4)和四幅自相关图(第二行中的 A, B, C, D)。找出每个时序图对应的自相关图,并说明为什么。

三、自相关和移动平均

以下练习将使用 fpp3 包中的 canadian_gas 数据集,该数据集包含了 1960 年 1 月至 2005 年 2 月间加拿大的天然气产量月度数据(保存在 Volume 变量中),数据单位是十亿立方米。

  1. 绘制天然气产量的时序图。

  2. 绘制自相关图。根据该图判断该序列是否存在趋势和季节性,并说明理由。

  3. 在不使用 Guerrero 法的情况下,尝试用不同的 \lambda 值进行 Box-Cox 变换,结合结果判断 Box-Cox 变换是否适用于此序列。(参考教科书第 3.1 节)

  4. 考虑用移动平均法估计天然气产量序列的趋势项,并回答下列问题:

    1. 应该用哪种移动平均模型?写出估计量 \hat{T}_t 的表达式。

    2. 利用原数据进行趋势项估计,并将原数据和估计好的趋势项绘制在同一张时序图中。

作业

完成上面的练习,将答案(包括对问题的回答,以及对应的 R 代码及其运行结果)整理成报告形式并保存为 PDF 文件,通过微助教(网页版或移动端)提交。

提交截止时间:2026年5月12日(星期二)23:00