第五讲:探索性数据分析
Slides
点击 slides 画面,然后用 键或 键控制翻页。点击 slides 左下角的 图标可以发现更多功能。
如何将 slides 保存到自己的电脑上:
- 点击下面的链接会在新的标签页里打开 slides
assets/slides/lecture5.html - 在该页面点击键盘的
e
键,会生成可以打印的文件(生成过程可能会很慢,且只保证在 Chrome 中有效) - 右键选择打印该页面,然后选择保存为 PDF 文件。
补充学习
bilibili: StatQuest: Fiitting a curve to data, aka lowess, aka loess
这个视频中比较详细地介绍了 LOWESS 拟合的工作原理,也对lowess()
和loess()
函数进行了对比。
视频网址:https://www.bilibili.com/video/BV1hE41197Gn/
阅读教材第3.3节,学习如何在 R 中实现各种平滑方法。
课后练习
章后练习 3.5(自己完成后再看参考答案)
假设时间序列 x_t 是趋势平稳的,其趋势服从带漂移项的随机游走模型,即
x_t = \mu_t + y_t, \quad \mu_t = \delta + \mu_{t-1} + w_t
其中 y_t 是平稳序列,w_t 是白噪声且与 y_t 独立。
证明 \nabla x_t 是平稳的。
由 \nabla x_t = \delta + w_t + \nabla y_t 可得 E(\nabla x_t) = \delta,以及
\begin{align*} \mathrm{cov}(\nabla x_{t+h}, \nabla x_{t}) &= \mathrm{cov}(\delta + w_{t+h} + \nabla y_{t+h}, \delta + w_t + \nabla y_{t}) \\ &= \mathrm{cov}(w_{t+h}, w_t) + \mathrm{cov}(w_{t+h}, \nabla y_t) \\ & \quad + \mathrm{cov}(\nabla y_{t+h}, w_t) + \mathrm{cov}(\nabla y_{t+h}, \nabla y_t) \end{align*}
因为 w_t 与 y_t 独立,\mathrm{cov}(w_{t+h}, \nabla y_t) = \mathrm{cov}(\nabla y_{t+h}, w_t) = 0。而 \mathrm{cov}(\nabla y_{t+h}, \nabla y_t) 可以写成
\begin{align*} \mathrm{cov}(\nabla y_{t+h}, \nabla y_t) &= \mathrm{cov}(y_{t+h} - y_{t+h-1}, y_t - y_{t-1}) \\ &= 2\gamma_y(h) - \gamma_y(h+1) - \gamma_y(h-1) \end{align*}
仅依赖于 h。已知白噪声序列是平稳序列,可得 \mathrm{cov}(\nabla x_{t+h}, \nabla x_{t}) 也仅依赖于 h。
综上可得差分序列 \nabla x_t 是平稳的。