第二部份:分析与预测

Slides

  • 第四讲:时间序列的分解 – slides(4/18 更新)

  • 第五讲:建模与预测 – slides

  • 第六讲:回归方法 – slides

补充信息

Loess 和 Lowess

B站视频 https://www.bilibili.com/video/BV1hE41197Gn/ 比较详细地介绍了 Loess 方法的原理,以及与其类似的 Lowess 方法,感兴趣的同学可以观看。

MAE, MSE, RMSE

这里我们通过一个例子展示这几个误差测度有什么不同。下表中给出了一组原始数据和三组(假想的)预测结果:

Actual Forecast 1 Forecast 2 Forecast 3
10 9.6 9.9 10.1
10 10.4 10.1 9.9
10 10.3 10.0 10.5
10 9.8 11.0 9.8
10 10.3 9.8 10.5

可以很容易地看出 Forecast 1 的每个预测值都不是特别准确;Forecast 2 中除了一个 11.0 以外其他预测值都比 Forecast 1 更加准确;相比之下 Forecast 3 中有两个预测值 10.5 的准确度比其他预测值低,但没有 Forecast 2 中的 11.0 那么离谱。

实践中常用的三个误差测度的定义如下: \mathrm{MAE} = \frac{1}{T}\sum_{i=1}^T |\hat{y}_i - y_i|, \quad \mathrm{MSE} = \frac{1}{T}\sum_{i=1}^T (\hat{y}_i - y_i)^2, \quad \mathrm{RMSE} = \sqrt{\mathrm{MSE}} \, . 三者中 MAE 最容易理解,但绝对值函数有时会给分析带来困难;MSE 和 RMSE 都会将较大的误差进一步放大,因此对异常预测值更加敏感,RMSE 保持了原数据的单位,但平方根函数给计算增加了难度。

针对上面给出的数据,三个测度的计算结果是

Forecast MAE MSE RMSE
F1 0.320 0.108 0.329
F2 0.280 0.212 0.460
F3 0.280 0.112 0.335

MAE 认为 F2 \sim F3 \succ F1,而 MSE 和 RMSE 都认为 F1 \succ F3 \succ F2(MSE 和 RMSE 的选择永远是一致的)。在实践中 MSE 和 RMSE 更加常见,但你应该选择哪个测度应当根据你的具体需求来判断。