第二部份:分析与预测
Slides
补充信息
Loess 和 Lowess
B站视频 https://www.bilibili.com/video/BV1hE41197Gn/ 比较详细地介绍了 Loess 方法的原理,以及与其类似的 Lowess 方法,感兴趣的同学可以观看。
MAE, MSE, RMSE
这里我们通过一个例子展示这几个误差测度有什么不同。下表中给出了一组原始数据和三组(假想的)预测结果:
Actual | Forecast 1 | Forecast 2 | Forecast 3 |
---|---|---|---|
10 | 9.6 | 9.9 | 10.1 |
10 | 10.4 | 10.1 | 9.9 |
10 | 10.3 | 10.0 | 10.5 |
10 | 9.8 | 11.0 | 9.8 |
10 | 10.3 | 9.8 | 10.5 |
可以很容易地看出 Forecast 1 的每个预测值都不是特别准确;Forecast 2 中除了一个 11.0 以外其他预测值都比 Forecast 1 更加准确;相比之下 Forecast 3 中有两个预测值 10.5 的准确度比其他预测值低,但没有 Forecast 2 中的 11.0 那么离谱。
实践中常用的三个误差测度的定义如下: \mathrm{MAE} = \frac{1}{T}\sum_{i=1}^T |\hat{y}_i - y_i|, \quad \mathrm{MSE} = \frac{1}{T}\sum_{i=1}^T (\hat{y}_i - y_i)^2, \quad \mathrm{RMSE} = \sqrt{\mathrm{MSE}} \, . 三者中 MAE 最容易理解,但绝对值函数有时会给分析带来困难;MSE 和 RMSE 都会将较大的误差进一步放大,因此对异常预测值更加敏感,RMSE 保持了原数据的单位,但平方根函数给计算增加了难度。
针对上面给出的数据,三个测度的计算结果是
Forecast | MAE | MSE | RMSE |
---|---|---|---|
F1 | 0.320 | 0.108 | 0.329 |
F2 | 0.280 | 0.212 | 0.460 |
F3 | 0.280 | 0.112 | 0.335 |
MAE 认为 F2 \sim F3 \succ F1,而 MSE 和 RMSE 都认为 F1 \succ F3 \succ F2(MSE 和 RMSE 的选择永远是一致的)。在实践中 MSE 和 RMSE 更加常见,但你应该选择哪个测度应当根据你的具体需求来判断。