作者:
(1) Maggie D. Bailey,科罗拉多矿业学院和国家可再生能源实验室;
(2) Douglas Nychka,科罗拉多矿业学院;
(3) Manajit Sengupta,国家可再生能源实验室;
(4) Aron Habte,国家可再生能源实验室;
(5) 谢宇,国家可再生能源实验室;
(6) Soutir Bandyopadhyay,科罗拉多矿业学院。
这里给出的结果总结了第 3 节中概述的指标。 4. 由于真实系数未知,我们通过模拟研究来补充分析。本研究的设计和结果在附录 A 中描述。
后验分布得出的参数估计值因位置和系数而异。在这里,我们将参数偏差称为朴素估计与基于贝叶斯分析的估计之间的差异。一般来说,朴素重新网格化模型系数估计值在各自系数的后验分布的 95% 可信区间内。图 2 中可以看到加利福尼亚州海岸线附近的位置在四个不同月份中与简单重新网格化估计值进行比较的分布示例。绿线代表朴素重新网格化方法,紫色线代表贝叶斯重新网格化方法。一般来说,两种方法在点或中值系数估计以及置信度或可信区间方面都具有很强的一致性,这表明合并与重新网格化步骤相关的不确定性对模型估计影响不大。然而,在 8 月份(左下图),我们看到 WRF 系数的情况,其中方法不一致,并且这种偏差被截距估计抵消。 8 月份许多地方都发现了 WRF 系数的这种偏差。
对于所考虑的整个区域,按位置划分的平均偏差如图 3 所示。偏差的计算方法是从朴素重新网格化估计值中减去 BHM 估计值。接近于零的值表明两种方法之间几乎没有差异。负值表示 BHM 赋予模型更强的权重。偏差的空间模式在 11 月份最为明显,在 8 月份也较大。 11 月,CRCM5-UQAM 和 WRF 系数之间的平均偏差在空间上符号相反,但均徘徊在零附近。在这里,我们可以看到朴素方法和 BHM 对于 8 月份的 WRF 系数最不一致,与 BHM 相比,朴素方法导致 WRF 的权重要高得多。作为额外参考,附录 B 中提供了估计系数估计值和标准误差。
朴素重新网格化的预测覆盖率计算为线性模型预测区间内的观测值的百分比。这是按所考虑的四个月中每个月的地点计算的。采用类似的方法来计算 BHM 产生的覆盖范围。我们在图 4 中显示了第四个月的结果。请注意,如图所示,报告的覆盖率百分比是每年坚持的平均值,并显示为与名义水平 0.95 的差异。与简单的重新网格化相比,我们看到样本外覆盖的结果相似。
同样,在整个研究领域中,在朴素重新网格化模型和 BHM 中,8 月份预测的 GHI 和真实 GHI 之间的 RMSE 均低于 11 月份,这表明夏季月份的预测优于冬季月份。如图 5 所示。这一发现可能反映了季节性太阳辐射的特征。当按月或按季节考虑时,夏季传入的太阳辐射的标准偏差通常低于
加利福尼亚州冬季的天气变化表明,与冬季相比,夏季的白天类型(即阴天与晴天)或入射太阳辐射量的变化较小。因此,预测在夏季的 RMSE 较低是有道理的,因为协变量和响应在该季节的变异性较小。在所示的四个月内,简单重新网格化的 RMSE 值也低于 BHM 的 RMSE 值。当考虑重新网格不确定性时,预测的 GHI 值比不考虑重新网格不确定性直接进行预测时具有更高的误差。这是一个有趣的发现,因为它表明直接进行预测而不考虑任何不确定性可能会产生更准确的点预测,但重新网格化不确定性会为最终点估计带来额外的可变性,如 BHM 中所示。
本文可在 CC 4.0 许可下在 arxiv 上获取。