`

Electricity Market Predictability: Virtues of Machine Learning and Links to the Macroeconomy

创建于 更新于

摘要

本报告基于新加坡电力市场详细的利益相关者级数据,系统比较了15种机器学习模型及4种集成方法的价格预测表现,验证了机器学习在非线性捕捉、高维复杂性处理和弱因子环境中正则化技术的优势。研究揭示了新加坡电力市场的预测性行为与宏观经济周期和地缘政治风险密切相关,且预测性能在扩张期和市场波动期表现突出。通过特征重要性分析,强调了宏观经济与市场内部变量的交互作用在价格形成中的关键作用,显示市场以供应侧及监管因素驱动为主。预测结果在均值-方差框架下能带来显著经济效益,且新提出的加权集成方法有效提升了预测稳定性和准确性,为电力市场管理及政策制定提供了实证支持和量化工具[page::0][page::2][page::4][page::5][page::6][page::31][page::37][page::40][page::43][page::44][page::45].

速读内容


机器学习模型预测性能评估 [page::31][page::32][page::34][page::35]

  • 所有模型均显著优于基准(滞后价格、AR(1)、历史均值、零回报)$R_{O O S}^2$,最高可达37%-44%。

- GLM、XGB(+H)、LGBM(+H)表现最佳,树模型和GLM接近,NN表现居中,线性和降维模型表现相对弱。
  • 集成模型中,引入预测相关性惩罚的加权集成(Ensemblewp)效果最佳,显著超过个体模型和未经惩罚的集成。


机器学习模型复杂性与性能 [page::35][page::36]

  • 复杂度越高(选用特征数或非零系数越多)一般对应更好预测性能。

- GLM、XGB、LGBM复杂度最高,LASSO、ENet和PCR较低。
  • 面板回归验证复杂度对预测性能的经济学意义显著。


宏观经济状态下的预测异质性 [page::37][page::38][page::39][page::64][page::65]

  • 预测性能在扩张期、高波动期及极端地缘政治风险期显著提升。

- 牛市和高经济活动指标(夜间灯光)期内预测性强,显示电力市场与实体现实经济更紧密相关。
  • 特定重大事件如中美贸易战、OPEC减产、能源危机和俄乌冲突引发预测性能结构性变化。


特征重要性与模型解释 [page::40][page::41][page::42][page::43][page::54][page::55][page::108][page::109][page::110][page::111][page::112]

  • 宏观经济与市场内部变量交互项普遍比单独特征重要,揭示“宏观→市场→价格”传导路径关键性。

- USEP滞后价格被多数模型视为极重要特征,供应缓冲、应急储备价格和燃料价格等也具显著影响。
  • 结合Shapley值和$R^2$减少法确认结果稳健,分组重要性分析显示供应侧和监管因素主导市场驱动。

- 特征重要性动态随能源危机爆发出现显著结构变化。

经济价值评估(均值-方差框架) [page::44][page::57][page::113][page::114][page::115]

  • 顶尖模型(XGB(+H), LGBM(+H), GLM)显著提升投资者效用,CER(确定等效收益率)高达77.15%。

- 投资组合分析表明机器学习模型不仅统计显著,也带来实际经济收益。
  • 结果对不同风险偏好$\gamma$稳健。

深度阅读

电力市场可预测性研究报告详尽解读



---

1 元数据与概览



报告标题: Electricity Market Predictability: Virtues of Machine Learning and Links to the Macroeconomy
作者: Jinbo Cai、Wenze Li、Wenjie Wang
发布日期: 2025年7月11日
发布机构: 未明(基于新加坡能源市场公司数据,估计为相关学术或行业研究机构)
研究主题: 以新加坡批发电力市场为对象,利用机器学习方法分析电力价格的可预测性,并研究其与宏观经济环境的关系。

核心论点:
  • 机器学习(ML)模型在电力价格预测中的三大“美德”得到实证支持:(1)有效捕捉非线性关系;(2)复杂度优势;(3)在弱因子环境下,$l2$范数和Bagging技术优势。

- 预测能力不仅统计显著,也能转化为显著的经济价值。
  • 电力价格的预测能力在宏观经济不同状态间表现出异质性,尤其在扩张期、市场波动期和极端地缘政治风险期表现较强。

- 特征重要性分析揭示新加坡市场较强的供给驱动属性和制度监管持续影响。

本报告非简单的模型准确性提升展示,而是结合丰富的市场参与者数据和宏观经济因子,强调对预测背后机制的理解和政策启示。[page::0,1,2,4,5,6]

---

2 逐节深度解读



2.1 摘要与研究背景


  • 摘要细节: 利用来自新加坡能源市场公司(EMC)的丰富参与者级别数据,测试15种机器学习单模型及4种集成模型,使用619个特征,涵盖市场变量、国内外宏观经济指标和交互项。

- 明确验证ML模型在电力价格预测中的优势,尤其是复杂度和非线性捕捉能力,以及Bagging和$ l
2$正则的优势。
  • 结合宏观经济环境,揭示预测准确率的时间序列异质性。

- 透视价格形成机制,强调市场以供给端和监管为主驱动力。
  • 相关经济收益用均值-方差框架衡量,展现预测带来的实用价值。
  • 研究背景(第1节): 电力价格预测对电网稳定、价格波动缓解和优化发电及负荷管理至关重要。同时,电力价格受全球能源价格、宏观周期和地缘政治的影响,尤其是像新加坡这样高度依赖进口天然气且电力市场半自由化的特点提升了预测的复杂性。过往研究多聚焦较少特征及简单模型,缺乏利用权威的市场参与者层级数据进行深入分析。
  • 方法框架(第2节): 本研究跨越2003年至2023年日频数据,采用递归扩展窗口训练方案,覆盖传统计量方法、各类正则化线性模型、降维方法(PCR, PLS)、广义线性模型(GLM)、树模型(随机森林RF,XGBoost,LightGBM)及深度神经网络(1-5层)。设计了多种集成加权策略,其中创新加入基于预测相关性的惩罚。在指标衡量上,引入三种$R^2$基准(Lag, AR(1), 历史均值/零基准)及相对均方根误差(rRMSE) 借以全方位评价模型性能。[page::0,1,2,3,4,5,6,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23]


2.2 模型表现与经济价值(第4节)



2.2.1 OOS模型性能


  • 所有模型相对于Lag price、AR(1)、均值及零基准均表现出正的、统计显著的$R{\text{OOS}}^2$,均超过30%,显示电力价格具有显著可预测性,远高于传统金融资产的微弱信号。

- 排名前三的是:广义线性模型(GLM)、XGBoost(带Huber损失)、LightGBM(带Huber损失),表明非线性树模型和半参数模型处理高维非线性特征效果显著。
  • 模型类别排序:树模型≈GLM > 神经网络5层 > 降维模型 > 线性正则模型 > OLS。

- 集成方法中,加入基于模型预测相关性的惩罚项的权重优化集成性能最优,明显超越个别模型,体现集成多样性对提高泛化能力的贡献。
  • Ridge回归在强因子场景下表现一般,但随着去除Lag price影响的弱因子环境下表现明显改善,符合$ l2$正则在弱因子环境中的理论优势。类似道理,随机森林(bagging技术)在弱因子环境中优于岭回归和部分其他方法。

- 通过固定效应面板回归和模型复杂度度量,进一步定量体现模型复杂度与预测性能正相关,其中复杂度对均值、零基准$R{\text{OOS}}^2$的提升达到统计显著。
  • 经济价值方面,采纳均值-方差投资框架,模型预测的风险调整收益显著优于简单基准,计算的确定等价收益(CER)显示XGBoost模型对应的风险资产投资者愿接受77%以上的无风险收益替代,突显实际应用潜力。

- 动态性能分析揭示预测能力随宏观环境呈现异质性,扩张期、高波动期及极端地缘政风险事件中表现尤佳。
  • 结构断点检测显示2021年能源危机前后市场变化显著,模型预测亦表现出系统转换。


2.2.2 特征贡献与市场结构洞察


  • 特征重要性综合采用$R^2$减少量和经济含义的Shapley值两种方法,均显示交互项在解释能力中占据主导,指示宏观因子通过影响市场中参与者行为间接传导至电价。

- 单一特征中,滞后电力价格(USEP lag)权重最高,有显著自相关性反映价格惯性。其次为供应端的供应缓冲指标(supply cushion)及监管相关的应急备用价格(contingency reserve price)。
  • 多数模型认为新加坡市场受供给侧影响较大,同时监管机制强化价格形成的影响,表明市场尚未完全自由化。

- 宏观变量中,国内宏经济因素重要性超过国际因素,表明市场行为更偏向本土经济周期响应。
  • 多方法和时间维度的结构断点检测都指向2021年能源危机带来的市场和信息结构实质性改变。

- 边际效应分析支持基础经济逻辑:滞后价格呈明显均值回复特征;供应缓冲负向影响价格,反映市场供给宽裕降低价格压力;应急储备价格上涨时价格上扬,表明风险溢价机制;地缘政治风险提升价格波动。

2.3 方法论详解(第3节及附录)


  • 样本分割与训练方案: 采用递归扩展式训练,保证时间序列预测的因果顺序,兼顾平稳性与样本量,训练集2003-2017年,测试集2018-2023年。

- 模型体系:
- 线性基准:OLS。
- 正则化线性模型:LASSO($l
1$正则)、Ridge($l2$正则)、Elastic Net。
- 降维模型:主成分回归(PCR)、偏最小二乘(PLS)。
- 半参数非线性模型:广义线性模型(GLM)基于二次样条与group LASSO。
- 树模型:随机森林(Bagging)、XGBoost与LightGBM(Boosting,含Huber损失)。
- 神经网络:多层前馈网络(1至5隐藏层,ReLU激活,带正则及ensemble)。
  • 集成方法: 包括均权、基于验证集性能优化权重、带预测相关性惩罚的权重优化以及经济模型权重组合。

- 性能评估指标:
- 多种基准下的Out-of-sample (OOS) $R^2$,含Lag价格、AR(1)、历史均值和0基准。
- 相对均方根误差(rRMSE),相对于OLS评价。
- 统计显著性检验(Diebold-Mariano及相关修正测试)。
- 趋势概率框架用于分解预测性能。
  • 解释性工具:

- 变量重要性:$R^2$减少量、Shapley值、Sum of Squared Deviation (SSD)、Mean Decrease Gini (MDG)等多元指标。
- 子组分析:以政策关注的供给、需求、监管、国内和国际宏观因子为组,采用Shapley值分解模型预测性能,提供政策相关解释。
- 边际效应曲线,探测特征与电价回报的非线性单调关系。
  • 经济价值评估: 以均值-方差框架计算投资者依据模型信号配置的投资组合权重及收益,重点关注确定等价收益率(CER)。

- 结构断点与稳健性检验: 采用Bai-Perron多断点和Pettitt非参数断点检验。
  • 数据处理: 数据包含新加坡半小时市场数据合成日频,国内气象与经济指标,全球能源及地缘政治风险指标,共619特征;含大量缺失值,采用多模型时间序列插补及Transformer模型补全。特征做按月标准化,目标变量转为对数收益以保证平稳。
  • 模拟验证: 设计蒙特卡洛仿真,分别针对线性和非线性数据生成过程验证机器学习方法在变量选择及非线性捕捉的能力,强化实证结论。


本报告的模型开发与验证严密,涵盖理论、方法及实操多个维度,体现当前电力市场预测的前沿探索。[page::14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100,101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,119]

---

3 图表深度解读



3.1 图1:市场清算过程示例(page 47)


  • 展示三家发电商的不同时段价格-产量报价分段。

- 市场清算价为需求曲线与报价累积供给的交点。
  • 报价低于清算价的部分成功成交,报价高于清算价则被排除。

- 用色彩区分三家并用数轴展示价格与产量。
  • 体现市场拍卖机制鼓励效率并提供价格信号基础,说明电价为市场驱动。[page::47]


3.2 图2:集成模型权重动态(page 48)


  • 展示三种集成权重方案(Ensembleθ、Ensemblewp、Ensembleop)对应各单模型权重随时间的变化。

- Ensemble
wp(含相关性惩罚)权重分布更为集中,主要聚焦表现优异单模型,权重波动更明显。
  • Ensembleop虽优化权重,但未考虑相关性,呈现更多分散,某些时期权重波动较大。

- Ensembleθ采用经济驱动权重,较为平滑但性能逊色。
  • 表明考虑模型预测相关性的权重设计提升集成效果且更加动态灵活。[page::48]


3.3 图3:模型复杂度变化(page 49)


  • 展示多模型训练期间“有效特征数量”或对应降维分量随时间的演变。

- LGBM和XGB稳定选择约300-350个特征,GLM于2022年前约2400个特征显著下降至~1600,LASSO、ENet特征数量较少但逐步上升。
  • PCR、PLS等降维组件稳定,RF叶节点数小幅上升。

- 结合面板回归显示,复杂度与OOS表现存在正相关,强化复杂模型优势见识。[page::49]

3.4 图4:电力收益与OOS $R^2{mean}$动态(page 50)


  • 上方为2018-2023年间每月电价收益蜡烛图,红色阳线表示上涨,绿色阴线代表下跌。明显出现doji形态体现价格波动幅度大、均线近零。

- 下方展示72个月内各模型平均$R^2{OOS,mean}$随时间走势,表现稳定无明显衰退。
  • 波动期(如能源危机时期)$R^2$较高,平稳期表现略有回落,支持预测异质性结论。[page::50]


3.5 图5-6:OOS预测能力动态及误差累积(pages 51-52)


  • 图5将72个月按预测能力分为四级,颜色从红到黄预测能力递增。

- 预测能力与关键宏事件(中美贸易摩擦、OPEC减产、能源危机、俄乌战争等)时间点高度重合,提示宏观变量对预测能力的影响。
  • 图6展示所有模型累计预测误差和,同样在关键事件出现拐点,来自于模型适应结构断点的叙述。

- 集成模型表现优于单一模型,误差累计明显更缓。[page::51,52]

3.6 图7~11及附录大量图表(page 53-57, 105-115)


  • 特征重要性(图7,8,A6,A7,A8,A9,A10,A11):显示交互项占据主导,滞后电力价格稳定为首要特征,多模型选择异同映射出逻辑合理性。树模型和神经网络视角更全面,线性模型更依赖单一变量。

- 子组重要性分解(图9):体现监管因素最重要,供给侧其次,说明市场高度监管且供给驱动。
  • 边际效应(图10):符合经济直觉,价格均值回复,供应缓冲负相关,备用价格正相关,地缘政治风险明增电价波动。

- 投资组合效用曲线(图11,A12-A14):顶尖模型累计效用明显优于基准,CER等经济指标强化实用价值。[page::53-57, 105-115]

---

4 估值分析



本报告本质为电力价格预测与经济价值评估,非传统财务资产估值,无经典DCF等估值模型,但采用机器学习预测的条件均值作为未来价格回报信号,在均值-方差投资框架中反映经济价值。资本市场主体基于预测信号配置权重,达到最优预期风险回报匹配,定量度量为确定等价收益率(CER),反映该预测信号的经济价值。因此,估值分析转化为模型预测能力与经济收益间的映射,准确衡量预测模型的实用性与盈利潜力。[page::4,30,44,67]

---

5 风险因素评估


  • 市场结构风险: 新加坡电力市场非完全自由化,监管政策调整影响价格结构,转型期可能导致预测误差。

- 宏观经济及地缘政治风险: 国际能源价格波动及地缘风险直接传导国内市场,可能造成模型训练数据与实际市场环境不匹配。
  • 数据缺失与质量风险: 参与者级别数据中存在缺失,尽管采用多模型插补方法,数据偏差仍可能影响模型性能。

- 模型过拟合风险: 复杂深度神经网络及树模型易出现过拟合,需依赖正则化和验证集调优缓解。
  • 结构性断点风险: 能源危机等重大事件导致市场结构突变,当前模型假设稳定关系可能受限。


报告通过断点检测及稳健性测试减缓以上风险,但未详述模型对未来非历史性极端情况的适应策略。[page::4,39,42,80,95]

---

6 审慎视角与细微差别


  • 模型表现指标多样且有异,有些统计指标(如$R{OOS,AR(1)}^2$)在个别模型上统计显著性不够强,提示模型不一与复杂环境交织。

- 滞后电价变量对解释力卓著,或反映市场高度自相关特征,但过度依赖可能掩盖其他变量预测潜力。
  • 不同特征重要性指标有差异,说明模型内部机制、统计方法对特征贡献评估影响显著,政策结论需兼听则明。

- 神经网络深度拓展虽提升表现,但计算与调参成本显著增加,泛化能力依赖正则化及集成,实务操作门槛较高。
  • 数据合成及插补技术虽先进,潜藏偏误风险,未来可通过更多实地验证和准则优化增强质量保障。

- 市场监管政策演变及宏观突发事件对模型影响具有时变性,固定模型结构可能限制长期稳定预测能力。

这些谨慎观点提醒研究者边界和应用时应平衡模型复杂度、数据质量与经济解释力。[page::2,4,41,46,80,90,100,107]

---

7 结论性综合



本报告系统性论证了机器学习技术在新加坡电力市场价格预测中的卓越表现及经济价值,主要贡献包括:
  • 机器学习捕捉电价预测中的非线性和高维复杂特征优势明确。

- 集成方法中创新的相关性惩罚加权显著提升模型组合性能与稳定性。
  • 模型性能的不仅具备统计显著性,更具实质经济价值,可为投资和风险管理提供决策支持。

- 预测能力在宏观经济扩张、高波动和地缘政治风险等条件下显著增强,揭示市场与全局经济紧密关联。
  • 特征重要性分析显示,市场以供给侧和监管因素为主导,且价格形成涉及宏观与市场交互,体现政策和经济多重作用复杂性。

- 结构断点检测反映市场在能源危机等重大事件中发生显著变化,说明预测模型需动态适应市场演进。
  • 设计严谨的多模型评估体系与解释框架,提高研究结果可信度与指导意义。


以上成果将机器学习的前沿技术与政策导向、宏观经济关联紧密结合,填补了电力市场预测的多方面空白,对电力行业参与者及监管政策制定者具有重要价值。

---

关键图表示例



图1 市场清算过程示意图





描述了三家发电企业报价与市场需求的交汇确定清算价,反映电价制定机制。

图2 集成模型动态权重






动态权重分布说明了包含相关性惩罚的集成模型更倾向于聚焦优质子模型。

图3 模型复杂度时间演变





展现不同模型核心复杂度动态,体现带来更好预测表现的潜在驱动力。

图4 电价收益与模型预测能力时间序列





蜡烛图展示电价收益波动与模型预测性能波动的动态关联。

---

总结



该报告全面细致地解析了机器学习在电力市场价格预测中的实证表现,不仅验证了其预测力和经济价值,还创见性提出了集成预测相关性的惩罚机制。通过丰富的市场与宏观数据融合及详实的特征解释,该报告为理解电力市场机制、提升预测技术和指导政策制定提供了有力工具。诸多统计验证和经济层面评估使其研究成果极具说服力和实用参考价值。报告同时也明确指出了模型复杂度、数据质量及结构性断点等潜在局限和风险,为未来深化研究和实践应用提供清晰方向。[page::0-119]

---

(以上分析所有结论均严格基于报告原文内容,页码溯源标识详见各段)

报告