`

利用深度神经网络改进时间序列动量策略——“学海拾珠”系列之一百三十九

创建于 更新于

摘要

本报告提出深度动量网络(DMN),结合深度神经网络和传统时间序列动量策略波动率缩放框架,直接输出交易头寸。通过对88份连续期货合约1990-2015年数据回测,LSTM架构下基于夏普比率优化的模型展现出最佳风险调整后表现,显著优于传统动量基准和其他机器学习模型。引入换手率正则化有效应对高交易成本环境,显示该模型适合流动性较强资产交易,为时间序列动量策略创新提供新路径 [page::0][page::3][page::5][page::8][page::10][page::11][page::12][page::13][page::15][page::16][page::18]

速读内容


深度动量网络(DMN)概述 [page::0][page::3]

  • DMN结合时间序列动量策略的波动率缩放框架,利用深度神经网络直接输出头寸,避免了传统两步估计误差累积和手动交易规则设计。

- 模型通过最大化风险调整后的收益指标(如夏普比率)进行训练,提升策略性能。

经典与深度学习动量策略回顾 [page::4][page::5][page::6]

  • 介绍了Moskowitz (2012)和Baz (2015)的时间序列动量头寸计算方法。

- 机器学习方法包括标准回归、分类和直接输出头寸三种,损失函数设计包含均方误差、二元交叉熵,以及针对收益和夏普比率的端到端优化。
  • 深度学习架构涵盖线性模型、多层感知机 (MLP)、WaveNet卷积和LSTM递归网络。


模型结构与训练细节 [page::8][page::9][page::10]

  • WaveNet基于扩张一维卷积,聚合周、月、季度信息;LSTM引入门控机制捕捉长期依赖。

- 使用带Dropout的Adam优化器训练,训练集90%,验证集10%,采用早停机制避免过拟合。

回测数据与基准比较 [page::10][page::11][page::12]

  • 数据涵盖88种期货合约,范围包括大宗商品、固定收益、货币期货,时间跨度1990-2015年。

- 参考基准为多头持有、Moskowitz Sgn(Returns)、Baz MACD指标信号。
  • 评价指标包含期望收益、波动率、下行偏差、最大回撤、夏普比率、Sortino比率和Calmar比率。


主要回测结果与性能分析 [page::11][page::12][page::13]

  • LSTM模型(基于夏普率损失函数优化)表现最佳,夏普率显著领先其他神经网络及基准,年化收益和回报波动率均表现优秀。

- WaveNet表现相对不佳,表明更复杂结构未必带来收益提升。
  • 直接输出头寸策略优于基于趋势估计的间接方法,证明端到端学习效果优越。

- 波动率缩放对机器学习模型改善明显,有助于统一风险水平。



单资产表现与信号多样性 [page::14][page::15]


  • 单资产夏普比率箱形图显示,LSTM Sharpe优化模型在资产池中波动率较低且收益稳定。

- 跨资产多样化及信号波动率缩放显著提升整体策略表现。

换手率与交易成本影响 [page::16][page::17][page::18]



  • 机器学习模型换手率较传统策略高约10倍,交易成本对盈利能力影响显著。

- 通过在训练中添加换手率正则化项,有效缓解了高成本环境下的性能衰退,尤其是在极端交易成本c=10bps情况下,正则化LSTM仍保持较好表现。

结论与展望 [page::18][page::19]

  • 深度动量网络结合非线性建模能力和波动率缩放框架,显著提升了时间序列动量策略的风险调整收益。

- LSTM模型为首选架构,端到端夏普率优化优于传统监督学习。
  • 未来研究可着重于数据非平稳性的处理和微观结构级别的动量策略探索。


深度阅读

利用深度神经网络改进时间序列动量策略——“学海拾珠”系列之一百三十九


全面详尽分析报告

---

一、元数据与概览


  • 报告标题:利用深度神经网络改进时间序列动量策略——“学海拾珠”系列之一百三十九

- 发布机构:华安证券研究所
  • 报告日期:2023年5月3日

- 分析师:分Ta析ble师 Au严th佳or(炜),骆昱杉
  • 主题:该报告聚焦于时间序列动量策略的改进,探讨利用深度动量网络(DMN)即基于深度学习的复合模型,改进经典时间序列动量策略的表现,通过机器学习尤其是深度神经网络自动学习交易信号,优化风险调整收益,推动动量交易策略的创新与性能提升。


核心论点:传统时间序列动量策略存在泛化能力差、误差累积大及规则依赖性强等局限。本文提出的深度动量网络可以直接拟合复杂的非线性时序动量策略,不依赖预定义交易规则,通过优化夏普比率训练,显著提升策略的风险调整性能。研究以连续期货合约为样本,实证结果显示基于深度学习的模型尤其是采用LSTM的深度动量网络,表现优于传统基准和其他机器学习方法[page::0][page::3]。

---

二、逐节深度解读



1. 引言



引言部分回顾了动量效应作为金融风险溢价的广泛文献支撑,强调时间序列动量策略主要依托价格趋势判断调整头寸。传统动量策略实现依赖对趋势的估计,且具体实施差异大,规则设计繁琐,易受噪音影响。

深度神经网络因擅长捕捉复杂非线性关系,且支持自动微分与反向传播,近年来被广泛应用于时间序列预测。本文提出框架将深度神经网络与波动率缩放相结合,直接输出风险调整后的交易头寸,减少对人工规则定义的依赖,从而实现更优的风险调整收益和策略解释[page::3]。

2. 相关研究



2.1 经典动量策略


动量策略分横截面动量和时间序列动量。横截面动量基于相对表现排序,时间序列动量则关注单个资产的历史表现趋势,广泛使用基于过去12个月收益的信号,配合波动率缩放。
文献总结了现有多种趋势估计与头寸计算方法,实际头寸设计缺乏统一标准,策略差异大且缺乏明确优劣比较。文章因此强调以深度神经网络自动“学习”头寸函数,即从数据驱动寻找最优曲线,避免人为规则设计缺陷[page::4]。

2.2 深度学习在金融领域的应用


机器学习特别是深度学习已被用于价格趋势预测、收益排序等任务,大多数文献将问题转化为回归或分类。然而,采用经典监督学习进行趋势估计存在多个问题:
  • 趋势预测忽视风险调整,无法防范极端行情损失

- 分类准确率与策略盈利能力并非成正比
  • 需要人工定义多项决策规则,决策阈值和头寸映射均需外部指定


本研究创新点在于,深度学习模型直接输出风险调整后的交易头寸信号,且训练目标直接优化夏普比率,兼顾收益和风险,提升了策略效能和稳健性[page::4][page::5]。

3. 动量策略定义



3.1 标准交易规则


标准时间序列动量策略包含两个步骤:趋势估计和头寸配置。以Moskowitz et al.(2012)为例,趋势通过过去252天累计回报衡量,头寸取符号函数指示多空。

Baz et al.(2015)提出基于波动率标准化的MACD信号,并用特定头寸映射函数$\phi(y)$(图表1)将信号映射为头寸,允许信号在极端情况下减仓,以减少追涨杀跌的风险。多尺度信号如不同短长期窗口信号加权平均进一步优化信号稳定性[page::5][page::6][page::7]。

3.2 扩展机器学习方法


机器学习模型通常分两步:先预测趋势(回归/分类),后按阈值映射头寸。文中详细写出回归/分类损失函数,并说明软映射和手动决策需求。

创新在于直接输出头寸,不分离趋势和头寸步骤,利用可微损失函数在网络训练中优化平均收益和夏普比率目标,最大化风险调整收益至策略优化核心。

这避免了人为系列设计决策,采用端到端训练,充分利用数据结构,优化效果更佳[page::7][page::8]。

4. 深度动量网络



4.1 模型结构

  • Lasso回归:简单线性模型,结合$L_1$正则化控制权重稀疏。

- 多层感知机(MLP):两层以上全连接层,激活函数采用tanh或sigmoid,提升非线性拟合能力。
  • WaveNet:基于扩张卷积的时序卷积神经网络,捕获多时间尺度信息,平级残差连接保障信号清晰传递。

- LSTM:递归式神经网络,具遗忘门、输入门、输出门,擅长捕获长期依赖和序列动态。

上述网络均可输出回归值、概率或直接头寸,训练时使用灵活的激活函数和损失函数搭配。本文研究中批量大小、时间跨度超参数均予以规范[page::8][page::9][page::10]。

4.2 模型训练细节


采用Adam优化器,训练时90%数据用于训练,10%验证集用于提早停止判断。应用dropout等正则化方法防止过拟合,针对不同网络结构设置不同dropout策略,如LSTM采用Gal-Ghahramani方案。

---

5. 模型收益评估



5.1 数据集概述


使用Pinnacle Data的88个连续期货合约,涵盖大宗商品、利率、货币期货,1990-2015年历史数据,样本丰富,覆盖多重资产类别。

5.2 回测说明

  • 每5年重新训练模型。

- 输入特征包含日、月、季、年标准化收益及多尺度MACD指标。
  • 设定15%年波动率目标波动率缩放等。

- 套用传统基准(纯多头,Moskowitz Sgn(Returns),Baz MACD)作对比。
  • 用预期收益、波动率、下行偏差、最大跌幅、Sharpe、Sortino、Calmar等多指标评估策略表现。


5.3 结果展示


  • 总体表现(图表2、3)

LSTM模型(特别是优化夏普比率版本)表现卓越,以夏普率0.45遥遥领先其他模型,风险指标如波动率、下行风险及最大回撤也显著改善,显示其风险调整后的优异性。
MLP表现次之优于线性模型和传统基准。
WaveNet表现不及LSTM,说明额外网络复杂度不一定带来显著收益。
  • 损失函数影响(图表4)

夏普优化损失优于仅收益最大化和标准回归、分类,端到端生成头寸的训练模式表现最佳,进一步验证基于风险回报的训练设计的价值。
  • 单资产表现(图表5)

单资产层面显示直接输出头寸的模型波动率明显降低,且在收益范围内表现更稳健。波动率缩放策略确保信号波动率维持在理想目标,避免过度波动。
  • 换手率分析(图表6、7)

机器学习模型换手率普遍高于传统基准,可能导致较高交易成本。Sharpe优化的LSTM在成本调整后的夏普率减幅仍小,表现相对稳健,适合流动性较高资产。
  • 换手率正则化(图表8)

通过训练中引入换手率成本正则化,尤其是在交易成本高达10bps极端情况下,LSTM模型回归正收益和风险调整收益的正向表现,有效控制了换手率,提升模型稳健性。

---

三、图表深度解读



图表1:头寸计算函数$\phi(y)$



该函数表明在对应信号幅度$|y|$小于1.41时,仓位随着信号绝对值扩大而增加,超出阈值后仓位递减,避免了在极端信号情况下的过度头寸暴露。图形明确揭示了波动率标准化的MACD信号如何被非线性函数映射为头寸[page::6]。

图表2与图表3:表现度量指标(原始输入与波动率缩放)


  • 图表2展示未波动率缩放下的策略收益与风险指标,波动率指标呈较大差异,比较各策略风险收益状况。

- 图表3应用波动率缩放后收益指标调整至统一风险水平(15%),使得不同策略的风险收益比更合理比较。
  • 从两图看,深度学习模型在波动率缩放后表现显著改善,特别是LSTM夏普率高达0.45,以下指标均优于传统基准。


图表4:累计收益曲线



四个子图显示了不同损失函数训练模型(夏普率优化、平均收益优化、MSE回归、二元分类)在2000-2015年间的累计权益曲线。
  • 夏普率优化的LSTM实现了最大的正向复利增长,曲线平滑且上涨趋势稳定。

- 其他模型(如传统基准、回归模型)表现为较低的增长速率。
  • 二分类模型效果最差,权益线表现接近平坦,说明分类准确率高低不一定对应策略表现。


图表5:单资产表现箱线图


  • 分别展示单个资产上的Sharpe比率、期望收益及波动率分布。

- 直接输出模型夏普较高且波动率较低,最优策略能够更好地控制波动风险。
  • 波动率缩放使得各资产波动率控制在目标范围,保证多资产组合整体风险水平稳定。

- 此图支持深度动量网络中的关键要素:波动率缩放、端到端优化、夏普率最大化。

图表6:换手率分析


  • 揭示机器学习模型换手率大幅高于传统策略,交易频率较高,实际应用时需考虑交易成本与流动性风险。

- 换手率与平均日收益比率关系图显示机器学习模型在换手率高的同时收益并未翻倍增长,表明换手率对回报的边际贡献有限。

图表7:交易成本对夏普率影响


  • 展现不同假设交易成本(0-5bps)条件下,策略夏普率递减情况。

- 机器学习模型(尤其LSTM)对低至中等交易成本区间表现出良好弹性,仍具较高夏普率。
  • 参考基准模型对高成本适应性更强,但收益基准较低。


图表8:换手率正则化效果


  • 在训练中直接考虑交易成本作为正则项,有效控制换手率,提升高交易成本环境下模型收益表现。

- LSTM+Reg绩效指标显著优于未正则化版本,复合深度动量网络的容错能力大幅提升。

---

四、估值分析



当前报告不涉及具体公司或资产的估值分析,重点在于策略开发与回测,因此无相关估值模型讨论。

---

五、风险因素评估



报告强调:
  • 深度动量网络结构依赖历史数据和海外相关学术成果,模型表现基于历史模式,不构成投资建议。

- 换手率高带来的交易成本风险,特别是在流动性不足的品种。
  • 模型训练依赖超参数调优和网络结构选择,复杂网络存在过拟合及参数优化难度。

- 波动率估计及未来市场结构变化可能导致模型表现偏差。
  • 换手率正则化虽有效,但高成本环境下仍需谨慎。


报告未详述风险缓解策略,但引入正则化和多次重新训练、波动率缩放均是防范风险的关键机制[page::0][page::16][page::18]。

---

六、批判性视角与细微差别


  • 报告中WaveNet模型表现较差,表明深度学习“复杂即优势”假设需要谨慎检验,超参数空间和训练复杂度对实际效果影响显著。

- 直接输出头寸的端到端模型虽性能优越,但对模型训练的稳定性与泛化能力依赖较大,样本外测试及多轮训练非常关键。
  • 换手率高问题在实际投资中不可忽视,报告虽提出正则化方法,但实际实现策略还需进一步测试真实交易环境约束。

- 训练数据区间为1990-2015年,未来市场环境变化可能导致模型表现下滑,模型对非平稳性处理有限,未来研究需拓展。
  • 交易信号映射复杂且非透明,模型解释性较弱,投资者应注意策略黑箱特性及潜在过拟合风险[page::13][page::18]。


---

七、结论性综合



本文通过引入深度动量网络,将深度神经网络与经典时间序列动量策略中的波动率缩放框架结合,开发了一种端到端优化交易头寸的风险调整模型。LSTM架构配合夏普比率最大化的损失函数,展现出极佳的风险调整后绩效,远超传统基准策略及线性/MLP/WaveNet模型。

具体表现在:
  • Sharpe比率从传统策略的0.15左右跳升至0.45,收益风险结构显著优化。

- 换手率虽较高,但通过训练引入换手正则化,有效缓解高交易成本下策略表现恶化。
  • 多时间尺度特征输入、波动率缩放及模型结构设计均显著影响最终绩效。

- 端到端风险调整训练显示优于经典回归或分类预测先行再映射策略,强化了机器学习在量化交易策略设计中的价值。

报告同时提醒,该策略基于历史数据及模型训练,存在适用性与泛化风险,不构成任何投资建议。模型对于实时市场环境变化、微观结构风险仍需深入研究,未来可结合递归神经滤波器等技术以提升非平稳数据处理能力[page::0][page::18][page::19]。

---

总体评价



本报告系统介绍了深度学习在时间序列动量策略中的创新应用,从策略定义、模型设计、训练细节,到丰富的实证回测与交易成本分析,内容详实且紧扣当下量化投资热点,分析透彻。通过大样本多资产的验证,展示了深度动量网络相较传统动量策略和其他机器学习方法的明显提升,具备较高的实践参考价值。

同时,报告清晰呈现了各模型的优势与局限,强调风险警示及未来研究方向,客观科学,严谨专业,尤其适合对量化策略及深度学习应用感兴趣的金融工程师、量化投资者及研究人员深入学习与借鉴。

---

参考标注


报告内引用页码已严格标注,详见每段文字末尾的[page::x]

---

报告