`

AI+HI 系列(3):人工智能在选股与 ETF轮动上应用

创建于 更新于

摘要

本报告重点研究了基于多时序深度学习模型集成的量价因子在A股选股和ETF轮动上的应用。通过GRU、PatchTST、Transformer、TSMixer与ModernTCN模型的融合,构建Ensemble_factor,显著提升了IC均值与稳定性。该集成因子在全A、宽基指数、风格池及基金重仓股均表现出优秀的因子区分度和分组收益能力,并基于该因子实现选股及ETF轮动策略,长期超额收益显著,ETF轮动策略年化收益率达11.7%(宽基类)和16%(行业主题类),均优于沪深300基准,展现出人工智能在量化投资领域的有效应用与潜力,为投资者提供了创新量化工具及方法论 [page::0][page::5][page::10][page::12][page::20][page::27][page::29]

速读内容


AI深度学习多模型集成构建量价因子 [page::0][page::9]

  • 集成因子由GRU、PatchTST、Transformer、TSMixer和ModernTCN五个时序深度学习模型融合构成。

- GRU模型具备较低相关系数且双任务训练提升表达,增强模型多样性。
  • 集成后因子IC均值提升至0.101,年化ICIR达6.37,因子稳定性和抗噪声能力显著增强。

- 多个池(全A、宽基、风格池、基金重仓股)均获得70%以上的IC正值占比,示因子广泛适用。

Ensemblefactor因子回测表现优异 [page::12][page::14][page::16][page::18]


| 股票池 | IC均值 | IC中位数 | IC>0占比 | 年化IC_IR | 多头年化收益率 | 最大回撤 | 换手率 |
|-------------|--------|----------|----------|-----------|----------------|----------|--------|
| 全A | 0.101 | 0.108 | 80.3% | 6.37 | 27.5% | 20.8% | 66.45 |
| 沪深300 | 0.079 | 0.075 | 70.0% | 3.78 | 见图表 | 见图表 | - |
| 中证500 | 0.083 | 0.089 | 74.2% | 4.52 | 见图表 | 见图表 | - |
| 中证1000 | 0.095 | 0.098 | 79.4% | 5.72 | 见图表 | 见图表 | - |
| 风格池 | 0.08 | 0.084 | 70.3% | 4.0 | 23.6% | 15.5% | 61.34 |
| 基金重仓股 | 0.081 | 0.088 | 75.2% | 4.7 | 21.18% | 21.97% | 65.98 |
  • 不同池分组测试均有显著分层收益,信息比率指标处于行业领先水平。

- 持仓风格多样,大盘价值权重显著提升,策略适应市场风格切换。

选股策略实证回测 [page::20][page::23]

  • 风格池选股策略2018年以来年化收益12.1%,最大回撤23.4%,相对收益8.9%。

- 基金重仓股选股策略2018年以来年化收益13.5%,最大回撤27.8%,相对收益12.1%。
  • 持仓行业广泛,银行、化工、公用事业和医药行业权重较大,股票市值多属于中大型股。

- 持仓个股涵盖中大型机构重仓品种,具备较强的市场代表性。

ETF轮动策略设计与表现 [page::25][page::27][page::28]

  • 利用个股集成因子下沉至ETF持仓,以流动性筛选后将ETF划分为宽基风格和行业主题两类。

- 应用DoubleTopK方法构建ETF多头组合,每期选取得分最高的10只ETF。
  • 宽基、风格ETF轮动策略(2019-2024)年化收益率11.7%,超额沪深300 8.5%,最大回撤29%。

- 行业、主题ETF轮动策略年化收益率16%,超额沪深300 12.8%,最大回撤21.9%。
  • 年度超额收益稳定,2023年回撤显著低于主动基金中位数,2024年策略持续跑赢基准。




主要风险提示 [page::30]

  • 策略基于历史数据回测,不保证未来数据的有效性,投资需谨慎。

深度阅读

华创证券金融工程组研究报告详尽分析


报告题目、作者、主题概览

  • 标题:《AI+HI系列(3):人工智能在选股与ETF轮动上应用》

- 发布机构:华创证券研究所金融工程组
  • 作者:秦玄晋、王小川等,均为金融工程领域资深分析师

- 发布时间:2024年初
  • 研究主题:将多种先进时序深度学习模型(包括GRU、PatchTST、Transformer、TSMixer、ModernTCN)集成应用于A股选股策略及ETF轮动投资策略

- 核心信息
- 通过多模型集成构建量价因子,提升因子的表现稳定性和区分度(IC指标)。
- 在全市场、宽基指数、风格池、基金重仓股等不同股票池多场景验证集成因子的有效性。
- 首次将集成量价因子自下而上应用于ETF评分和轮动,实现显著超额收益。
- 报告强调策略基于历史回测,存在未来有效性不确定风险。
- 总体传递讯息为:人工智能深度时序模型能够有效提升量价因子的选股能力并拓展至ETF轮动策略,推动量化投资革新。 [page::0,1] [page::30]

---

一、策略回顾及时序网络概述



1. GRU选股策略历史回顾

  • 表现回顾

- 2018年起至今GRU选股策略整体表现优异。
- 特别是在2023年底至2024年2月市场震荡期间,GRU策略实现正收益(2.33%),相比中证1000指数同期跌12.1%盈余超额收益达14.43%。
- 策略在股票风格上偏重大盘价值,结合基本面严格筛选,有效避开中小盘回撤的风格风险。
- 2024年2月底累计绝对收益3.48%,在2945个股票/偏股混合基金中排名前8.5%。
  • 风格持仓分析(见图表2、3、4):

- 2023年12月至2024年2月大盘价值仓位最高,尤其2月23日达到55%。
- 平均大盘仓位72%,小盘28%,大盘质量和大盘成长仓位次高,反映策略顺应市场风格转变。
- 该风格与沪深300和上证50表现稳定的市场环境相匹配。

2. Canslim和人气策略回顾

  • Canslim策略2023年12月以来绝对收益8.66%,相对于偏股混合基金指数超额收益15.62%,受益于成长因子反弹。

- 人气策略聚焦基于情绪和人气指标,小盘偏好,至今绝对收益-5.81%,超额收益6.29%,表现稳健。

3. 行业轮动现象与策略

  • 通过追踪中信一级行业自2018年来半年度涨幅,煤炭、银行、石油石化及非银金融表现较好,行业轮动明显。

- FESC行业轮动策略在2023年12月以来实现0.18%的绝对收益,相对偏股混合基金指数超额收益5.01%。

总结部分说明GRU模型在风格快速切换的市场中,依托基本面筛选的组合仍具稳定性和超额表现。 [page::5,6,7,8]

---

二、深度时序因子集成



(一)模型概述

  • 集成使用五种时序深度学习模型:

- GRU:循环神经网络,捕捉时序依赖,采用双任务训练增强泛化性。
- PatchTST:基于Transformer自注意力机制的Patch分段时序处理。
- Transformer:全局时序特征建模。
- TSMixer:基于MLP的轻量级时序数据混合模型。
- ModernTCN:卷积神经网络架构的新型时序处理网络。
  • 模型输入为高、开、低、收、成交量、均价等多变量序列,经Patch切分嵌入,骨干网络处理后输出用于回归或分类任务。

- GRU结构图显示隐状态传递和门控机制,有效捕获长期依赖。

(二)时序因子相关性分析

  • 因子间相关性:

- GRU因子与其他四个模型相关性较低(0.55-0.65),其他四因子间相关性高(>0.8),体现模型间特征提取的差异性。
  • 低相关性利于集成模型提高综合表现。


(三)单因子测试

  • IC指标显示五种模型IC均值均在0.084~0.099间,年化ICIR最高近6。

- TSMixer表现最优,GRU在IC大于0占比达到81.3%最高。
  • 按全A多头分组回测,GRU的年化收益和夏普比率最高,TSMixer紧随其后。


(四)集成因子及全A测试

  • 实施两阶段中性化集成策略:先合成ModernTCN、PatchTST、Transformer、TSMixer,然后将GRU和该组合合成为Ensemblefactor。

- Ensemblefactor在全A股表现显著提升:IC均值提升至0.101,中位数0.108,年化ICIR达到6.37。
  • 因子分组回测显示最大年化收益27.52%,最大回撤20.84%,夏普比率1.28,换手率66.45,全面优于单一GRU因子。


整体上,深度模型集成有效增强时序因子的强度与稳定性。 [page::9,10,11,12]

---

三、宽基、风格及基金重仓股测试



1. 宽基指数测试

  • 集成因子在沪深300,中证500,中证1000三大宽基均表现稳健:

- IC均值分别为0.079,0.083,0.095,中证1000表现最佳。
- IC大于0占比均超过70%。
  • 分组超额收益稳健且显著,特别是中证1000,累计超额收益持久。

- 年度超额收益多正,19年稍差主要因市场环境及样本变动。

2. 风格池测试

  • 市场风格已经有规律的六大风格指数,策略历史表现对应风格变换做出适应。

- 风格池的IC平均约0.08,年化ICIR超过4,分组测试收益最高可达23.56%年化收益,最大回撤15.47%。
  • 策略持仓行业多元分散,银行、化工等行业仓位高,市值偏大,具备良好抗风险能力。


3. 基金重仓股测试

  • 基金重仓股范围广,覆盖中证800及中证1000大部分股票,股票池市值中位数较高,具备可投资性。

- 集成因子IC均值0.081,高于风格池,IC大于0占比达75.2%。
  • 基金重仓股内回测年化收益21.18%,最大回撤21.97%,年化超额收益20%+,表现明显优于基准。

- 最新组合持仓多为机构重仓知名蓝筹或行业龙头,体现策略的实际可操作性。

整体表明集成因子适配证券市场多不同投资样本,具有良好的横向迁移能力和稳定表现。 [page::12,13,14,15,16,17,18,19]

---

四、应用:选股组合与ETF轮动策略



1. 风格池内选股组合回测

  • 选股依据为每周定期调仓,选择风格池里因子得分前30名个股,等权重持有,单股持仓最大不超过5%。

- 2018-2024年2月15年长期测试,年化收益12.1%,最大回撤23.4%,换手率58倍。
  • 净值曲线明显跑赢风格基准池及中证1000、沪深300指标。

- 持仓行业广泛,银行、化工、交通运输等行业占比较高,仓位配置均衡且偏向大市值股票。
  • 最新持仓名单覆盖金融(中国平安、建设银行等)、制造业、医药、消费等核心行业龙头。


2. 基金重仓股选股策略

  • 同样的调仓规则,基金重仓股池因个股质量高,流动性良好,基金重仓股为基准。

- 回测结果更为优异,年化收益13.5%,最大回撤27.8%,产品换手率77倍。
  • 净值明显优于基金重仓股基准池以及沪深300和中证1000。

- 持仓行业以医药、公用事业、银行等传统蓝筹为主,偏大盘价值风格。
  • 最新持仓同样涵盖了多只基金重仓行业龙头。


3. ETF轮动策略

  • 由于ETF数量少且样本较小,采用自下而上方式,用选股因子对ETF持仓组合加权评分。

- ETF筛选中,剔除成交不足2000万日均的,保证流动性。
  • ETF按行业主题类和宽基风格类分类,筛选后分别构建两个轮动组合。

- 每周采用DoubleTopK调仓方法,选择得分最高的10只ETF分散投资。
  • 2019年至2024年ETF轮动策略表现突出:

- 宽基风格ETF年化收益11.7%,基准沪深300年化3.1%,超额收益8.5%。
- 行业主题ETF表现更优,年化16%,超额12.8%。
- 策略表现稳健,最大回撤29%(宽基)和21.9%(行业主题),盈亏比和正收益天数均优于基准。
- 年度超额收益稳定,多年保持正超,策略适应性强。

ETF轮动策略示意图及净值回测
ETF轮动策略净值表现

[page::20,21,22,23,24,25,26,27,28,29]

---

五、估值与风险提示


  • 本报告主要聚焦策略构建与因子表现,未具体披露估值模型细节,主要偏向量化投资策略解析。

- 风险提示中明确说明所有策略均基于历史数据回测,不保证未来表现及数据有效性。
  • 未来市场环境、因子有效性变化、模型过拟合、流动性风险、交易成本等均可能对策略表现产生影响。

- 报告建议投资者理性评估策略适用性,关注策略潜在波动和回撤风险。 [page::30]

---

六、分析总结与批判性视角



关键发现综述

  • 本报告创新性地将多种领先的深度学习时序模型集成,用于构建股票及ETF量价因子,显著提升了因子的有效性与鲁棒性。

- 集成因子(Ensemble
factor)在多级市场样本(全A、宽基指数、风格池、基金重仓股)均表现稳健,展示出较强的横向适应性和选股区分能力。
  • 特别是将个股集成因子自下而上映射至ETF评分,实现了多维度的ETF动态轮动,年化收益和超额阿尔法表现优异,凸显AI+HI在资产配置上的潜力。

- 风格切换、行业轮动、市场结构变化均被模型在回测中良好捕捉,策略具备一定环境适应效果。

图表数据洞察

  • 各类图表中,IC指标中位数均超过0.08,稳稳高于业界常见阈值,表明因子稳定可信赖。

- 回撤控制合理,多数组合最大回撤控制在25%~30%以下,夏普比率稳定,换手率适中,交易成本可控。
  • 持仓结构显示策略趋于偏好大市值且行业分散,帮助风险分散。

- ETF轮动净值曲线显著跑赢沪深300,超额收益体现在多数年份,说明模型对ETF池的有效覆盖。

审慎视角

  • 报告大篇幅依赖回测结果,缺乏对模型参数稳定性、过拟合风险及样本外验证的深入讨论。

- 主要输入特征限定为传统量价指标,未涉及基本面、宏观策略等多维因子,模型可能忽略部分非价格信息。
  • ETF评分自下而上的构造方式假设基金持仓信息真实及时且具代表性,短期内信息披露不对称可能影响信号质量。

- 2024年样本外仅覆盖约3个月,虽表现良好但需持续验证。
  • 模型对市场剧烈异常波动(如极端黑天鹅事件)适应性暂未充分体现。

- 风险提示较为简略,投资者需结合市场实际进行风险管理。

整体来说,报告提供了前沿且系统的AI深度模型集成框架及其在量化选股和ETF领域的落地应用范例,但依然需要结合非量化因子、丰富实盘验证与风险管理提升策略稳健性。 [page::29,30]

---

七、结论性综合



本篇《AI+HI系列(3):人工智能在选股与ETF轮动上应用》报告,华创证券金融工程组通过对GRU、PatchTST、Transformer、TSMixer、ModernTCN等多时序深度学习模型的有效集成,创新构建了具有更高稳定性和区分度的量价因子(Ensemblefactor)。此因子在A股市场的多个主流股票池测试均获得显著正IC,多头组合年化收益率普遍超过20%,表现优于单因子模型。

结合选股策略与行业轮动分析,该因子能灵活捕捉市场风格及行业趋势,具备较强的适应力。基金重仓股和风格池回测表明策略不仅理论性能优良,且具备良好的应用实操基础,持仓行业广泛且稳健。最新持仓包括多只大盘蓝筹及行业龙头,具有真实投资价值。

首次将该集成因子推广应用于ETF轮动策略,以实时更新的ETF持仓及流动性信息为基础构建多层次评分体系,开展宽基及行业主题ETF动态轮动投资,长期实现了远超沪深300的年化回报(11.7%至16%)、优异的阿尔法水平。分年表现稳健,最大回撤控制合理,盈亏比和正收益天数均高于基准,验证了AI+HI深度模型在资产配置特别是ETF领域的潜力和实用性。

报告充分展现了人工智能深度学习技术在金融工程领域的应用前景和实践价值,对投资者量化选股和ETF配置决策提供了可靠量化工具和研究思路。

然而,报告对未来风险和模型潜在局限的讨论较为简略,需警惕历史数据回测与真实市场环境差异带来的效果折损。未来结合宏观因子、多维基本面数据和完善风险控制,及更长时间段的实盘验证,将进一步提升模型的稳健性和实用性。

综上,报告立场明确,评级积极,指出利用多模型深度学习集成提升量价因子及ETF轮动策略效能,为量化选股和资产配置工具创新提供了前沿范式和重要参考。 [page::0~29]

---

附图部分示例解析如下:


  • 图表1 GRU 策略净值曲线 展示了2018年至2024年2月底期间GRU模型选股策略的净值增长,横跨多轮市场周期,在2023年底大盘表现分化时依然实现正收益。曲线走势稳健且优于中证1000基准,充分证明策略的收益稳定性和抗跌能力。

图表1
  • 图表9 模型流程示意图 详细披露了PatchTST、TSMixer、ModernTCN的时序深度学习设计架构,说明量价序列如何被切分成Patch并嵌入,骨干网络利用自注意力/MLP/CNN提取时间和变量维度特征,体现了现代时序深度学习建模技术的先行标准。

图表9
  • 图表14 全A因子IC统计结果表 显示集成因子在全A股票池的平均IC提升至0.101,年化信息比率(ICIR)为6.371,说明因子在样本内的稳健预测能力和显著的选股信号强度提升。

- 图表15 全A因子IC历史表现曲线 反映集成因子在近五年的IC表现虽有波动,但整体稳定维持正向预测能力,长尾效应指标较好。
  • 图表17 全A因子分组超额收益曲线 体现因子对股票排序的有效区分,前几组超额收益明显高于基准线,验证了因子强分辨力。

- 图表56 宽基和风格ETF轮动回测净值曲线 2019年以来组合净值明显优于沪深300,表现出该投资策略在ETF领域的良好应用前景。
图表56

---

结语


本报告系统性梳理并验证了基于人工智能多模型集成的量价因子构建及应用,融合时序网络和量化选股策略,首次将该方法创新应用于ETF轮动投资,展示了量化技术在实际投资场景中落地的强大潜力。投资者可关注该策略在多样市场条件下的表现持续跟踪,并结合自身风险控制深化应用。

---
注:以上分析中所有数据点、图表信息均来自相应页码的报告内容,确保信息来源准确可追溯。

[end of analysis]

报告