`

多因子量化选股系列之五 ——因子的加权与正交

创建于 更新于

摘要

本报告系统介绍多因子量化选股中因子加权与正交技术,重点比较四种加权方法(等权、筛选后等权、IC均值加权、ICIR加权)在六大类风格因子(质量、成长、北向资金、分析师预期、技术因子)上的应用效果。通过正交处理显著降低因子间相关性,提升了模型稳健性。在中证500指数增强策略构建中,基于正交因子的策略较原始因子策略表现更优,年化超额收益达11.68%,信息比率为2.28,Calmar比率为1.52。报告详尽回测结果显示,筛选后等权与IC加权方法在多数因子中表现最好,提供了实用的因子合成建议与量化实操指导。[page::0][page::3][page::21][page::22]

速读内容


因子加权方法概述 [page::3][page::4]

  • 报告介绍四种因子加权方式:等权加权、筛选后等权加权、IC均值加权、ICIR加权。

- 筛选后等权根据因子过去6个月收益筛选正收益因子加权;
  • IC均值与ICIR加权则基于过去12个月因子有效性调整权重。

- 加权方法为因子组合效率提供不同权重分配思路。

六大类别因子加权效果对比 [page::6–10]

  • 质量因子:筛选后等权加权表现最佳,年化收益9.55%,Sharpe 1.19。

- 成长因子:筛选后等权效果最好,年化收益20.48%,Sharpe 2.45。
  • 北向资金因子:ICIR加权表现优异,年化收益12.03%,Sharpe 1.71。

- 分析师预期因子:IC加权稍优,年化收益9.22%,Sharpe 1.28。
  • 技术因子:等权加权为最佳,年化收益17.78%,Sharpe 1.7。


因子正交处理方法与效果分析 [page::10–18]

  • 采用线性回归残差做因子正交,降低因子相关性。

- 保留表现最佳的初始因子,剔除表现较差的残差因子。
  • 正交后IC加权方法在质量因子、北向资金因子表现最佳。

- 筛选后等权加权在成长因子表现最佳,ICIR加权表现最佳于分析师预期因子。
  • 技术因子正交后等权加权效果最佳。


多因子合成及指数增强策略表现 [page::19–22]

  • 各类因子优选加权方法如下:


| 因子分类 | 原始因子 | 正交因子 |
|---------|------------|------------|
| 质量因子 | 筛选后等权 | IC加权 |
| 成长因子 | 筛选后等权 | 筛选后等权 |
| 北向资金 | ICIR加权 | IC加权 |
| 分析师预期 | IC加权 | ICIR加权 |
| 技术因子 | 等权 | 等权 |
  • 大类因子最终采用等权合成方法简化建模。

- 原始合成因子多空组合年化收益22.01%,Sharpe 2.51;
  • 正交合成因子收益略增至22.24%,但波动与回撤稍大,Sharpe 2.4。

- 基于正交因子的指数增强策略回测显示2018年至2023年超额基准年化收益11.68%,信息比率2.28,Calmar比率1.52,整体表现优于原始策略。






深度阅读

湘财证券《多因子量化选股系列之五——因子的加权与正交》报告详尽分析



---

1. 元数据与概览


  • 报告标题: 多因子量化选股系列之五——因子的加权与正交

- 作者: 王宜忱
  • 发布机构: 湘财证券研究所

- 发布日期: 2023年(具体未明示,但最后回测样本截止到2023年5月)
  • 主题: 多因子量化选股策略中因子的加权及因子正交处理方法;通过不同加权方法提升因子表现,利用正交减少因子间相关性,提升组合稳健性和策略收益。

- 核心论点:
报告详细介绍了四种多因子加权方法(等权、筛选后等权、IC均值加权、ICIR加权),并对因子进行正交处理以降低相关性。通过实证回测对比,针对不同风格因子(质量、成长、北向资金、分析师预期、技术因子)选取最优加权方法。正交处理后因子组合在构建中证500指数增强策略上表现更优,提升了超额收益和信息比率。
  • 目标价与评级: 本报告属于策略工具和方法论研究,无具体评级或目标价。报告强调基于历史数据,存在因子失效风险。


报告旨在为量化选股模型提供科学合理的因子加权与正交方案,增强策略的有效性和鲁棒性。[page::0,3,22]

---

2. 逐节深度解读



2.1 加权方法概述



报告回顾了多因子策略流程中因子加权的重要性。具体介绍了4种加权方法:
  • 等权加权(Equal Weighting): 对全部因子同等赋权(权重=1/n)。方法简单,不考虑因子历史绩效。

  • 筛选后等权加权(Filtered Equal Weighting): 根据因子多头组合过去6个月收益剔除表现为负的因子,仅对表现正因子等权加权。假设因子表现具有持续性。如果所有因子均被剔除,选取年度内表现最优因子。

  • IC均值加权(IC Mean Weighting): 利用过去12个月因子IC均值调整权重,仅考虑IC均值正的因子,并按比例赋权。反映因子预测能力的强度。

  • ICIR加权(ICIR Weighting): 根据因子过去12个月的IC信息比率(ICIR)赋权,体现因子有效性的稳定性。剔除ICIR为负的因子。


因子加权数学式为 $$ Fac = \sum{i=1}^{n} wi * fi $$。不同加权方法本质上是通过不同的权重配置,期望提升因子组合的表现。参数和样本范围包括Wind全A或中证500作为股票池,剔除ST、退市、停牌。回测时间覆盖2017年12月至2023年5月,月度调仓。处理包括异常值剔除、中性化(行业和市值)等。[page::0,3,4]

---

2.2 因子的加权与表现对比(分类别)



报告对六大类因子中五类展开深入探讨(估值因子仅含单一因子,因此未展开)。

2.2.1 质量因子


  • 质量因子包括净资产收益率(ROE)相关指标和资产周转率等。

- 多种加权方法中,筛选后等权加权表现最佳:多空组合年化收益9.55%,Sharpe比率1.19,Calmar比率0.46。IC和ICIR均保持适中水平。
  • 其他加权方法IC和ICIR稍低,等权加权表现最弱且回撤大(见图1,表2)。

- 从净值曲线看,筛选后等权组合回撤较小且回报更稳定。[page::6]

2.2.2 成长因子


  • 包括营收同比、净利润同比、毛利率同比等多项指标。

- 筛选后等权加权表现最好,年化收益20.48%,Sharpe尤其高达2.45,Calmar也达1.26,说明风险调整后收益优秀。
  • 等权加权表现次之,IC及ICIR均较高,IC与ICIR加权方法表现逊于筛选法。

- 净值曲线显示筛选后等权从2021年9月后优势更明显(图2,表3)。[page::6,7]

2.2.3 北向资金因子


  • 反映境外资金流入的指标。

- ICIR加权方法表现最佳,年化收益12.03%,Sharpe 1.71。
  • 其余方法表现较为平均,但ICIR权重法在2021年后净值持续抬升明显优于其他。

- 如图3、表4所示。[page::7,8]

2.2.4 分析师预期因子


  • 数据主要来源于分析师滚动一致预测的净利润变动。

- IC加权稍优于ICIR加权,年化收益9.22%,Sharpe 1.28,Calmar 0.89。
  • 筛选后权重和等权均表现一般。

- 图4及表5显示IC及ICIR均较低但稳定。[page::8,9]

2.2.5 技术因子


  • 包括动量、换手率波动、成交额等指标。

- 等权加权表现最优,年化收益17.78%,Sharpe 1.7,Calmar 1.04。
  • 筛选后等权、IC与ICIR加权效果较差。

- 图5和表6显示等权的稳健性和较高IC。
  • 说明技术因子中简单权重优势明显。[page::9,10]


---

2.3 因子的正交处理



为降低因子间多重共线性以及其导致的模型不稳健问题,报告采取线性回归残差法对因子做正交处理。步骤包括:
  1. 挑选表现最佳的因子作为初始因子。

2. 其他因子对该初始因子做线性回归,残差视作正交因子。
  1. 检验正交因子的有效性,剔除表现差的残差因子。

4. 利用正交因子与原始因子共同加权生成新因子组合。

具体五类因子的正交处理结果:
  • 质量因子:

以净资产收益率
超预期因子(roestd)为初始因子,资产周转率残差因子表现较弱,净资产收益率单季度残差表现极差被剔除。IC加权正交因子表现最优,年化收益达10.74%,Sharpe 1.42。[page::11,12]
  • 成长因子:

选择净利润单季度同比(nptquayoy)为初始因子,其他正交因子有效性均下降,但仍保留。筛选后等权和等权组合表现较优,年化收益约17%,Sharpe约1.9。[page::12-14]
  • 北向资金因子:

初始因子为北向资金净流入
20日(nmpdif20),60日净流入残差因子表现极差剔除。IC加权的正交合成因子表现最好,年化收益近10%,但波动及回撤相对较高。[page::14,15]
  • 分析师预期因子:

以120日变动因子(fttm
gth120)为初始因子,60日残差因子表现差。ICIR加权正交组合表现最佳,年化收益9.3%,Sharpe1.39。[page::16,17]
  • 技术因子:

换手率稳定性12 个月为初始因子,动量残差因子表现提升,其他下降。等权加权正交因子表现最好,年化收益16.3%,Sharpe 1.43。[page::17,18]

以上均显示,正交处理有助于剔除明显冗余因素,提高模型稳定性但往往会降低部分因子的独立效能,需平衡取舍。[page::11-18]

---

2.4 中证500指数增强策略构建与比较


  • 根据各类因子的正交及非正交因子加权表现,选择表现优异的加权方法(参见表22)。

- 为抑制过拟合及维持模型简洁度,大类风格因子以等权方式合成最终股票打分。
  • 对比原始合成因子与正交合成因子:

- 两者IC均值均为0.07,正交因子合成因子年化收益略高(22.24% vs 22.01%),但回撤和波动偏大。
- 原始合成因子多空组合Sharpe比率2.51高于正交组合的2.4,Calmar比率分别为1.75和1.44,说明原始因子更优风险调整收益。
- 图11~14清晰展示五组分层及多空净值曲线,表22、23给出详细统计指标。
  • 指数增强策略回测:

- 基于正交因子的增强策略在2018-2023年5月间,超额基准年化收益11.68%,比原始策略高出约1个百分点。
- 信息比率和Calmar比率也更高,分别达2.28和1.52。
- 净值曲线显示2022年8月开始正交策略表现明显优于原始策略(图15,表24)。
  • 综上,因子正交处理有助于提升量化组合在指数增强策略下的风险调整后收益和稳定性。[page::19-21]


---

3. 重要图表深度解读



图1(质量因子多空净值对比)


  • 展示2017年12月至2023年4月不同加权质量因子合成后的多空组合净值表现。

- 筛选后等权线(蓝色)稳步领先,净值增长明显高于等权(红色)、IC加权(橙色)、ICIR加权(灰色)。
  • 等权加权出现严重下滑,指示因子简单权重容易导致较大回撤。


表2(质量因子加权方法表现)


  • 筛选后等权年化收益9.55%,波动率8%,最大回撤-20.65%最好。

- Sharpe比率1.19及Calmar比率0.46领先其他方法,反映更优风险调整回报。

图2(成长因子多空净值对比)


  • 2021年9月前,各加权方法表现接近,之后筛选后等权大幅领先,净值曲线陡增。

- 表3显示筛选后等权年化收益20.48%,Sharpe达2.45,波动率和最大回撤均较合理。

图3(北向资金因子多空净值对比)


  • ICIR加权灰色线明显领先,在2023年多次创新高。

- 表4最大年化收益12.03%,Sharpe 1.71,凸显该方法对资金流因子的有效捕捉。

图4(分析师预期因子多空净值对比)


  • IC加权橙色线从整体表现较好,表5也确认该方法年化收益9.2%左右,高于其他方法。


图5(技术因子多空净值对比)


  • 等权权重红色线持续领先,表6显示Sharpe 1.7,是最优选。


图11-14(合成因子分层与净值)


  • 图11原始合成因子五组分层显示,最高组level5净值远超其他,表明因子组合具有良好的分层能力。

- 图12多空净值线持续上升,年化收益超22%,Sharpe 2.51。
  • 图13、14对应正交合成因子,年化收益稍高但波动及回撤更显著,Sharpe略低。


图15(指数增强策略净值)


  • 正交策略蓝线相较于原始策略红线从2022年中期开始表现更优。

- 表24显示超额年化收益、信息比率均领先,风险略降低,策略更稳健。

整体来看,图表与数据详尽支持了报告的核心结论,即通过合理的因子加权及正交处理,可以有效提升因子组合绩效和中证500指数增强策略表现。[page::6-21]

---

4. 估值分析



本报告焦点为量化因子加权及因子正交策略,未涉及传统股票估值分析方法(如DCF、PE、EV/EBITDA等)。

估值层面报告应用于组合因子构造及其回测表现,体现为期望的超额收益和风险指标,无直接资产或股价估值模型。关注因子IC、ICIR、年化收益率、Sharpe比率、最大回撤、Calmar比率等多维度指标,以衡量因子的预测能力和稳健性。

模型基于历史回测数据进行因子有效性验证和策略绩效评估,最终通过多因子合成构建指数增强组合。故估值范畴为策略性能评估而非公司股价估计。[page::3,19-21]

---

5. 风险因素评估


  • 模型过拟合风险: 报告强调为避免大类因子过拟合,采用等权合成简化模型结构,显示对模型复杂度带来的风险保持警惕。
  • 因子和模型失效风险: 风险提示明确指出,本报告模型基于历史数据,未来可能出现因子或模型失效,即历史有效的因子未来表现不佳。
  • 数据质量及市场环境变化: 如何保持因子有效性受限于市场状态和经济周期变迁,潜在影响因子预测能力。
  • 因子相关性风险: 虽因子正交减少相关性,但正交策略本身存在收益与稳定性权衡。
  • 策略执行风险: 量化策略受交易成本、滑点和市场流动性限制未详述,实际应用可能偏离回测结果。


报告未提供具体缓解措施,仅以风险提示形式提醒投资者审慎对待策略优化中可能出现的问题。[page::0,22]

---

6. 批判性视角与细微差别


  • 不同因子的加权方法无统一优势: 报告根据类别分配不同加权方法,显示加权策略具较强风格依赖性,反映市场因子特性的差异,但同时意味着模型不能简单化为统一解决方案,需要细致调优。
  • 正交处理收益与波动权衡: 正交因子虽然提升了部分年化收益和策略表现,但波动率和最大回撤较原始因子有所上升,特别是大类因子Sharpe和Calmar比率有所下降,显示正交处理并非完美,风险控制仍需关注。
  • 筛选后等权方法依赖历史收益可持续假设: 虽然报告认为历史多头收益具备延续性,但市场环境变化可能导致筛选失效风险,且当所有因子被剔除时的处理策略较为简单。
  • 数据样本及时间窗口: 报告使用了2017至2023年期间回测,期间包含多个市场波动周期,适度保证策略的鲁棒性。但未来市场状态变化可能突破历史经验。
  • 缺乏外部验证: 虽有详尽回测,报告未显著讨论外样本测试或实时验证,存在过拟合可能。
  • 因子定义及处理说明清晰,少见内部矛盾,整体严谨度较高。[page::3-22]


---

7. 结论性综合



本报告基于湘财证券多因子选股系列的第五篇研究,详述了因子加权及正交处理两大策略方法,核心结论包括:
  • 因子加权是多因子策略关键环节,报告通过等权、筛选后等权、IC均值加权及ICIR加权四种方法系统比较,针对不同风格因子推荐对应最优加权方法:

- 质量因子和成长因子优选筛选后等权法,反映了近半年因子收益的持续性。
- 北向资金类因子ICIR加权效果最佳,体现稳定性更重要。
- 分析师预期因子IC加权为主导,注重因子预测能力均值。
- 技术因子则简单等权最佳,说明技术因子贡献较均衡。
  • 采用线性残差正交方法剔除高相关因子冗余,提高模型稳健性。正交处理过程中部分残差因子表现差被剔除,剩余正交因子与初始因子共同合成。正交因子整体提升了指数增强策略的超额收益率和信息比率,尤其在2022年后表现明显优于原始因子组合。
  • 中证500指数增强策略实证显示,正交因子构建的策略超额年化收益达11.68%,信息比率2.28,Calmar比率1.52,均优于原始策略。策略净值曲线持续上升,风险调整收益突出。
  • 报告强调因子和模型基于历史表现,未来可能失效,存在结构性风险,投资者需谨慎使用。未来研究将尝试引入另类因子、ESG因子及高频因子,持续提升多因子选股策略。
  • 图表支持结论明确,质量、成长、资金流及技术等因子在不同加权方法下表现差异显著,理论与实证相符。


总体而言,本报告系统且细致地揭示了多因子加权与正交对提升多因子量化选股策略表现的重要性,方法论和实证分析均达到较高专业水平,具备较强的实用指导价值。[page::0-22]

---

附:重要图表示意示例



图1 质量因子多空净值对比



表2 质量合成因子检验结果(筛选后等权优)

| 加权方法 | IC | ICIR | 年化收益(%) | 年化波动(%) | 最大回撤(%) | Sharpe | Calmar |
| --------- | ------| ------| ------------| ------------| ----------- | -------| -------|
| 等权 | 0.02 | 0.27 | 6.5 | 8.16 | -24.33 | 0.8 | 0.27 |
| 筛选后等权| 0.03 | 0.29 | 9.55 | 8.0 | -20.65 | 1.19 | 0.46 |
| IC加权 | 0.03 | 0.31 | 8.26 | 7.87 | -19.24 | 1.05 | 0.43 |
| ICIR加权 | 0.03 | 0.34 | 7.91 | 7.89 | -17.49 | 1.0 | 0.45 |

(更多图表详见正文对应页)[page::6]

---

以上为湘财证券《多因子量化选股系列之五——因子的加权与正交》报告的全面详尽解析,涵盖了报告结构、主要技术细节、数据支持、风险提示与实证结果,适合研究与实际策略应用参考。

报告