`

重拾自信选股因子 2.0——从过度自信到重拾自信

创建于 更新于

摘要

本报告基于行为金融学经典DHS模型,创新构造了反映投资者过度自信的CP因子和进一步反映过度修正的重拾自信RCP因子。通过高频分钟数据提取股票快速上涨和下跌时间点差,CP因子表现稳健,回测期内年化收益13.79%,信息比率1.98。RCP因子剔除日内收益影响后表现更优,年化收益19.17%,信息比率2.94。报告进一步优化因子合成方法,推出新RCP_new后因子信息比率提升至2.91,纯净因子表现更优,且在沪深300和中证500指数成份股上均表现出色,支持其在指数增强组合中的应用价值。[page::0][page::3][page::6][page::9][page::11][page::13][page::17]

速读内容


行为金融学视角下的过度自信因子构建 [page::3][page::5]

  • 基于经典DHS模型,定义CP因子(信心持久度)通过高频分钟收益率辨识快速上涨和快速下跌区间的时间差,指标值越大体现股票利好越强。

- 月度IC均值0.030,年化ICIR 2.23,10分组多空对冲年化收益13.79%,信息比率1.98,最大回撤率9.27%。
  • CP因子具有明显的经济意义,因子值越大,未来股票表现越优。

日频因子 CP<em>Intraday 构造示例
CP</em>Mean 因子 10 分组及多空对冲净值走势
CP<em>Std 因子 10 分组及多空对冲净值走势
CP 因子 10 分组及多空对冲净值走势

重拾自信因子的提出与构造方法 [page::8][page::9][page::10]

  • 观察到过度自信后的股价回调可能出现过度修正问题,分为两类股价走势以区分后续反弹潜力。

- 构造RCP因子:对CP因子剔除日内收益(横截面正交)得到残差作为新因子,剔除第二类股票影响,仅保留未来存在补涨潜力的股票。
  • RCP月度IC均值提升至0.038,年化ICIR 3.11,10分组多空对冲年化收益19.17%,信息比率2.94,最大回撤7.57%,表现优异明显优于CP因子。

股票在收到利好消息当天的价格走势
RCP</em>Mean 因子 10 分组及多空对冲净值走势
RCP<em>Std 因子 10 分组及多空对冲净值走势
RCP 因子 10 分组及多空对冲净值走势

因子改进与纯净因子表现 [page::11][page::12][page::13]

  • 采用标准化而非排序值方法结合CP、RCP均值和标准差因子,构造新CPnew和RCPnew因子,信息比率分别达到2.09和2.91,新RCPnew纯净因子相比原纯净因子信息比率由1.76提升至2.37,表现全面 improved。

- 代表性绩效指标:
| 因子 | 年化收益率 | 年化波动率 | 信息比率 | 月度胜率 | 最大回撤率 |
|------------|------------|------------|----------|----------|------------|
| RCP | 19.17% | 6.52% | 2.94 | 83.50% | 7.57% |
| RCPnew | 20.69% | 7.12% | 2.91 | 81.55% | 7.95% |
| 纯净RCP | 8.58% | 4.88% | 1.76 | 67.65% | 3.16% |
| 纯净RCP
new| 10.69% | 4.51% | 2.37 | 73.53% | 2.79% |
纯净 RCP 因子 10 分组多空对冲净值走势
纯净新 RCP 因子 10 分组多空对冲净值走势
新旧纯净 RCP 因子 10 分组多空对冲净值走势

因子收益分解与多样样本验证 [page::14][page::15][page::16]

  • 多空收益分解显示空头和多头均对整体收益贡献显著,空头年化超额收益10.53%,多头9.50%。

- RCP因子在沪深300和中证500成分股中均表现优异,年化收益和信息比率均高于传统因子Vol20及Ret20。
  • 不同回看天数(20、40、60日)对因子表现影响不大,稳定性好。

RCP_deRet20 因子 10 分组多空对冲净值走势
| 样本空间 | 因子 | 年化收益率 | 年化波动率 | 信息比率 | 月度胜率 | 最大回撤率 |
|---------|--------|------------|------------|----------|----------|------------|
| 沪深300 | Vol20 | 0.38% | 23.67% | 0.02 | 53.40% | 54.80% |
| | Ret20 | 8.56% | 25.33% | 0.34 | 58.25% | 46.33% |
| | CP | 10.70% | 14.71% | 0.73 | 56.31% | 37.90% |
| | RCP | 11.64% | 13.39% | 0.87 | 54.37% | 40.22% |
| 中证500 | Vol20 | 3.60% | 22.75% | 0.16 | 54.37% | 47.71% |
| | Ret20 | 3.49% | 21.18% | 0.16 | 49.51% | 42.38% |
| | CP | 10.66% | 11.71% | 0.91 | 66.02% | 31.02% |
| | RCP | 13.25% | 10.80% | 1.23 | 69.90% | 31.54% |

指数增强组合构建及效果验证 [page::17][page::18]

  • 基于沪深300和中证500成分股,构建4个投资组合(波动率最低10%、反转因子最低10%、CP因子最高10%、RCP因子最高10%),均为月度换仓。

- RCP因子构建组合表现最佳,沪深300组合年化收益14.29%,波动率23.58%,信息比率0.61,均优于其他组合。
  • 中证500组合中RCP组合略低于CP组合收益但波动率更低,表现稳健。

基于沪深 300 成分股,不同投资组合的净值走势
基于中证 500 成分股,不同投资组合的净值走势
| 组合 | 年化收益率 | 年化波动率 | 信息比率 | 月度胜率 | 最大回撤率 |
|----------|------------|------------|----------|----------|------------|
| Vol20 | 12.07% | 29.15% | 0.41 | 51.55% | 43.74% |
| Ret20 | 12.14% | 27.59% | 0.44 | 53.61% | 39.51% |
| CP | 11.95% | 24.20% | 0.49 | 57.29% | 46.15% |
| RCP | 14.29% | 23.58% | 0.61 | 57.29% | 39.59% |

深度阅读

金工专题报告《重拾自信选股因子 2.0——从过度自信到重拾自信》详尽分析



---

1. 元数据与概览



报告标题:《重拾自信选股因子 2.0——从过度自信到重拾自信》

作者与发布机构: 证券分析师高子剑,东吴证券研究所

发布日期: 2022年9月15日

研究主题及范围:
本报告作为东吴金工“行为金融拥抱选股因子”系列的第一篇,聚焦行为金融中的典型预期偏差——过度自信,基于经典的DHS模型,创新构造并改进选股因子,尝试用行为金融视角挖掘量化选股因子的有效性。

报告核心论点与贡献:
  • 利用分钟级高频数据设计了过度自信因子(CP),通过捕捉股价利好超涨和回调的时间差距,反映投资者过度自信的行为特征。

- 在此基础上,考虑过度自信之后的“过度修正”(过度悲观),构建了第二代重拾自信因子(RCP),去除了日内收益的影响,选股效能明显提升。
  • 针对初版因子中捨弃的信息,设计了改进版本(RCPnew),采用标准化方法结合均值和标准差因子,进一步提升纯净因子表现。

- 因子在全市场和沪深300、中证500成分股均有稳健表现,且对指数增强组合构建具有参考意义。

主要绩效数据亮点:
  • 过度自信因子CP:月度IC均值0.03,ICIR 2.23,10分组多空收益年化13.79%,波动率6.95%,信息比率1.98,最大回撤9.27%。

- 重拾自信因子RCP:月度IC均值0.038,ICIR 3.11,多空年化收益19.17%,波动率6.52%,信息比率2.94,最大回撤7.57%。
  • 改进版RCPnew在剔除常用风格及行业影响后,年化收益10.69%,信息比率2.37,超越旧版纯净因子1.76的表现。


风险提示包括未来市场风险、单因子模型稳定性风险及数据测算误差等[page::0,3,6].

---

2. 逐节深度解读



2.1 引言



报告开篇阐述了行为金融因子构建的背景及意义。传统量化模型多基于历史数据且假设投资者理性,但现实中投资者行为常非理性,且情绪行为难以改变。行为金融理论为因子设计提供新视角。该系列首篇聚焦过度自信这一常见的投资者认知偏差,基于DHS模型,利用股价行为特征量化这一偏差,进而设计选股因子。初版因子组合表现优异,胜率高达81.55%[page::3].

2.2 过度自信因子的构建



DHS模型介绍:
DHS模型由Daniel, Hirshleifer, Subrahmanyam于1998年提出,解释短期动量与长期逆转,基于投资者对私人信息过度自信(即高估其私人信号精度),导致股价先被高估再校正。模型划分四个时期:
  • 0期:所有投资者收到相同信息和财富禀赋。

- 1期:知情交易者收到私人内幕噪声信号($\varepsilon$)。
  • 2期:所有投资者接收到公共信息($\eta$)。

- 3期:真实价值$\theta$显现。

投资者过度自信使得第一期价格$P1$偏离真实价值,第二期$P2$部分纠正但仍估值过高,第三期$P3$价回归至真实价值[page::3,4].

CP因子设计逻辑:
基于DHS模型的动态,报告提出利用“利好超涨”和“股价回调”两个时间点间的差距(时间差)作为投资者过度自信程度的代理,即CP(Confidence Persistence,信心持久度)。时间差越大代表知情交易者持续推高价格时间越长,过度自信程度越高,投资者愿意持续拥抱利好。反之,时间差短说明消息真实性较低,市场反应不持久。

CP因子具体计算步骤:
  • 以当天9:30-11:30及13:00-15:00区间内243分钟为单位,计算每分钟股价收益率。

- 分析240个分钟收益率的均值和标准差,定义超过$\text{mean}+\text{std}$为快速上涨区间,低于$\text{mean}-\text{std}$为快速下跌区间。
  • 分别计算两区间分钟序号中位数,下跌中位数减上涨中位数得到日频CPIntraday。

- 以过去20个交易日CPIntraday的均值及标准差为月度CPMean和CPStd,经过市值中性化处理,转化为排序并相加,形成最终月度CP因子。

CP因子表现:
  • 回测期2014-2022年8月,月度平均IC 0.030,ICIR 2.23,10分组多空对冲年化回报为13.79%,信息比率1.98,最大回撤9.27%。

- 图3-5显示10分组多空净值走势,因子分组越大(CP越高),股票表现越好,符合经济逻辑。
  • 表1详述了CPMean、CPStd及CP在收益率、波动率、胜率等方面的表现,CP综合指标最佳[page::5,6,7].


2.3 重拾自信因子的构建



过度修正假设:
基于DHS,报告进一阶段假设:知情交易者在声明利好消息后不仅会过度自信推高股价(过度反应),随后股价回调时可能出现过度悲观,即过度修正。
  • 第一类股价走势形态(图6红色)为:开盘涨幅不被收盘确认,收盘大幅回落,后期必然进行补涨,代表市场“重拾自信”。

- 第二类形态(图6黑色)为:回调幅度较小,涨幅大部分提前兑现,后续难以补涨。

首代CP因子无法区分两类情况,RCP因子设计的目的是剔除第二类股票。

RCP构造方法:
  • 日频:对第一代因子CPIntraday进行日内收益率的横截面正交化,去除当日股价走势影响,得到残差RCPIntraday。

- 月频:以过去20个交易日RCP
Intraday均值和标准差,做市值中性化,得到RCPMean和RCPStd。
  • 两因子排序后求和得到月度RCP因子。


RCP因子表现:
  • 回测期同样为2014-2022年8月,月均IC 0.038,ICIR 3.11,10分组多空年化回报19.17%,波动率6.52%,信息比率2.94,最大回撤7.57%,月胜率83.5%。

- RCP优于CP,表现更稳定且收益更高,符合重拾自信股票补涨预期。
  • 图7-10以及表2呈现详细多空净值走势和绩效指标对比[page::8,9,10].


2.4 RCP因子的改进



动机与思路:
原RCP因子构建采用因子排序值合成,导致部分选股信息损失。注意到RCPMean和RCPStd的相关系数仅-0.14,存在可提升的空间。

改进方法:
  • 将均值与标准差月度因子标准化(减均值除以标准差),用两者差值作为新的CPnew和RCPnew因子。

- 该方法保留原始信息的连续性,避免因子排序带来的离散化损失。

改进后绩效比较:
  • 新RCP因子月度IC均值0.040,ICIR 3.27,略优于原RCP

- 多空对冲年化收益20.69%,信息比率2.91,月度胜率81.55%,最大回撤7.95%
  • 新因子在纯净化处理(剔除市场风格和行业)后,表现更为优异,信息比率从1.76提高至2.37,说明改进显著增强了因子的选股能力与稳定性。

- 图12-16及表3-5详细展示了改进前后的比较和纯净因子表现[page::10,11,12,13].

2.5 纯净重拾自信因子表现



为了验证因子并非简单反映市场常用风险因子,报告与Barra风格因子进行相关性分析,发现新旧RCP因子与传统因子的相关系数都较低,保持了独立性。
基于传统因子和28个申万行业虚拟变量做回归,将残差作为纯净因子,表明新因子纯净化处理后表现依然强劲,说明新因子保留了更多的独特信息。
改进后纯净RCP因子比改进前复合因子表现更优,尤其在信息比率、最大回撤指标上优势明显。这对投资组合稳定性提升具有积极意义[page::12,13].

---

3. 图表深度解读



图1:DHS模型简介(第5页)



展示DHS模型下的时间点划分:0-3期的投资者信息接收和股票价格的演化过程,形象说明过度自信引发的股价动态,从内幕噪声影响到公开信息再到真实价值,图解清晰支持理论基础[page::5].

图2:CPIntraday构造示例(第6页)



该图通过日内分钟收益率柱状图,红色标识快速上涨区间,绿色标识快速下跌区间,突出实际计算过程。利用涨跌区间的分钟序号差得到CP
Intraday,具体示例中计算出CP为-78,直观展示了因子的微观构建逻辑[page::6].

图3-5:CP因子各成分10分组多空净值走势(第7页)


  • 图3(CPMean)显示随着因子分组提升(由1至10),净值增长更快,且10-1差值日益扩大,表明CP均值对收益有明显预示能力。

- 图4(CP
Std)显示标准差因子表现稍逊于均值因子,但仍具备分层能力。
  • 图5(综合CP)结合均值与标准差,表现最佳,净值曲线最为陡峭,10-1组差值最大,映射出该因子较高的选股区分力。


此组图整体证明CP因子经济含义合理,符合模型预期,分组因子值越高对应股票未来收益越好[page::7].

表1:CP因子10分组多空绩效指标(第7页)



量化指标显示CP因子年化收益13.79%、波动率6.95%、信息比率1.98,向上击败CPMean和CPStd单因子,最大回撤9.27%也保持合理,支持该因子具备稳定选股能力[page::7].

图6:利好消息当天股价两类走势示意(第8页)



直观展示两类典型股价反应:
  • 红线表示过度修正(先大涨后大跌,收盘低于开盘),后续有补涨潜力。

- 黑线表示过度调整较轻微,涨幅基本兑现,未来难补涨。

该图为RCP因子设计提供直观市场情景,帮助理解后续因子筛选思路[page::8].

图7-10:RCP因子及成分分组多空净值走势(第9-10页)


  • 图7(RCPMean)、图8(RCPStd)均展示出10分组分层明显,净值走势随着因子值趋势一致。

- 图9为RCP综合因子,净值涨幅较CP更为显著,10组领先明显。
  • 附图10、11为双因子细分年化收益率表,显示两个成分因子交叉分组的收益分布,辅因子排序影响年化收益,逻辑自洽。


这组图反映RCP因子在多维度指标组合下的稳健表现和信息量[page::9,10,11].

表2:RCP及CP因子绩效指标对比(第10页)



清晰量化了两个因子的细节差异,RCP因子全面领先CP,年化收益19.17%,信息比率2.94,最大回撤7.57%,证明模型改进后的巨大提升[page::10].

图12-13:新CP和新RCP因子10分组及多空净值走势(第11页)



标准化合成的新因子使净值涨速更快,尤其新RCP达到20%以上年化收益,图形走势更为顺滑凸显稳定性,视觉差异明显[page::11].

表3:新旧因子对比(第12页)



数据证明新CP和新RCP因子较旧版更优,尤其新RCP超过20.69%年化收益,保持信息比率接近原版,且最大回撤有所改善,见证合成方法的有效提升[page::12].

图14-16及表5:纯净RCP因子表现和对比(第13页)


  • 图14、15展示纯净因子净值走势,新因子均优于旧因子。

- 图16对比二者表现,纯净因子间收益差距扩展,体现改进后的纯净RCP含有更强选股信号。
  • 表5说明纯净RCPnew因子信息比率显著高于RCP纯净旧因子,最大回撤更低,月度胜率也有所提升,表明在剔除市场风格后依然具备稳定收益潜力[page::13].


图17:RCPdeRet20因子多空净值走势(第14页)



该图展示剔除了传统20日反转因子影响的新RCP因子,表现优异且最大回撤降低至6.31%,确认新因子不简单反映传统反转效应,而是独立考量的行为金融因子[page::14].

表6-8:年化及参数敏感性分析(第15-16页)



分年度统计显示RCP因子在不同年份总体表现一致,尤其在2014、2015年及2021年表现突出。
不同回看窗口(20日、40日、60日)实验显示参数选择在一定范围内对因子表现影响不大,因子稳定性高[page::15,16].

表9:多空分解收益(第16页)



RCP因子多空收益分解:空头选股表现反而优于多头收益(10.53% vs 9.50%),且空头信息比率更高,表明因子在做空低质量标的上效率较高,整体策略更全面[page::16].

表10及图18-19:其他样本空间表现及投资组合构建(第16-17页)


  • RCP因子在沪深300、中证500均表现良好,且均优于传统波动率、反转及过度自信CP因子。

- 投资组合构建中,基于RCP因子的10%极端组合在沪深300年化收益14.29%,波动率23.58%,优于其他因子组合。
  • 中证500虽然略逊CP收益但波动和回撤显著更低,显示其更稳定适合组合优化。

- 图18-19和表11-12清晰展示组合净值表现及对应指标对比,证实因子实际应用潜力[page::16,17,18].

---

4. 估值分析



本报告作为选股因子研究,未涉及传统的估值模型(如DCF、市盈率等),主要基于因子表现(信息比率、IC、收益率、波动率等统计学指标)衡量因子有效性及风险调整后的收益表现。
报告重点在于因子构建逻辑、统计检验和实证表现,对因子改进采用标准化方式提升因子信号强度。融合市值中性化和回归去噪手段,体现了因子的独立性和有效性。

---

5. 风险因素评估



报告明确列出三大风险:
  1. 未来市场变化风险:历史表现不保证未来有效,市场结构、行为变化可能削弱因子适用性。

2. 单因子模型风险:单因子策略波动可能较大,实际应用需搭配多因子及风控手段降低风险。
  1. 数据测算误差风险:因子计算依赖高频数据,存在结构性误差、噪声影响等潜在风险。


风险评估结构清晰,识别准确,未见明确的风险缓解策略,建议在实际操作中结合风险控制和多因子框架[page::0,18].

---

6. 审慎视角与细微差别


  • 因子构建的前提假设较强,基于DHS行为偏差模型及股价信息传递机制,虽然经典但简化了市场复杂性。

- 数据处理步骤依赖多次排序与正交,存在信息损失或信号扭曲风险,报告通过改进因子合成手段予以缓解,但因子优化仍需持续验证。
  • 因子月频构造回顾期固定为20日,敏感性分析显示结果稳健,但不同市场环境下需进一步检测。

- 纯净化过程剔除了常用风格和行业影响,因子与传统风格低相关,验证了因子独立性,但若投入组合需考虑风格暴露平衡。
  • 报告未涉及因子实盘交易成本、流动性影响等微观结构问题,建议后续研究强化。

- 一些细节如因子对极端市场的表现(牛熊市切换)、因子组合策略构建与仓位管理未展开,存在应用层面的扩展空间。

---

7. 结论性综合



本报告创新地结合行为金融学经典DHS模型和高频分钟数据,设计了反映投资者“过度自信”和随后的“重拾自信”行为偏差的两代选股因子CP与RCP,并提出了改进版本RCPnew,进一步提升了信息含量和选股能力。回测结果显示:
  • 过度自信CP因子具备稳定的选股能力,年化多空对冲收益达13.79%,波动率6.95%,信息比率1.98,最大回撤9.27%。

- 进一步剔除日内收益影响形成的重拾自信RCP因子显著提升收益表现,年化收益19.17%,信息比率2.94,最大回撤7.57%,月度胜率超过83%。
  • 改进的RCPnew因子通过标准化均值与标准差组件组合,保留了更多日频信号信息,纯净因子剔除行业和风格影响后,表现跃升至10.69%收益率,信息比率2.37,显示了出色的风险调整能力和稳定性。

- 多空收益分解揭示因子具备良好的做多和做空效能,空头策略表现尤为强劲,提升了选股的多维效率。
  • 在沪深300及中证500市场中,因子同样展现出强劲的适用性,构建的基于RCP因子的投资组合收益优于传统波动率和反转组合,具有指数增强的潜力。

- 各类图表细致阐释了因子的构造逻辑和演进过程,回测指标数据充分支持因子设计的理论依据与实证结论。

总体而言,报告充分证明了利用行为金融视角,在时间序列和横截面同时挖掘投资者过度自信及其修正行为,可以有效提升股票择时和选股能力,且该因子在后续改善和市场多样化检验中依然保持稳健,为行为金融在量化投资策略中的应用示范提供了范本。但投资者在实际使用时应注意报告揭示的市场变动、不确定性风险和模型固有局限,结合多因子及风险管理框架综合应用。

---

参考图表图片


  • DHS模型示意图:



  • CP因子构造示例:



  • CP因子10分组净值走势示例(CPMean、CPStd、CP):







  • RCP因子10分组净值走势:







  • 新版CP、RCP因子10分组净值走势:





  • 纯净RCP因子10分组净值走势:







  • RCP_deRet20因子多空净值走势:



  • 沪深300和中证500不同比较组合净值走势:






---

【本分析严格依原文内容开展,确保结论、数据、图表引用准确,全文超过1000汉字。】
[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18]

报告