`

“订单簿的温度”系列研究(一)反转因子的精细结构

创建于 更新于

摘要

本报告提出基于订单簿逐笔数据的反转因子改进方法,重点利用成交笔数信息对传统反转因子进行W式切割,构造理想反转因子M。M因子显著提升了选股能力,回测显示信息比率达2.51,年化收益19.3%,且剔除风格因子后效果更佳,具备稳定性和实用价值[page::0][page::6][page::7][page::8][page::9][page::10]。

速读内容


订单簿驱动市场与反转因子的研究背景 [page::3]

  • A股市场为订单驱动型市场,行情完全由订单簿信息决定。

- 逐笔成交数据蕴含丰富信息,可用以深度挖掘反转因子。
  • 传统反转因子(如20日收益率Ret20)表现稳定性差,存在动量效应时段。



反转因子的W式切割方法及效果 [page::5]

  • 以每月末回溯N日(偶数,N=20为例),按单笔成交金额D排序,将交易日分为高D组和低D组(各占半数)。

- 计算高D组涨跌幅累计得到Mhigh,低D组累计得到Mlow。
  • Mhigh表现为强反转因子(rankIC均值-0.082),Mlow表现为弱动量因子(rankIC均值0.018),均显著优于传统因子。

| 因子 | IC均值 | rankIC均值 | 信息比率 | 月度胜率 | 回归剔除Ret20后的rankIC均值 |
|-------|---------|------------|----------|------------|----------------------------|
| Mhigh | -0.069 | -0.082 | 1.98 | 78.1% | -0.058 |
| M
low | 0.011 | 0.018 | -0.31 | 44.8% | 0.058 |
| Ret20 | -0.056 | -0.061 | 1.2 | 63.8% | |

理想反转因子M的构建与回测表现 [page::6][page::8]

  • 定义M因子为Mhigh减Mlow,强化反转信号。

- 全市场回测2010-2018年,五分组收益曲线清晰,信息比率2.51,年化收益19.3%,年化波动7.68%,月度胜率74.3%。


| 年份 | Group5年化收益率 | Group1年化收益率 | 多空对冲年化收益率 | 月度胜率 | 年化波动率 | 信息比率 | 最大回撤 |
|-------|------------------|------------------|-------------------|-----------|------------|----------|-----------|
| 2010 | 24.1% | 13.8% | 7.1% | 60.0% | 10.0% | 0.71 | 7.4% |
| 2011 | -27.3% | -38.7% | 17.1% | 83.3% | 4.6% | 3.70 | 0.7% |
| 2015 | 140.9% | 70.4% | 37.6% | 66.7% | 11.9% | 3.16 | 3.0% |
| 2018 | -28.1% | -43.3% | 25.6% | 90.9% | 4.4% | 5.81 | 0.7% |
| 2010-2018 | 15.5% | -4.2% | 19.3% | 74.3% | 7.7% | 2.51 | 7.4% |
  • 该因子在沪深300和中证500样本内同样表现优异,明显优于传统反转因子。



因子纯净化及参数敏感性分析 [page::7][page::9]

  • 剔除Barra风格和行业因子后,因子净值曲线更加陡峭,信息比率提升至2.97。


  • 参数N取值(20、40、60)对因子效果影响有限,高D组和低D组IC均与N无显著敏感。

| 因子/参数 | Ret20 | Ret40 | Ret60 |
|-----------|-------|-------|-------|
| Mhigh | -0.069| -0.063| -0.064|
| M
low | 0.011 | 0.016 | 0.018 |
| 原始因子 | -0.056| -0.052| -0.053|
  • 调整高D组所占比例,信息比率在X≈30时最大,支持默认对半分组策略。


因子收益累积及调仓频率建议 [page::9]

  • 多空对冲收益在月度持仓期间逐步累积,收益较为均匀,可尝试半月或周频调仓。



量化交易行为逻辑与日内切割思考 [page::10]

  • W式切割基于“单笔成交金额越高,反转越强”的假设,解释了因子的交易行为逻辑。

- 与此前“日内切割”研究结果存在表面矛盾,但整体市场平均模式并不必然适用于每只股每日。
  • 两种切割方法均显著提升反转因子选股能力,可独立或联合使用。


深度阅读

“订单簿的温度”系列研究(一)——反转因子的精细结构详尽分析报告



---

1. 元数据与报告概览


  • 报告标题:“订单簿的温度”系列研究(一)——反转因子的精细结构

- 作者:魏建榕(证券分析师,执业证号S0600517120003021-60199793)、高子剑(证券分析师,执业证号S0600518010001021-60199793)、傅开波(研究助理)
  • 发布机构:东吴证券研究所金融工程团队

- 发布日期:2018年12月13日
  • 研究主题:深入揭示A股市场作为订单驱动型市场的本质,聚焦以订单簿逐笔成交数据中的“成交笔数”为核心指标,通过对传统反转因子进行精细切割来提出理想反转因子,从而提升反转因子的预测能力和稳定性。


核心论点摘要
  • A股行情演化全由订单簿逐笔成交数据决定,订单行为中的“成交笔数”信息富含深层alpha信号。

- 通过对传统20日收益率反转因子进行单笔成交金额为基础的“W式切割”,成功从反转因子中剥离出更强反转子因子(Mhigh)和弱动量因子(Mlow)。
  • 构建理想反转因子M(Mhigh减Mlow),实证结果显示其月度信息系数(IC)和排名IC均值明显优于传统反转因子,且其多空对冲组合年化收益达19.3%,信息比率高达2.51,剔除风格和行业因子后信息比率进一步提升至2.97,展现出极佳的稳定性和投资实用性。

- 本研究不仅揭示了对传统反转因子的改进方法,也构建了高频数据与低频选股信号的桥梁,指明了市场反转机制的订单簿根源。[page::0-1]

---

2. 逐章节深度解读



2.1 引言(第1章)


  • 关键论点

- A股是订单驱动型市场,从“订单簿”即买卖挂单和成交的逐笔数据中,可以充分挖掘交易行为和市场演变规律。
- 逐笔成交和(部分市场)逐笔委托数据包含丰富信息,值得深度研究。
- 本系列旨在分享从逐笔数据出发的量化投资研究心得,核心理念为“从交易行为中寻找alpha”,强调微观交易行为对宏观行情的决定作用。
  • 逻辑说明

- 阐述团队长期积累的模型经验,将高频交易行为量化,转换成为低频率的alpha因子。
- “订单簿的温度”作为系列的主题,寓意从订单簿细节中感知市场活跃度及内在信息。
  • 述及的不同交易行为模型(图1):

- 展示了包括“蜘蛛网CTA”、“异动罗盘”、“十字星模型”、“跟踪聪明钱”等多种基于交易行为的模型,表明团队对价量行为和高频交易数据的深刻理解。
  • 本篇报告聚焦“成交笔数”指标

- 这是首次以成交笔数为切入点改进反转因子,揭开其背后的深刻alpha机理。[page::3]

---

2.2 反转因子的切割问题(第2章)


  • 论点总结

- A股市场反转效应明确,以20日收益率反转因子(Ret20)为例,其月度IC均值-0.056,但稳定性不足,部分时间段(如2013年上半年、2014年下半年、2017年)表现失效甚至转为动量,表明传统反转因子混杂了不同效应。
- 反转因子本质是一定区间涨跌幅的累积,提出“切割问题”:该区间内是不是存在不同子时段其反转强度差异显著?部分时段或许带来强反转,另一些则有动量效应?
  • 图2展示了Ret20反转因子多空对冲净值走势波动及不稳定性。

- 图3说明切割思路的直观示意
- 传统因子是一个整体柱状体(整体表现反转),其中内部可以分割成蓝色强反转部分和红色弱动量部分,重心位置不同。目标是寻找合适的切割方案,使得强反转和弱动量特点在数据上体现清晰。[page::4-5]

---

2.3 反转因子的W式切割(第3章)


  • 具体方法和步骤

1. 对股票按过去N(偶数)日的单笔成交金额平均水平D进行排序分组,选出前半部分高D组和后半部分低D组。
2. 分别对两组的涨跌幅进行累乘得到两个子因子:Mhigh(高单笔成交金额组)和Mlow(低组)。
  • 核心思想

- 单笔成交金额大的交易日通常包含较为“活跃”的大单交易,可能携带强反转信号。
- W式切割利用成交单笔金额由大到小排序,提取更纯净的反转子因子与动量成分,实现因子净化。
  • 实证效果:(图4)

- Mhigh表现为强反转因子:rankIC均值-0.082,信息比率1.98,月度胜率78.1%。
- M
low表现为弱动量因子,rankIC均值0.018。
- 传统因子Ret20则rankIC-0.061,信息比率1.2,月度胜率63.8%。
  • 附注:累积方式用复利乘积计算(详见附注[1]),并且对比不同分组指标(成交笔数、成交金额、单笔成交金额)效果,单笔成交金额分组效果最佳,说明切割指标选择合理。[page::5, 11]


---

2.4 理想反转因子(第4章)


  • 定义:理想反转因子M = Mhigh - Mlow

- 由于Mhigh为强反转,Mlow为弱动量,M因子呈现更强反转特征。
  • 实证表现

- 2010-2018年,除去ST股与新上市股后,M因子月度IC均值-0.057,rankIC均值-0.070。
- 五分组净值曲线显示分组排序良好,多头组合Group5表现突出,远超其他组。
- 多空对冲组合年化收益19.3%;年化波动7.68%;月度胜率74.3%;信息比率2.51(图5)。
- 分年度表现如图6所示,2015年表现尤其优异,年化收益高达140.9%,体现该因子在牛市阶段显著优势。
  • 风格因子剔除后表现

- M因子与Barra以及29个中信一级行业哑变量回归残差后(剔除了风格与行业因子影响),信息比率升至2.97,多空对冲年化收益11.3%,年化波动仅3.8%,月度胜率提升至76.2%(图7、图8)。
- 说明M因子具备较高的独立alpha贡献,非风格叠加。[page::6-7]

---

2.5 若干重要的讨论(第5章)


  • 参数N的敏感性(图9):

- 对20、40、60日的收盘收益率因子均采用W式切割,可显著提升IC表现,效果稳定且强于原始因子。
- M
high始终呈现较强反转(rankIC均约-0.06至-0.08);Mlow保持弱动量特征。
  • 不同样本空间测试(图10):

- 沪深300成分股:Ret20多空对冲收益7.2%,理想M因子提高至15.0%,信息比率从0.35跳升至1.17。
- 中证500成分股:Ret20多空收益13.9%,M因子升至16.3%,波动率大幅下降,信息比率从0.88增加至2.00。
- 反映因子普适性强。
  • 收益累积过程(图11):

- 月初建仓后,多空对冲收益呈平稳累积趋势,说明因子信号在持仓周期内持续有效,支持考虑更短周期调仓(周频、半月频)。
  • 分组比例的影响(图12):

- 高D组与低D组大致“对半切割”即N/2合理,信息比率在切割比例约30至35个交易日区间内均保持高位,表明方案稳定且可操作性强。
  • 交易行为逻辑解读

- 通过单笔成交金额排序,推断大单交易活跃日对应涨跌幅具有更强反转的特性,反映大单投资者的活跃交易行为对反转效应贡献突出。
  • 交易行为与日内切割的矛盾及调和(图13):

- 团队另一项研究提出“日内切割”,显示日内不同时间段反转力度不同且呈现动量与反转交替。单笔成交金额日内特征为“上午高,下午低”,其中13:00-14:00最低。
- 该日内模式与W式按成交金额切割出现矛盾,但报告作者解释该现象为统计学意义上的全市场平均特征,不代表“每只股票每个交易日”均如此。W式切割关注的是跨交易日的单笔成交金额差异,故两者无根本冲突。
- 总结认同“单笔成交金额越高,反转越强”为基本假设,而日内切割解释偏向其他市场行为模式的影响。
  • 实践建议:传统反转因子(如Ret20)效果不佳,应被理想反转因子替代或联合使用,提升模型稳定性和收益率。[page::7-10]


---

2.6 风险提示(第6章)


  • 主要风险为模型基于历史数据估计,未来市场结构或行为可能发生较大变化,导致因子效果减弱甚至失效。

- 投资者需务必关注模型有效性的动态更新。
  • 研究书面声明严格说明本报告不构成投资建议,市场有风险,投资需谨慎。[page::0, 10, 12]


---

3. 图表深度解读



图1:以往模型的交易行为逻辑(第3页)


  • 展示多项团队以往基于交易行为的模型及其投资逻辑,表明团队在价量关系、交易行为模式等领域的丰富积累,为本报告W式切割提供理论背景。


图2:传统反转因子稳定性不佳(第4页)




  • 曲线展示5组分层多空对冲净值,反转因子Ret20在部分年份失效,甚至出现上涨趋势异常。展示传统因子稳定性问题。

- 该图突出反转因子切割必要性。

图3:反转因子的切割问题示意图(第4页)




  • 直观演示如何将整体反转因子拆成强反转(蓝色)和弱动量(红色)因子,为W式切割方法提供直觉基础。


图4:因子回测表(第5页)



| 因子 | IC均值 | rankIC均值 | 信息比率 | 月度胜率 | 回归剔除Ret20rankIC均值 |
|--------|---------|------------|----------|----------|--------------------------|
| M
high | -0.069 | -0.082 | 1.98 | 78.1% | -0.058 |
| Mlow | 0.011 | 0.018 | -0.31 | 44.8% | 0.058 |
| Ret20 | -0.056 | -0.061 | 1.20 | 63.8% | |
  • 强调Mhigh强烈反转特性,Mlow表现弱动量,传统因子中和效应导致稳定性下降。


图5:理想反转因子M五分组净值曲线(第6页)




  • 五组分层净值明显分化,Group5(最高分组)净值显著领先,黑色虚线为多空对冲组合净值,持续稳健上涨。


图6:理想反转因子M年度表现统计表(第6页)



| 年份 | Group5 年化收益 | Group1 年化收益 | 多空对冲年化收益 | 市场等权组合 | 月度胜率 | 年化波动 | 信息比率 | 最大回撤 |
|--------|------------------|------------------|------------------|--------------|----------|----------|----------|----------|
| 2010年 | 24.1% | 13.8% | 7.1% | 15.5% | 60.0% | 10.0% | 0.71 | 7.4% |
| 2011年 | -27.3% | -38.7% | 17.1% | -33.0% | 83.3% | 4.6% | 3.70 | 0.7% |
| ... | ... | ... | ... | ... | ... | ... | ... | ... |
| 2010-18| 15.5% | -4.2% | 19.3% | 6.0% | 74.3% | 7.7% | 2.51 | 7.4% |
  • M因子整体表现优异,最大回撤相对较低。


图7:因子相关系数矩阵(第7页)


  • M因子与Beta、波动率、流动性等风格因子有一定正相关,但与传统动量、规模、账面市值比等关系较小,体现因子独立性。


图8:剔除Barra与行业因子后选股能力(第7页)




  • 多空对冲组合净值曲线持续上升且分组排列明显,剔除了其他风格和行业影响,突出因子纯净选股能力。


图9:N取20,40,60三个周期切割效果(月度IC均值)(第8页)



| 因子 | Ret20 | Ret40 | Ret60 |
|---------|--------|--------|--------|
| Mhigh | -0.069 | -0.063 | -0.064 |
| M
low | 0.011 | 0.016 | 0.018 |
| 原始因子 | -0.056 | -0.052 | -0.053 |
  • 切割方法对多种回溯窗口均有效。


图10:沪深300上M因子与Ret20多空对冲净值对比(第8页)




  • M因子明显跑赢传统Ret20因子,显示强大选股优势。


图11:多空对冲收益累积过程(第9页)




  • 股价反转收益在月度调仓周期内平稳累积,稳定性好。


图12:分组比例对信息比率影响(第9页)




  • 在高D组交易日选择约30-35个交易日时,信息比率最高,验证对半划分合理性。


图13:单笔成交金额的日内模式(第10页)




  • 展现日内交易的单笔成交金额分布,表现为上午活跃、下午低迷,1点-2点为最低点,解释了对“日内切割”异象的探讨和冲突解决。


---

4. 估值分析



本报告为因子研究性质的量化策略报告,未涉及公司估值或行业估值模型,无现金流折现(DCF)等估值方法;重点在因子的构造方法、稳定性检验、策略回测和交易行为逻辑解析。

---

5. 风险因素评估


  • 模型基于历史数据风险:模型的统计推断及回测基于2010-2018年历史样本,市场结构、投资者行为、监管环境等可能变化,影响模型适用性。

- 选股因子风险:因子有效性可能因市场环境变化、因子拥挤度提升等导致退化。
  • 交易成本及实现风险:报告未详述实际交易成本、市场冲击和流动性限制对策略实盘表现的影响。

- 风控安排:报告中未明确具体缓释策略,仅提示投资需谨慎,建议在实操中结合风险管理措施。
  • 理论假设风险:交易行为逻辑和单笔成交金额对反转强度影响的假设可能存在市场再平衡或结构调整时失效风险。[page::0,10]


---

6. 批判性视角与细微差别


  • 强烈的模型自信及感情色彩:报告开篇多次表述研究的“震撼效果”和“心潮澎湃”,虽提升阅读兴趣,但存在主观情绪色彩,读者需保持客观。

- 对W式切割逻辑的一致性关注:尽管作者论证了与日内切割的可能矛盾,理由主要基于统计平均差异,解释尚不完全充分,建议后续结合更多微观结构研究严谨验证。
  • 风格因子剔除的效果显著:说明因子多由流动性和Beta属性驱动,这或提示因子存在一定宏观风险敞口,实际运用需密切观察风格暴露。

- 回测数据覆盖时长和市场环境:报告涵盖牛市、熊市,表现均良好,但近年来市场微结构与交易制度快速变动,适用性需持续监测。
  • 交易成本未披露:真实策略成本及可交易量对于反转策略尤为重要,报告未涉及限制理解。

- 因子衰减动态未深度剖析:报告以月度频率回测,建议后续研究探讨因子半衰期及频率调整影响。
  • 部分术语定义及公式在附注解释较简略,易给非专业读者带来理解障碍,建议后续完善细节说明。


---

7. 结论性综合



本报告以深入挖掘订单簿数据中的“成交笔数”与“单笔成交金额”为基础,提出并验证了通过“W式切割”方法显著提升传统反转因子预测能力和稳定性的策略创新。核心贡献包括:
  • 创新点:首次通过基于单笔成交金额的交易日切割,成功将传统反转因子分解为强反转的Mhigh和弱动量的Mlow,构建理想反转因子M(Mhigh-Mlow)。

- 量化实证
- M因子在全市场及主要指数样本中均展现优异表现,多空对冲信息比率最高达2.97。
- 参数稳健性强,适用于不同回溯窗口且对分组比例敏感度低。
- 剔除风格及行业因子后依然具备显著的alpha信号,强化因子纯净性。
  • 图表支持:图5与图6呈现M因子的年化收益及分组净值分层明确,图7与图8揭示因子与风格独立性,图9-12涵盖参数敏感度、样本空间及收益累积等维度,形成完整且严谨的实证体系。

- 交易行为逻辑:通过单笔成交金额高低反映大单资金活跃度区分反转强度,深挖市场微观结构对反转效应影响的本质机理。
  • 实用性展望:推荐投资者抛弃传统无区分的反转因子,采用报告中提出的细分及理想反转因子策略,提升量化模型的稳健性和收益质量。


综上,报告通过细致剖析订单簿层级的交易行为数据,深化了对反转效应形成机制的理解,开创了基于高频逐笔数据低频信号构建的新思路,不仅丰富了A股量化因子体系,也为实践者提供了有力工具和改良路径。唯一需要注意的是,投资者应关注模型在未来市场变革中的适应性及交易实现成本。

---

附图展示


  1. 理想反转因子M的五分组与多空对冲净值曲线:



  1. 图6:理想反转因子M年化收益率及统计指标表:


| 年份 | Group5年化收益 | Group1年化收益 | 多空对冲年化收益 | 信息比率 | 最大回撤 |
|--------|------------------|------------------|------------------|----------|----------|
| 2015年 | 140.9% | 70.4% | 37.6% | 3.16 | 3.0% |
| 2010-18| 15.5% | -4.2% | 19.3% | 2.51 | 7.4% |
  1. 剔除Barra风格和行业因子后的因子净值曲线:



  1. 沪深300成分股选股能力对比:



  1. 多空对冲收益累积过程:




---

结语



本篇“订单簿的温度”系列第1篇报告,不仅提供了一个创新且高效的反转因子切割思路,也验证了订单簿数据在量化选股中的巨大潜力。投资实践中积极采纳此类因子改进,有望实现超额收益的有效提升,促进市场微观结构研究与量化投资的深入融合。

---

[page::0,1,3-12]

报告