中金 | 大模型系列(5):大语言时序模型Kronos的A股择时应用
创建于 更新于
摘要
报告介绍了专为金融市场设计的时序基础模型Kronos,通过离散化K线数据转化为结构化令牌,利用自回归Transformer进行预训练,展现领先的价格和波动率预测能力。在A股主要指数中进行测试,标准版Kronos未来5日价格预测相关性最高达0.92,误差较小,并基于中证1000指数构建择时策略。微调及滚动参数优化显著提升预测精度和策略收益率,2025年策略收益率达33.9%,年化超额收益9%,体现了模型对市场状态的快速适应和择时价值 [page::0][page::3][page::4][page::6][page::9][page::12][page::13][page::14]。
速读内容
大模型时序基础模型TSFM及Kronos设计 [page::0][page::2][page::3]
- TSFM通过大规模、多领域时序数据预训练,实现强泛化和零样本学习,适用于金融领域存在的低信噪比及非平稳性问题。
- Kronos专注金融K线数据,采用K线分词将连续数据编码为分层离散令牌,自回归Transformer进行“由粗到精”层次预测。
- 训练数据覆盖多资产类别、多时间频率,官方发布mini到large多版本模型,支持多频率预测。
Kronos在A股不同指数上的预测表现 [page::5][page::6][page::7][page::8]
- 在沪深300、中证500/1000/2000及国证成长/价值指数上测试,未来1日收盘价预测相关性最高达到0.978,未来5日仍高达0.732(中证1000)。
- 价格预测误差逐日递增,但整体仍处低水平,价值指数预测表现显著优于成长指数。
- 收益率预测相关性较弱,显示价格序列比收益率序列更适合作为模型输入与输出。
- 预测曲线与真实价格走势吻合良好,支持模型捕捉行情趋势的能力。




Kronos构建的中证1000择时策略及参数说明 [page::9][page::10]
- 策略基于未来第5日预测收盘价与当前价的比率作为信号,阈值超过0.5%做多,空仓门限设置-1.0%,持有周期固定5日,满仓执行。
- 使用T-1收盘后信号,T日开盘建仓,实现简洁且严格的择时逻辑。
| 类别 | 参数 | 设定 |
|----------|---------------|--------------------------------|
| 标的 | Asset | 000852.SH(中证1000指数) |
| 信号来源 | SignalSource | 每日滚动预测价格文件 |
| 预测周期 | predday | 未来第5天预测价格生成信号 |
| 核心信号 | CoreSignal | 预测收益率=未来第5天预测价/当前收盘价-1 |
| 开仓阈值 | returnthreshold | 预测收益率>0.5%时做多 |
| 仓位方向 | longonly | True,仅做多 |
| 执行方式 | Execution | T-1收盘后信号,T日开盘执行 |
| 持仓周期 | HoldingPeriod | 固定持有5个交易日 |
| 仓位管理 | PositionSizing| 满仓操作 |
择时策略表现与微调滚动优化 [page::10][page::11][page::12][page::13][page::14]
- 标准版策略整体正收益,但错失2025年7月后多数涨幅,表现依赖指数反转信号。
- 微调版本采用过去多年成分股日度数据微调模型参数,结合滚动网格搜索参数(温度、核采样概率、窗口长度),对模型状态快速响应市场动态。
- 微调和滚动优化使预测斯皮尔曼相关系数从0.732提升至0.856,MAE显著下降,价格预测稳定性和精确度提升。
- 策略年化收益33.9%,超额收益9%,对市场趋势变化的敏感度大幅增强,滚动微调策略优于标准及仅微调版及通用模型Sundial。


量化因子构建/策略核心总结 [page::9][page::10][page::11][page::12][page::13][page::14]
- 核心 quantitative strategy 基于未来收益率的机器学习预期价差信号。
- 结合了大语言模型领域预训练的时序基础模型优势与金融特化微调方法。
- 采用滚动参数调整策略灵活适应市场非平稳性,动态调整信号生成阈值及模型状态。
- 回测区间覆盖2025年,策略风险控制稳定,盈利能力显著优于基准指数及通用模型。
深度阅读
对《大语言时序模型Kronos的A股择时应用》研究报告的详尽分析
---
1. 元数据与报告概览
- 报告标题:《大语言时序模型Kronos的A股择时应用》
- 作者:郑文才、高思宇等
- 发布机构:中金公司
- 发布日期:2025年10月15日
- 主题:时序基础模型Kronos在中国A股市场主要指数中的应用,重点聚焦模型在股票市场价格预测及择时策略中的表现及提升方案。
核心论点与信息
报告通过介绍并实证分析了由清华大学团队开发的Kronos时序基础模型(TSFM)在A股主要指数上的价格预测能力及择时应用效果。报告指出,Kronos基于特定金融领域设计的两阶段框架(分词+自回归预训练),能较好捕获金融市场的时序特征,并在基础预测表现良好的基础上,通过模型微调和滚动参数优化显著提升了择时策略的收益能力,尤其是2025年展现出较强的超额收益能力,年收益超过33.9%,超额收益达到9%。报告同时提出微调和滚动调参方案能有效克服模型对市场状态的适应不足问题[page::0,1,2,3,4,5,9,10,11,12,13,14]。
---
2. 逐节深度解读
2.1 大语言时序模型及TSFM介绍
报告首先介绍了以大规模语言模型(LLM)为基础的时序基础模型(TSFM),强调其在广泛异构时序数据上的预训练优势和零样本泛化能力。TSFM的本质在于通过大规模、多领域的时序数据学习时间序列的普适规律(趋势、季节性、周期等),从而在新任务或数据集上无需额外训练即可应用,提升了迁移性和泛化性。
然而,金融时序数据具有低信噪比和强非平稳性,导致通用TSFM在金融领域表现不佳。针对这一问题,Kronos模型特化金融领域设计,通过“领域预训练+微调”的范式提升了对金融K线数据的表征能力,解决了泛化模型与金融领域数据特性的错位。Kronos不追求通用性,而是深耕金融市场数据的内在规律[page::0,1,2].
2.2 Kronos模型的架构和方法论
Kronos模型包含两大核心阶段:
- K线分词(K-line Tokenization):利用专用的Transformer自编码器对连续多维的K线时序数据进行层级化的量化分词,生成粗粒度(市场主要结构动态)和细粒度(价格精细波动)两层子令牌。采用二元球面量化(BSQ)实现细粒度离散化,保证令牌内部信息组织的有效性。
- 自回归预训练(Autoregressive Pre-training):采用仅解码器的自回归Transformer,以“由粗到细”预测策略,先预测下一个时间步的粗粒度令牌,再基于粗粒度进行条细粒度子令牌生成,实现市场趋势与细节的层级化学习。
该模型训练依托包含股票、期货、加密货币、外汇等多资产、7种不同时间频率的庞大金融数据集,为金融市场复杂时序建模提供坚实基础[page::3,4].
2.3 Kronos模型性能与主流TSFM对比
- Kronos在价格序列预测任务中,其RankIC指标比目前领先的通用TSFM高93%,比非预训练专用模型高87%;
- 在波动率预测任务中,平均绝对误差降低9%;
- 在合成K线数据生成任务中数据保真度和实用性提升22%;
- 基于Kronos信号驱动的投资组合在A股回测中表现出高额年化超额收益和信息比率,验证了其端到端量化分析能力。
此外,报告还归纳了当前主流TSFM的架构、应用领域及关键优势,详见图表1,Kronos以专注于金融数据领域特化及深度理解闻名,是TSFM演进中的重要标志[page::2,4,5].
2.4 Kronos在A股主要指数上的实证表现
以沪深300、中证500、中证1000、中证2000、国证成长和国证价值六大指数为标的,2025年初至9月底作为测试区间,采用400日K线作为输入,预测未来1至5个交易日收盘价,评价指标为斯皮尔曼相关系数和平均绝对误差(MAE)。
- 预测价格序列与真实序列相关系数在整体均较高(未来1日最高达到沪深300的0.978),且5日预测仍保持较高一致性,如沪深300为0.857,中证1000为0.732。
- 大市值指数预测优于小市值指数,如沪深300预测精度显著高于中证1000。
- 价值指数的预测相关性优于成长指数,表现为国证价值指数5日价格序列相关达到0.865,而成长指数仅为0.723。
- 收益率序列的预测相关性整体较低,且各指数表现差异明显。
图表5至图表8展示了各指数的预测相关系数和绝对误差,图表9至图表12分别展示了各指数预测价格序列与真实价格的动态对比曲线[page::6,7,8].
2.5 Kronos标准版择时策略表现及问题
使用标准版Kronos预测中证1000指数未来5日收盘价,并以此构建择时策略:
- 策略逻辑:预测未来第5日价格与当前价格比较,超过0.5%开多仓,低于-1.0%不做空,固定持仓5日,满仓操作。
- 结果显示策略总体实现了正收益,但2025年7月后市场持续上涨时期,策略未及时发出看多信号,错失大部分涨幅。推测因模型依赖前期指数反转逻辑,适应性不足。
图表13和图表14详细展示了择时策略的执行参数与收益净值曲线,表明标准版在实际交易中存在过于保守、趋势反应迟缓的缺陷[page::9,10].
2.6 微调版Kronos滚动择时系统设计与优化
基于文献[6]关于微调能带来15%-30%性能提升的结论,报告提出在中证1000指数上通过以下两大手段提升策略表现:
- 模型参数微调:使用2010-2022年成分股日度数据对Kronos进行微调,2023-2024年为验证集,避免过拟合,采用10轮训练,学习率及其他优化参数确定(见图表16)。
- 滚动推理参数调优:以1个月为滚动窗口,对推理参数温度T、topp和回看窗口lookbackwindow进行网格搜索优化,选取验证集最高斯皮尔曼相关系数的参数应用于测试集(见图表17)。
效果显著提升:
- 未来5日收盘价预测的斯皮尔曼相关系数由标准版的0.732提高至滚动微调后的0.856;
- 平均绝对误差由435.2降低至275.5;
- 收益率的相关性和MAE同样有所改善;
- 预测序列与真实序列的时间动态对比曲线(图表20)显示微调模型在拟合真实走势上更精准。
策略层面,基于滚动微调信号构建的择时策略2025年收益率达33.9%,较原方法提升20个百分点以上,超额年化收益9%,且对7月以来趋势的响应更灵敏,回测净值显著优于原始策略及通用基础模型Sundial(图表21)[page::10,11,12,13,14].
---
3. 图表深度解读
图表1:主流TSFM对比
展示了多种主流TSFM的架构类型、核心方法、开源状态及适用领域,突出Kronos专注金融领域,采用层级分词和纯解码器自回归方式,开源且拥有金融数据深度理解优势,是当前金融时序建模的前沿代表。
图表2 & 图3:Kronos两阶段框架示意图
图3详细展示了基于Transformer的K线分词过程及自回归预测结构:
- 左侧用Tokenzier Encoder和Decoder完成连续数据转离散令牌,按粗细粒度划分;
- 右侧基于Causal Transformer逐层预测粗细粒度令牌,体现语言模型自然的“由粗到细”自回归预测方式。
图表3: Kronos参数规模对比
展示四种版本模型的分词器类别、上下文长度及参数规模,参数规模从4.1M至近5亿不等,标准版参数量约1亿左右,适用于兼顾计算资源和模型表现的实际应用。
图表5-8:不同指数与预测序列的相关性与绝对误差
- 体现沪深300指数预测精度领先,中证1000及其他小盘指数表现略低;
- 价值指数表现优于成长指数;
- 预测收益率相关性低,提示价格走势捕捉优于收益变化的精确预测。
图表9-12:典型指数未来1日预测曲线对比
四个图表分别展示沪深300、中证1000、成长和价值指数的未来1日预测与真实收盘价格序列,预测曲线与实际走势高度吻合,说明模型具备较强的短期价格序列拟合能力。
图表14 & 21:择时策略收益曲线对比
- 图14显示基础择时策略净值曲线随时间表现,模型总体盈利但未及时捕捉后半段上涨行情;
- 图21展示滚动微调版本与基线、清华通用模型Sundial的收益对比,微调滚动策略净值领先明显,显示了微调及动态调参的提升效果。
---
4. 估值分析
本报告聚焦于模型技术和策略表现分析,未涉及传统企业估值分析。但从量化策略的盈利能力和超额回报角度出发,报告以实证回测作为投资建议的核心依据,反映了基于Kronos模型量化资产配置的价值逻辑。
---
5. 风险因素评估
- 历史收益的非保证性:报告多次提示报告基于历史数据与回测,不能确保样本外收益,存在市场非理性或突变风险。
- 模型依赖性与适应性风险:标准版Kronos对行情趋势机制的适应不足导致错失上涨,滚动微调虽改善,但仍需持续验证长期稳定性。
- 参数调优与过拟合风险:微调与滚动调参提高表现的同时,也面临可能的过拟合问题,报告通过验证集控制该风险。
- 市场特殊事件影响:金融时序数据非平稳性和噪声高,对模型鲁棒性提出挑战,可能影响预测和策略执行效果。
- 技术和硬件依赖性:模型推理和微调需高性能GPU(如NVIDIA RTX 3090),技术门槛和成本限制实际应用范围。
风险提示明确提醒投资者应理性对待模型回测数据,注意潜在投机、市场环境变化对策略效果的负面影响[page::5,9,10,15].
---
6. 批判性视角与细微差别
- 模型领域专注虽有优势,但是否兼顾异质性风险尚待实践检验,过强的领域预训练可能导致模型过度拟合过往主流行情模式,对非典型市场事件或政策冲击反应迟钝。
- 报告强调斯皮尔曼相关系数和MAE,但收益率预测相关性较弱,且金融市场收益率预测难度极大,模型在方向性或波动捕捉上的局限值得警惕。
- 策略构建基于预测价格阈值开仓,较为简单,未体现风险管理策略(如止损、仓位动态调整),实际应用可能面临风险敞口过大问题。
- 滚动微调优化依赖大量历史数据与计算资源,是否能够实时适应突发市场环境及非历史数据驱动行情,仍有待进一步验证。
- 图表中波动性和噪声对预测误差的影响未充分讨论,可能会导致实证结果部分乐观。
- 目前测试数据集中只包含2025年样本,对更长周期的稳定性和普适性尚缺乏完整论证。
总体而言,报告基于充分的数据和合理的技术架构,提供了一套稳健的建模与应用范式,但投资者和用户应留意上述潜在不确定因素和假设条件[page::6,7,8,9,12,14].
---
7. 结论性综合
本报告系统介绍了Kronos大语言时序基础模型,其以金融K线数据为专用领域,通过分词和自回归预训练,结合大规模跨资产频率金融数据,实现针对金融时序数据的精准学习和预测。实验证明,Kronos在沪深300、中证1000等A股指数上的价格预测能力优异,尤其在价格序列的斯皮尔曼相关系数表现突出,最大能达到0.978(未来1日预测,沪深300)。
模型的基础版本择时策略尽管实现正收益,但面临对持续上涨行情识别不足的问题。通过模型微调结合滚动推理参数网格搜索优化,Kronos大幅提升了预测精度,未来5日价格预测相关系数从0.732提升至0.856,绝对误差大幅下降,推动择时策略收益率达到33.9%,年化超额收益达9%,策略灵敏度得到增强,有效捕捉市场动态。
报告中重点展示了各类相关表格与图表数据,分别论证了模型架构、参数规模、预测性能以及策略回测的详细表现,充分体现了金融领域大语言模型的显著潜力及实际应用价值。
总体立场
- 推荐关注以领域专用TSFM为代表的新一代时序模型,Kronos作为开源标准版及其微调滚动优化方案在A股择时中展现出强劲实力;
- 对模型在现实市场中的持续表现应保持谨慎态度,结合风险控制和多策略融合应用更为适宜;
- 该研究为金融时序数据AI化、智能化的发展提供了有力的技术和实践示范。
---
图表举例




---
溯源参考
本文分析内容严格基于《大语言时序模型Kronos的A股择时应用》报告全文,涵盖第0至14页所有核心章节及图表信息[page::0-14]。

