Sentiment and Volatility in Financial Markets: A Review of BERT and GARCH Applications during Geopolitical Crises
创建于 更新于
摘要
本文研究了2024年俄乌战争相关新闻情绪与美国股市波动性的关系,采用Fine-tuned BERT模型进行情绪提取,结合带Student-t分布的GARCH模型分析市场波动。结果表明,负面新闻情绪显著增加标普500指数波动性,且VIX指标同样与波动率显著相关,而传统宏观经济指标作用有限,展现出AI与计量模型结合在地缘政治危机下金融风险分析的价值 [page::0][page::4][page::11][page::12][page::13][page::14][page::15]。
速读内容
数据与情绪提取 [page::5][page::6]

- 采集2024年1月至7月17日约10000条美国主流媒体新闻标题。
- 采用BERT预训练并微调模型,结合Token、Segment和Position嵌入,实现对新闻标题的情绪分类,输出正负向情绪logits差值作为情绪得分。
市场波动建模方法 [page::9][page::10]
- 利用GARCH(1,1)模型刻画标普500收益率的条件异方差,残差服从Student-t分布,捕捉金融数据厚尾特征与极端风险。
- 解释变量包括情绪得分、VIX指数、10年期国债收益率、金融压力指数(OFR)、经济政策不确定性指数(EPU),并用样条插值保持数据连续。
主要实证结果 [page::11][page::12][page::13]


| 变量 | 系数 | 标准误差 | p值 |
|----------------|-----------|---------|--------|
| 常数 | -0.2545 | 2.2398 | 0.9098 |
| 情绪得分 | -0.2275 | 0.0703 | 0.0016 |
| VIX指数 | -0.2865 | 0.1083 | 0.0094 |
| 10年期国债收益率 | 0.0016 | 0.0008 | 0.2022 |
| 金融压力指数(OFR) | 0.3966 | 0.5022 | 0.4316 |
| 经济政策不确定性指数(EPU) | -0.0012 | 0.0010 | 0.3249 |
- 负面情绪得分与市场波动显著负相关(p<0.01),负面新闻情绪提升波动幅度。
- VIX指数作为市场恐慌指标同样显著,传统宏观指标(债券收益率、OFR、EPU)未显著。
- 情绪主导波动,反映投资者情绪在地缘政治危机中的核心作用。
量化情绪提取与因子应用 [page::5][page::6][page::7][page::9]
- 采用BERT模型结合Masked Language Modeling和Next Sentence Prediction两阶段预训练,实现财务新闻语义理解。
- 情绪量化公式为正向情绪logits减负向情绪logits,构建连续情绪指标。
- 应用此因子与宏观变量联合回归,以GARCH框架捕捉波动时间序列特征。
- GARCH 残差拟合采用Student-t分布,有效适应数据厚尾与极端事件。
稳健性及模型诊断 [page::17][page::18][page::19]


- Breusch-Pagan检验发现异方差存在,Durbin-Watson检验体现一定自相关。
- 变量不存在高多重共线性,VIF均小于4。
- GARCH残差的Q-Q图显示尾部有厚尾现象,符合Student-t指定模型假设。
结论与前瞻 [page::15]
- AI算法如BERT在金融文本情绪提取中优于传统词典和机器学习。
- 负面情绪是金融市场波动的显著驱动因素。
- VIX指标强化模型对恐慌情绪的反映。
- 未来研究可拓展多语言、多频率及行业情绪影响,探索更专用或升级的Transformer模型,提升预测性能。
深度阅读
金融市场情绪与波动性:BERT与GARCH在地缘政治危机中的应用综述 —— 深度详尽分析报告
---
一、元数据与概览
- 报告标题:Sentiment and Volatility in Financial Markets: A Review of BERT and GARCH Applications during Geopolitical Crises
- 作者:Domenica Mino、Cillian Williamson
- 发布机构:University College Cork,School of Mathematical Sciences
- 发布日期:2024年
- 研究主题:探讨基于先进自然语言处理(NLP)技术BERT与金融时间序列波动率模型GARCH在地缘政治危机(聚焦俄乌战争)期间,新闻情绪对美国股市(S&P 500指数)波动性的影响机制。
核心论点:利用Fine-tune的财务语言适配BERT模型从2024年1月1日至7月17日间的美国主流平台新闻中提取情绪分数,结合基于Student-t分布的GARCH模型,识别新闻负面情绪与股市波动性显著负相关的实证关系。在地缘政治冲突期间,新闻报道情绪成为衡量和解释市场波动的重要指标,展现了AI与计量经济学模型结合的强大潜力,具备实时风险评估和市场动态捕捉能力[page::0]。
---
二、逐节深度解读
1. 引言(Introduction)
- 关键论点:媒体、社交网络和电视报道对公众情绪和投资者情绪具有关键影响。特别是在俄乌战争等地缘政治危机期间,新闻情绪对股市涨跌和波动性的解释力显著。
- 推理依据:传统情绪分析技术因应对金融文本的专业性和复杂语义不足,难以精确捕获投资人情绪变化,因而呼吁采用先进的深度学习架构,如BERT。BERT凭借对上下文的深入理解,能更有效挖掘财务新闻中的隐性信息和语义细微差别,进而提升对股市情绪影响的精准测度[page::1]。
2. 文献回顾与理论框架(Literature Review)
- 投资者情绪与市场波动
投资者情绪驱动股票价格偏离基本面,媒体报道作为情绪传递载体,对市场波动贡献显著。大规模非结构化数据的情绪提取尤具挑战,但计算方法可有效辅助理解市场行为[page::2]。
- 传统情绪分析的局限性
词典法和传统机器学习模型在处理金融专业语言时表现欠佳,难以识别文本中的隐晦表达与否定复杂结构。且需要大规模标注数据,泛化能力有限,难应对金融新闻高频迭代的语言变化[page::2]。
- 深度学习与Transformer技术
BERT通过双向编码器架构,能动态捕捉词语的语义上下文关系和句子内部结构,优于传统方法。基于金融数据微调的FinBERT进一步提升行业适配精度,使情绪识别更准确可靠,适合实时金融市场监控[page::3]。
- 地缘政治事件与市场波动
战争、贸易争端等外生冲击期间市场波动加剧。媒体语言和社交平台作为情绪放大器,推动投资者恐慌和交易行为剧烈波动。俄乌战争的案例体现市场对新闻更新的敏感且快速反应,这促使结合情绪分析与GARCH等模型评估风险成为必须[page::3]。
- GARCH模型应用
GARCH有效捕获金融资产波动的时变特性和持续性,结合情绪变量能深入剖析市场不稳定性的驱动因素。驻足于引入Student-t分布以刻画金融回报的厚尾特性,增强模型对极端事件的适应性和准确度[page::4]。
3. 方法论(Methodology)
- 数据收集
选取覆盖顶级100家美国新闻源的Goperigon平台数据,采集2024年1月至7月17日逾1万条与俄乌战争相关的新闻标题。数据预处理包括大小写转化、错误纠正、格式清洗,确保文本质量以利NLP建模[page::4-5]。
- BERT情绪分析框架
BERT输入由Token、Segment及Position三类嵌入构成,模型通过Masked Language Model和Next Sentence Prediction联合预训练,形成上下文敏感的词向量表示。微调阶段调整参数以适应三分类情绪判别(积极、中性、消极),情绪分数以正负logit概率之差定量表达[page::6-8]。
- 市场情绪关联分析
构建含情绪得分、VIX(恐慌指数)、OFR金融压力指数、EPU政策不确定性指数以及10年期国债收益率的多元线性回归模型,初用OLS分析存在异方差和自相关问题,后采用GARCH(1,1)模型优化。应用学生t分布调节残差厚尾特性,提升对金融极端波动的拟合能力[page::9-10]。
- 数据连续性处理
对指标空缺采用样条插值法连接,实现数据平滑过渡,保证时间序列完整,有助于统计推断的稳健性[page::10]。
4. 结果(Results)
- 情绪走势
BERT提取的日均情绪分数整体偏负,显示新闻报道常传递负面情绪,与持续的地缘政治紧张局势相符(图5)。大部分新闻标题被归类为负面或中性(图6),体现严峻战争形势下媒体报道的情绪倾向[page::11-12]。
- GARCH回归结果
情绪得分系数-0.2275,统计显著(p=0.0016),表明负面情绪增加市场波动。VIX同样呈现显著负相关(系数-0.2865,p=0.0094),反映恐慌情绪与实际波动同步。其他宏观变量(国债收益率、OFR、EPU)未达到统计显著,作用微弱[page::12-13]。
- 模型反映
整体调整后R²为0.1481,说明情绪和VIX能解释部分市场波动,宏观指标作用有限。建议新闻情绪和恐慌指数是短期风险控制和投资决策更有效的市场行为指标[page::13]。
5. 讨论(Discussion)
- 与文献对接
结果支持已有研究,确认地缘政治风险驱动投资者情绪波动,从而造成市场价格剧烈波动。媒体情绪成为市场不确定性的重要传播和放大渠道,投资者敏感度显著增高[page::13-14]。
- VIX的角色强化
作为市场恐慌的前瞻性指标,VIX高波动对应市场实际波动的提升,且与媒体情绪相互补充,体现情绪驱动的双重机制[page::13]。
- 传统指标效力减弱
EPU、金融压力指数以及国债收益率短期内难以反映敏感的投资者情绪波动,宏观基本面信息时滞较大,不适合即时金融市场风险评估[page::13-14]。
- Student-t GARCH模型表现优异
该模型能有效捕捉金融数据中的厚尾分布和波动聚集特点,适应极端市场环境,提升波动率预测精度[page::14]。
- 技术优势与金融市场行为变迁
BERT等深度学习模型超过传统情绪识别工具在金融领域的表现,因其语义理解和上下文捕获能力强。市场日益成为情绪驱动,投资者有限理性和注意力限制促使媒体语言影响力日增[page::14]。
- 政策与实务启示
监管机构可利用实时情绪指标调控市场风险,投资经理借助AI情绪分析优化风控和交易策略,提升危机应对能力。情绪分析融入风险监控和投资决策平台,成为新的行为风险管理工具[page::14]。
6. 结论与未来研究(Conclusions and Recommendations)
- 总结
本文结合BERT深度情绪提取与基于Student-t分布的GARCH模型,实证确认俄乌战争相关负面新闻情绪显著提升美国股市波动性,强化了情绪与市场行为的实证联系。传统宏观指标在此情境下作用减弱,情绪指标和VIX构成更敏感的风险信号[page::15]。
- 研究贡献
提供AI与计量金融结合的案例,验证了深度学习模型在复杂金融语境中情绪测度的有效性,为危机时期市场风险预测提供了新范式。强调媒体情绪改变传统金融市场理论中的理性预期假设[page::15]。
- 局限与未来方向
1)数据局限于美国新闻,未来可扩展至国际多语种数据以提升外延和泛化能力。
2)研究基于日频数据,后续可探索高频(分钟级)情绪波动对短期交易的影响。
3)比较FinBERT、RoBERTa、DeBERTa等金融领域模型效果,优化模型选择。
4)细化行业或个股视角,评估情绪对不同行业板块的异质影响。
5)开发实时情绪监控与预测平台,为投资者和政策制定者提供行为风险决策支持[page::15-16]。
---
三、图表深度解读
图1:样本期间新闻采集条数分布(第5页)
- 描述:展示2024年1月至7月每月采集的新闻标题数量。
- 解读:从图中可见,新闻数量相对稳定,5月达到峰值,7月有所下降,说明该期间媒体关注持续且集中。数据量规模保证情绪分析的代表性和统计功效。
- 联系文本:此图支持后续使用海量数据训练BERT情绪模型的基础,确保情绪特征稳定可靠[page::5]。
图2:BERT输入嵌入机制(第6页)
- 描述:示意BERT输入如何通过Token嵌入、句子嵌入和位置嵌入共同作用形成输入表示。
- 解读:通过将多个嵌入向量相加,模型能够掌握词语语义、句子归属及词序等信息,增强文本上下文理解能力。
- 联系文本:该结构解释了BERT精确捕捉复杂金融文本语义的机制,是情绪分类准确性的技术支撑[page::6]。
图3:BERT预训练任务架构(第7页)
- 描述:展示Masked Language Model(MLM)和Next Sentence Prediction(NSP)两个预训练任务的流程。
- 解读:MLM通过随机掩码训练模型预测被遮蔽词语,NSP判断两句文本是否相连,训练模型理解上下文关联,为情绪识别提供丰富语言知识。
- 联系文本:预训练任务强化了BERT捕获金融新闻情绪内涵的能力,提升深层语义识别水平[page::7]。
图4:BERT模型微调示意(第8页)
- 描述:表示BERT在具体下游任务(如自然语言推理、命名实体识别、问答等)上的微调过程。
- 解读:模型可根据任务目标调整权重,实现多样化应用,本文应用于金融新闻情绪分类。
- 联系文本:强调整体架构的灵活性与普适性,是本研究成功应用的基础[page::8]。
图5:2024年1-7月平均每日新闻情绪分数走势(第11页)
- 描述:呈现情绪分数的时间序列,负值占主导,波动明显。
- 解读:整体情绪持续偏负,反映持续紧张的地缘政治背景和媒体报道负面导向。波动幅度变异提示市场情绪动态多变。
- 联系文本:支持本报告关于疫情期间情绪负面与市场波动关系的核心论断[page::11]。
图6:情绪类别频数分布(第12页)
- 描述:柱状图显示负面新闻数量明显多于中性和正面,正面新闻最少。
- 解读:媒体报道以悲观消极为主,强化市场不确定性的情绪氛围。
- 联系文本:辅助说明数据样本情绪特征的统计特征,保障模型训练与分析的情境相关性[page::12]。
表1:GARCH(1,1)模型系数估计(第13页)
| 变量 | 系数 | 标准误差 | p值 |
|---------------|----------|----------|----------|
| Constant | -0.2545 | 2.2398 | 0.9098 |
| Sentiment Score| -0.2275 | 0.0703 | 0.0016 |
| VIX | -0.2865 | 0.1083 | 0.0094 |
| Bond 10-years | 0.0016 | 0.0008 | 0.2022 |
| OFR | 0.3966 | 0.5022 | 0.4316 |
| EPU | -0.0012 | 0.0010 | 0.3249 |
- 解读:
- 负面情绪系数负且显著,说明情绪恶化加剧市场波动。
- VIX显著,印证了市场恐慌气氛与价格波动的紧密联系。
- 传统宏观变量不显著,提示在地缘政治危机中,投资者更多依赖情绪和市场预期。
- 意义:提供模型统计验证,增强结论置信度[page::13]。
附录图7-8:残差诊断与分布检验(第18-19页)
- 图7显示残差与情绪的关系,未显著具有模式,说明模型残差独立性较好。
- 图8 Q-Q图显示残差不完全正态分布,支持采用Student-t分布调整,是模型选择的重要验证[page::18-19]。
---
四、估值分析
本报告属于金融市场行为分析和风险管理范畴,不涉及证券估值或目标价格设定,因此无直接估值部分。其核心技术是利用BERT提取情绪指标,配合GARCH波动率模型评估市场风险。这种方法优势在于捕捉时间序列条件异方差特征和文本数据中情绪信息的融合,支持动态风险监测,而非静态估值测算。
---
五、风险因素评估
报告强调的风险因素包括:
- 数据局限性风险:仅依赖美国新闻媒体可能产生区域性偏差,影响情绪信号的代表性与普适性。
- 模型风险:GARCH及情绪模型假设及选择(如Student-t分布),可能对异常事件的解释存在不确定性。
- 信息滞后风险:基于日频数据,可能忽视更快频率的情绪波动与市场反应,影响即时性。
- 外部冲击复杂性:地缘政治事件的非线性冲击可能导致模型无法完全捕捉其全貌,尤其是高非线性行为。
报告建议未来研究从更广泛数据、多模型比较、高频数据引入、多层次应用等方面寻求缓解[page::15-16]。
---
六、批判性视角
- 潜在偏见:数据局限于美国新闻源,可能受本地政治倾向和文化影响,导致情绪判定偏差,该点在结论部分有所自我提示。
- 假设稳健性:情绪分数与市场波动的因果方向难完全断言,模型主要体现相关性,未充分排除反向因果或第三方变量的影响。
- 时间粒度限制:采用日线数据,可能无法捕捉快节奏交易中的实时情绪波动,限制了对短期高频市场行为的揭示。
- 传统指标的排他性偏强:虽然宏观变量未显著,该结论依赖于所用变量及数据区间,其他经济环境可能不同,需谨慎泛化。
整体看,报告分析细致,透明地揭示了模型的适用范围和局限,呈现较为稳健的结论。
---
七、结论性综合
本报告深入解析了情绪分析与波动率建模在地缘政治风险背景下的融合应用,重点突出以下几点:
- 利用大规模新闻标题数据,通过BERT深度模型提取细致、语境丰富的情绪分数,克服传统方法在金融文本处理上的不足。
- 结合基于Student-t分布的GARCH(1,1)模型,实现对市场波动的动态刻画,充分反映金融市场的厚尾风险特征。
- 实证发现新闻负面情绪与S&P 500指数波动性呈显著负相关,凸显媒体情绪在投资者行为中的核心作用。与此同时,VIX作为市场恐慌的重要前瞻指标,与情绪分数共同构建了对市场风险的双重解读框架。
- 传统宏观指标(10年期债券收益率、金融压力指数、经济政策不确定性指数)在本样本期间对短期波动的预测能力有限,侧面表明在地缘政治危机时期,情绪与预期变化成为市场驱动力。
- 图表中新闻采集量保障数据广度,BERT模型的技术细节精彩呈现了深度学习与自然语言理解的机理,实证结果及诊断图显著体现分析稳健性。
- 结论强调了AI与计量经济学相结合的创新路径,具备实时风险评估与行为风险监控的实际应用前景,为危机时期金融市场行为提供了更细腻和灵敏的分析工具。
最终,报告推荐未来拓展国际多语种数据、高频分析,比较新兴Transformer模型,以及探索行业层面异质性效应和开发实时监控平台,推动金融市场的智能化风险预警体系建设[page::0-16]。
---
总结
本报告以严谨的学术框架和丰富的数据及模型应用为基础,系统展示了BERT模型和GARCH方法在捕捉新闻情绪与金融市场波动关系中的价值。通过详尽的章节解析与图表解读,明确了地缘政治新闻情绪负向影响市场稳定性的机制及程度,突出了情绪分析在现代金融风险管理中的战略意义。
---
若需针对运行代码、模型细节或数据准备方法作进一步高细节解读,也可提出。

