`

Bitcoin Price Forecasting Based on Hybrid Variational Mode Decomposition and Long Short Term Memory Network

创建于 更新于

摘要

本研究提出结合变分模态分解(VMD)与长短期记忆网络(LSTM)的混合深度学习模型,用于比特币价格预测。通过将比特币价格序列分解为若干内禀模态函数(IMFs)并对其分别建模,最终聚合预测结果。与传统单一LSTM模型相比,混合模型在RMSE、MAE、R²等指标上表现更优,且能稳定实现30天的价格走势预测,展现出捕捉比特币价格非线性及非平稳性的强大能力 [page::0][page::4][page::7][page::9][page::10]。

速读内容


研究背景与目标 [page::0][page::1]

  • 比特币价格波动剧烈且受多种复杂因素影响,传统线性模型如ARIMA难以精准预测。

- 本文提出基于VMD分解与LSTM组合的混合模型,目的是提升比特币价格的短期和中长期预测准确度。

数据与方法论概述 [page::2][page::3]

  • 使用2017年8月至2025年6月期间2863个交易日的比特币收盘价数据。

- 采用VMD进行15模态分解(IMFs),每个IMF单独训练LSTM模型,窗口长度为30天。
  • 采用RMSE、MAE、MSE和R²四种指标评估模型性能。


VMD分解行为和模式选择 [page::4][page::5]


  • 剩余能量随着模态数K增加显著下降,超过K=10后改进边际递减。

- 最终选择K=15,平衡信号分解的充分性和计算复杂度。

IMF分解结果展示 [page::5][page::6]


  • IMF1体现比特币长期趋势;IMF7表现中频波动,可能为季节性或市场周期;IMF15呈现高频噪声。

- 不同频段的分解便于LSTM聚焦各模态特色,提升拟合和预测表现。

VMD-LSTM混合模型训练与预测表现 [page::6][page::7]



  • 训练过程收敛良好,无明显过拟合现象。

- 模型预测价格曲线与实际波动高度吻合,尤其在高波动时期表现稳健。

30天期预报趋势分析 [page::8]


  • 预测结果显示未来30天比特币价格总体呈缓慢下跌趋势,波动幅度较为平稳。

- 减少了输入信号的噪声,体现出VMD的滤波降噪优势。

传统LSTM模型对比分析 [page::9]



| 指标 | VMD-LSTM Train | VMD-LSTM Test | Plain LSTM Train | Plain LSTM Test |
|--------|----------------|---------------|------------------|-----------------|
| RMSE | 352.87 | 1619.63 | 1398.54 | 4005.32 |
| MAE | 240.39 | 1397.18 | 918.58 | 3157.91 |
| MSE | 124,520.34 | 2,623,211.34 | 1,955,913.88 | 16,042,578.17 |
| R² | 0.9995 | 0.9934 | 0.9922 | 0.9598 |
  • 混合模型在训练和测试上均显著优于单一LSTM,误差更低,拟合优度更高。

- 表明先分解再建模方式有效改善了价格序列的非平稳性问题,降低了过拟合风险。

结论与未来展望 [page::9][page::10]

  • 本研究证明VMD与LSTM结合在比特币价格预测中具有明显优势。

- 该方法适合处理非线性、非平稳复杂金融序列,未来可向其他金融资产或医学时序数据推广。

深度阅读

深度财务分析报告解构——《基于混合变分模态分解与长短期记忆网络的比特币价格预测》



---

1. 元数据与概览


  • 报告标题:《Bitcoin Price Forecasting Based on Hybrid Variational Mode Decomposition and Long Short Term Memory Network》(基于混合变分模态分解与长短期记忆网络的比特币价格预测)

- 作者及单位:Emmanuel Boadi,隶属美国德克萨斯里奥格兰德谷大学数学与统计科学学院
  • 发布日期:文中未明确标明具体发布日期,但数据包含至2025年,推测研究较新

- 研究主题:聚焦比特币价格的时间序列预测,提出了基于混合模型——变分模态分解(VMD)与长短期记忆网络(LSTM)的价格预测方法

核心论点与贡献



研究提出了一种针对比特币高波动性特征的混合深度学习预测模型。核心流程包括:
  • 利用VMD将复杂的原始比特币价格时序数据分解成多个具有不同频率特征的内蕴模态函数(IMFs);

- 针对每个IMF,训练单独的LSTM模型;
  • 将各IMF的预测结果加总生成最终的整体预测序列。


实证结果显示,该混合模型在均方根误差(RMSE)、平均绝对误差(MAE)及决定系数($R^2$)等多个评价指标上均优于传统的纯LSTM模型,且有效支持30天的短期预测。

[page::0,1,2,3]

---

2. 逐节深度解读



2.1 引言部分(Introduction)


  • 介绍了比特币去中心化、本质及交易链路(区块链)的基础知识。

- 强调比特币价格的高波动性及传统预测模型(如ARIMA等)在捕捉非线性、非平稳特征上的不足。
  • 引入VMD作为优于传统经验模态分解(EMD)的信号处理方法,具备更好的噪声抑制和模式分离能力,为构建混合预测模型奠定理论基础。

- 提出采用“VMD分解+LSTM建模”的混合模型结构,以更充分捕捉比特币价格序列的多频率动态特性。

2.2 相关工作(Related Work)


  • 回顾了比特币历史上的预测方法,从贝叶斯回归、决策树、ARIMA,到深度学习网络(LSTM、GRU、RNN等)。

- 指出纯统计模型往往因线性假设与非平稳、噪声复杂的比特币价格不匹配导致预测效果有限。
  • 介绍了信号分解技术(如EMD及其局限性),突出VMD在增强信号分离及提升预测性能方面的优势。

- 该节充分定位本研究的创新点在于首次将VMD与LSTM结合应用于比特币价格预测。

2.3 方法论(Methodology)


  • 数据采集与处理

- 使用Yahoo Finance数据,2017年8月至2025年6月,总计2,863条每日收盘价数据。
- 消除缺失值,加入时间特征,进行MinMax归一化处理。
  • 变分模态分解(VMD)

- VMD原理:通过变分优化约束,使信号分解为若干个带宽有限的IMFs,公式精确描述了每个IMF及频率的联合求解,其中强调了所有IMF的合和等于原始信号。
- 通过残差能量阈值选择分解模态数$K$,最终确定为15。
  • LSTM网络设计

- 每个IMF均由单独LSTM模型建模。
- 使用30天的时间步长作为输入序列窗口。
- 训练参数:Adam优化器,均方误差损失函数,训练20轮,批处理大小32。
  • 混合模型预测流程

1. VMD分解信号为15个IMF。
2. 生成监督训练序列。
3. 训练单个LSTM对应每个IMF。
4. 分别预测每个IMF后,将预测结果求和恢复原始序列预测。
5. 逆归一化回标原始价格尺度。
  • 模型性能评价指标

- RMSE,MAE,MSE和决定系数$R^2$均作为回归评估指标,定义明确,标准且全面。

[page::2,3]

2.4 结果与讨论(Results and Discussion)



2.4.1 描述性统计分析


  • 统计数据显示,最大值达到\$111,673.28,最小值\$3,154.95,均值\$30,872.06,标准差高达\$26,673.85,表现比特币价格的极大波动和右偏分布。

- 由此反映出比特币市场的高度非线性波动,传统线性模型难以适应。

2.4.2 模式数量选择——残差能量分析


  • 图1揭示随着模态数$K$增加,残差能量快速递减,超过$K=10$之后减少幅度趋于平缓。

- 研究选择$K=15$,在保证分解充分的同时平衡计算效率和预测表现。

Figure 1

2.4.3 分解结果示例(IMF)


  • 通过VMD,将价格信号分解成15个不同频率的IMF。

- 图2中展示的IMF 1、IMF 7和IMF 15分别代表长周期趋势、中频周期震荡和高频噪声,充分展现VMD的频率分离能力。

Figure 2

这一频率分解的细粒度使模型能分别拟合不同时间尺度的价格变化,更好地理解并预测价格动态。

2.4.4 LSTM模型训练过程


  • 图3展现了IMF 2、7、15的训练和验证损失曲线,均表现出快速下降且未见明显过拟合,说明训练稳定且泛化能力良好。


Figure 3

2.4.5 综合预测表现


  • 图4将模型预测结果与实际比特币价格曲线叠加,模型预测紧密贴合实际,尤其在高波动区间表现出色。

- 绿线划分了训练与测试集,显示模型在训练和测试阶段均保持高准确性。

Figure 4

2.4.6 30天价格预测


  • 图5展示未来30天预测趋势,呈现平滑下降走势,反映模型学得的近期价格动量。

- 预测曲线无明显异常波动,表现出VMD的噪声抑制优势。

Figure 5

2.4.7 对比单一LSTM模型


  • 单纯使用LSTM直接建模原始序列(图6)虽然训练过程表现稳定,但最终误差指标显著不及VMD+LSTM。


Figure 6

2.4.8 性能量化对比(表2)



| 指标 | VMD-LSTM 训练 | VMD-LSTM 测试 | 纯LSTM训练 | 纯LSTM测试 |
|-------|-----------------|-----------------|--------------|--------------|
| RMSE | 352.87 | 1619.63 | 1398.54 | 4005.32 |
| MAE | 240.39 | 1397.18 | 918.58 | 3157.91 |
| MSE | 124,520.34 | 2,623,211.34 | 1,955,913.88 | 16,042,578.17|
| $R^2$ | 0.9995 | 0.9934 | 0.9922 | 0.9598 |
  • 可以看到,混合模型在所有指标上均大幅优于纯LSTM,测试集RMSE和MAE几乎减半,MSE下降超过6倍。

- $R^2$显著接近1,表明模型高度拟合数据的方差,具有极佳的解释力。
  • 说明使用VMD分解有效减少噪声和非平稳性,提高了LSTM的学习效率与泛化能力。


[page::4,5,6,7,8,9]

---

3. 图表深度解读


  • 图1(残差能量与模态数关系)

- 呈现出递减且趋于平稳的趋势,合理支持选择15个模态这一中间值折中。
- 显示模态数选择对分解质量有显著影响,过小导致噪声未充分去除,过大增加冗余。
  • 图2(IMF示例)

- IMF1的平滑上升代表长期价格趋势,IMF7反映中周期市场震荡,而IMF15则显示明显的高频噪声。
- 提供了分解有效性的视觉验证,帮助理解各频段在整体价格中的贡献。
  • 图3(训练损失曲线)

- 训练与验证损失同步下降,无过拟合迹象,为模型训练合理性提供证据。
  • 图4(真实价值与预测对比)

- 预测与实际价格走势高度吻合,暗示模型捕捉到了非线性及长短期依赖。
  • 图5(30天预测走势)

- 平滑的价格下降趋势体现出模型对近期市场情绪的合理捕获,不包含不合理剧烈波动,体现了VMD的噪声抑制作用。
  • 图6(单一LSTM损失曲线)

- 单模型训练也趋于稳定,但误差明显更大,无法充分应对高波动和噪声。
  • 表2(性能指标对比)

- 量化展现了混合模型提升预测准确性的显著优势,支撑研究的主张。

---

4. 估值分析



本报告未涉及直接的公司估值或传统金融资产估值方法。其核心在于构建和验证预测模型精度。所用指标(RMSE, MAE, MSE, $R^2$)均为统计误差与拟合优度衡量标准,适合时间序列预测准确性评价。

---

5. 风险因素评估



报告未专门铺陈风险因素章节,但隐含风险包括:
  • 模型过拟合风险:通过验证集损失和测试集性能监控,模型训练过程显示无过拟合迹象。

- 参数选择风险:模态数K选择对性能影响较大,虽计算残差能量进行判定,但仍存在参数设置主观性。
  • 数据局限风险:使用历史数据进行训练,未涉及宏观经济、政策变化等外生变量可能导致模型失效。

- 市场高波动与黑天鹅事件:极端事件可能无法通过历史学习充足表达,预测存在固有限制。

---

6. 批判性视角与细微差别


  • 研究方法结合信号处理与深度学习,适应了比特币市场非线性、非平稳特征,但未整合宏观经济指标、社交媒体情绪等多元因素限制预测全局准确度。

- 模型表现优异,$R^2$极高,但实际价值也可能来源于过拟合历史数据的隐性风险;不同数据集或市场环境下泛化能力尚待验证。
  • 报告中对参数选择(如模态数K具体确定标准)的解释较充分,但对LSTM结构(层数、隐藏单元数等超参数)缺乏详细说明,对结果可重复性有一定影响。

- 对比模型仅限单一LSTM,未包含更多现代机器学习对比(如GRU、Transformer等),进一步验证不足。
  • 未来工作建议引入注意力机制或其它先进网络以提升长期依赖捕获能力。


---

7. 结论性综合



本报告通过提出一种创新性的混合模型——变分模态分解(VMD)与长短期记忆神经网络(LSTM)结合框架,实现了对比特币价格的高效预测。该模型通过先对复杂的比特币价格时间序列进行多层频率分解,获得15个内蕴模态函数(IMFs),解决了价格序列中非平稳性和噪声干扰问题。对各IMF分别建模后再集成预测,大幅提升了预测准确性和拟合能力。

关键发现:
  • VMD滤除噪声与分解非平稳信号,有效增强了LSTM对不同频率信息的学习能力;

- 在训练及测试阶段,VMD+LSTM模型在RMSE、MAE、MSE和$R^2$四项指标上均显著优于单一LSTM,提高预测稳定性和准确性;
  • 模型可实现较精准的30天比特币价格走势预测,预测曲线平滑,无明显无理波动,科学地反映了市场的动态变化趋势。


图表数据透彻验证了该混合架构的优势,特别是残差能量与模式数量选择的合理性验证(图1)、频率分解后各IMF特征分明(图2)、训练损失的下降趋势(图3)、以及模型预测结果和实际价格紧密匹配(图4)。30天预测图(图5)和对比实验(表2)进一步强化模型优越性。

综合来看,本研究展示了将信号分解技术与先进深度学习方法结合应用于加密货币价格时序预测的强大潜力,为未来金融时间序列预测研究提供了新范式。尽管仍存在多方面可以深化的领域(如参数选择的系统优化、多样化对比模型、引入更多影响因子等),该报告成功证明了VMD-LSTM混合模型在复杂、波动性极高的比特币市场中的实际价值。

[page::0~10]

---

总结



该研究通过详尽的数据处理、模型设计与实验对比,从理论原理到实践应用层面,系统而深入地验证了VMD与LSTM混合模型用于比特币价格预测的有效性。其结构清晰,论据有力,数据充分,是加密货币价格预测领域的重要参考文献。研究中所有主要的表格与图表均得到了充分解析与论证,展现了复杂非线性时序预测的精妙方法论和前沿技术应用价值。

报告