基于自回归整合滑动平均模型(ARIMA)的时间序列预测-编程实验室

基于自回归整合滑动平均模型(ARIMA)的时间序列预测

最近在折腾时间序列预测的项目，发现ARIMA这玩意儿虽然老派但确实能打。今天咱们就抛开教科书上的复杂公式，用实际代码和通俗解释聊聊怎么用它做预测。先扔个结论：ARIMA的核心就是三句话——看历史数据、算差异、纠误差。

先搞个模拟数据试试水。假设我们有个每周销售额的波动数据：

import numpy as np import pandas as pd np.random.seed(42) base = np.linspace(0, 20, 100) trend = 0.5 * np.arange(100) seasonality = 5 * np.sin(2 * np.pi * np.arange(100)/7) noise = np.random.normal(0, 1, 100) ts_data = pd.Series(base + trend + seasonality + noise, index=pd.date_range('2020-01-01', periods=100, freq='D'))

这时候直接上ARIMA肯定翻车，得先看数据是否平稳。划重点：ADF检验才是亲爹：

from statsmodels.tsa.stattools import adfuller result = adfuller(ts_data) print(f'ADF统计量: {result[0]:.3f}') print(f'p值: {result[1]:.3f}') # 输出大概率大于0.05，说明不平稳

如果p值大于0.05，直接进入差分环节。这里有个骚操作——动态差分直到平稳：

diff_count = 0 current_data = ts_data.copy() while True: result = adfuller(current_data.dropna()) if result[1] < 0.05: break current_data = current_data.diff().dropna() diff_count += 1 print(f'需要差分次数: {diff_count}') # 通常1-2次就能搞定

接下来要确定AR和MA的阶数。别被ACF/PACF图搞懵，实战中直接让auto_arima干活更省事：

from pmdarima import auto_arima model = auto_arima(ts_data, seasonal=False, trace=True) # 输出里找AIC最小的组合，比如(2,1,1)

拿到最佳参数后正式建模：

from statsmodels.tsa.arima.model import ARIMA model = ARIMA(ts_data, order=(2,1,1)) results = model.fit() # 重点看系数P值是否小于0.05，否则考虑删减参数 print(results.summary())

预测阶段注意要包含历史数据的类型：

forecast = results.get_forecast(steps=7) # 别直接用predict，要带置信区间 print(forecast.predicted_mean)

踩过几个坑特别提醒：

遇到周期性数据记得用SARIMA（比如销售数据周循环）
预测结果出现直线下滑？检查是否差分过度
样本量小于50条的建议换模型

最后来个可视化收尾：

import matplotlib.pyplot as plt ts_data.plot(label='历史数据') forecast.predicted_mean.plot(label='预测', color='red') plt.fill_between(forecast.conf_int().index, forecast.conf_int()['lower close'], forecast.conf_int()['upper close'], color='pink', alpha=0.3) plt.legend()

ARIMA就像老中医把脉，数据平稳了、参数调准了，预测效果自然就上来了。下次遇到股票价格、服务器负载这些时间序列，不妨先拿它试试手。

HY-MT1.5-1.8B快速上手：从镜像拉取到首次推理完整流程

HY-MT1.5-1.8B快速上手：从镜像拉取到首次推理完整流程 1. 引言随着全球化进程的加速，高质量、低延迟的机器翻译需求日益增长。腾讯近期开源了混元翻译大模型系列的最新版本——HY-MT1.5，包含两个核心模型：HY-MT1.5-1.8B 和 HY-…

李华

Qwen3-VL API测试：云端1小时快速验证，成本不到2块钱

Qwen3-VL API测试：云端1小时快速验证，成本不到2块钱 1. 为什么需要云端快速测试Qwen3-VL API？ 作为软件工程师，当你需要测试Qwen3-VL这类多模态大模型的API响应速度时，往往会遇到两个现实问题： 本地硬件…

李华

HY-MT1.5-1.8B性能测试：小模型的大作为全解析

HY-MT1.5-1.8B性能测试：小模型的大作为全解析随着多语言交流需求的不断增长，高质量、低延迟的翻译模型成为智能应用落地的关键。腾讯近期开源了混元翻译模型1.5版本（HY-MT1.5），其中包含两个核心模型：HY-M…

李华

如何提升HY-MT1.5翻译准确率？上下文翻译功能调优实战教程

如何提升HY-MT1.5翻译准确率？上下文翻译功能调优实战教程在多语言交流日益频繁的今天，高质量的机器翻译模型成为跨语言沟通的核心基础设施。腾讯开源的混元翻译大模型 HY-MT1.5 系列，凭借其卓越的翻译性能和对复杂场景的支持能力&#xff0…

李华

HY-MT1.5-7B术语库管理API：动态更新实现方案

HY-MT1.5-7B术语库管理API：动态更新实现方案 1. 引言随着全球化进程的加速，高质量、多语言互译能力成为企业出海、内容本地化和跨文化交流的核心需求。腾讯开源的混元翻译大模型 HY-MT1.5 系列，凭借其在翻译质量、多语言支持与场景适应性方…

李华

HY-MT1.5-1.8B快速上手：从镜像拉取到首次推理完整流程

win11 资源管理器 配置技巧

Qwen3-VL API测试：云端1小时快速验证，成本不到2块钱

HY-MT1.5-1.8B性能测试：小模型的大作为全解析

如何提升HY-MT1.5翻译准确率？上下文翻译功能调优实战教程

HY-MT1.5-7B术语库管理API：动态更新实现方案

win11 资源管理器配置技巧