赞
踩
问题 1:建立线路货量的预测模型,对2023-01-01 至 2023-01-31 期间每条线路每天的货量进行预测,并在提交的论文中给出线路DC14→DC10、 DC20→DC35、DC25→DC62 的预测结果。
这一问比较好上手,主要是预测模型。看到这种问题第一时间要想到,数学建模中常见的预测模型有哪些:
我列个个模型分类,大家看看:
1.线性回归模型:线性回归模型是一种基本的预测模型,用于建立自变量和因变量之间的线性关系。该模型的目标是最小化预测值与实际值之间的误差。
2.非线性回归模型:与线性回归模型不同,非线性回归模型可以建立非线性自变量和因变量之间的关系。这种模型通常用于描述数据中的复杂关系。
3.时间序列模型:时间序列模型是建立时间序列数据之间的关系的一种预测模型。该模型通常用于预测未来的趋势和季节性变化。
4.决策树模型:决策树模型是一种基于树形结构的预测模型,用于识别数据集中的模式和关系,并根据这些关系预测未来的结果。
5.神经网络模型:神经网络模型是一种模仿人脑神经元网络的预测模型,通过对大量数据进行训练来学习数据之间的复杂关系,并用于预测未来的结果。
欢迎关注gz号:数模孵化园!一起交流,获取更多免费思路
根据预测模型的使用场景我们可以判断,这里比较适合时间序列分析方法。这里,我们使用ARIMA(自回归移动平均模型)来进行预测。ARIMA 是一种线性模型,可以捕捉时间序列中的趋势、季节性和噪声成分。接着建立线路货量的预测模型
步骤如下:
1.数据预处理:
首先,将附件 1 中的数据导入到合适的数据结构中,如 pandas 的 DataFrame。然后对数据进行清洗和处理,确保没有缺失值和异常值。为了使用ARIMA 模型,需要将数据按照线路和日期进行重塑,以便得到每条线路的时间序列。
具体步骤:
首先,我们查看附件1中的数据,我把中文数据名字改一下,这样方便导入,名字命名为:d.xlsx,数据格式如下:
场地1 场地2 日期 货量
DC3 DC5 2021-01-01 3
DC3 DC10 2021-01-01 4
DC3 DC14 2021-01-01 4
DC5 DC3 2021-01-01 41
DC5 DC9 2021-01-01 3
DC5 DC10 2021-01-01 140
DC5 DC14 2021-01-01 57
导入到 pandas 的DataFrame中。然后对数据进行清洗和处理,确保没有缺失值和异常值,观察数据可以发现有的数据过大,有的没有,我们需要数据预处理,否则预测有问题。
下面给出代码:
- import pandas as pd
- import numpy as np
- import matplotlib.pyplot as plt
- from pmdarima import auto_arima
- from statsmodels.tsa.arima.model import ARIMA
- from sklearn.metrics import mean_squared_error
-
- # 1. 读取数据
- data = pd.read_excel("d.xlsx")
-
- # 2. 数据预处理
- # 转换日期列为 datetime 类型
- data["日期"] = pd.to_datetime(data["日期"])
-
- # 设置日期列为索引
- data.set_index("日期", inplace=True)
-
- # 构建线路货量时间序列数据
- lines = data.groupby(["场地1", "场地2"])
-
- # 3. 训练和预测
- predictions = {}
- for line, group in lines:
- line_id = f"{line[0]}→{line[1]}"
-
- # 对该线路数据按日期排序
- group = group["货量"].sort_index()
-
- # 对数据进行重新采样,按天计算并使用向前填充方法填充缺失值
- group = group.resample("D").sum().fillna(method="ffill")
-
- # 检查数据量是否足够
- if len(group) < 10:
- continue
-
- # 使用 auto_arima 函数自动选择 ARIMA 参数
- arima_model = auto_arima(group, seasonal=False, stepwise=True,
- suppress_warnings=True, trace=False,
- error_action='ignore')
-
- # 拟合 ARIMA 模型
- arima_model.fit(group)
-
- # 对 2023-01-01 至 2023-01-31 期间货量进行预测
- pred = arima_model.predict(n_periods=31)
-
- # 保存预测结果
- date_range = pd.date_range("2023-01-01", "2023-01-31")
- predictions[line_id] = pd.Series(pred, index=date_range)
-
- # 输出指定线路的预测结果
- specified_lines = ["DC14→DC10", "DC20→DC35", "DC25→DC62"]
- for line in specified_lines:
- if line in predictions:
- print(f"Line {line} prediction:")
- print(predictions[line])
- print()
- else:
- print(f"Line {line} has insufficient data for prediction.")
- print()
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。