当前位置:   article > 正文

基于多元时间序列对高考预测分析案例

多元时间序列分析案例
本文借助 ARIMA模型,通过对中国的往年高考录取率进行建模和预测,并验证和检验模型精度和可行性,来应用模型来估计未来的录取率,进一步得出2030年中国高考录取率的预测值。

本文系读者投稿 

作者简介:理智,河北科技大学的大三学生,主攻深度学习。和大多数程序员一样,他是个乐观主义者,大量的时间都在调试代码,在调试中满怀希望,克服遇到的无数挫折。

01 数据来源

本文采用的数据来自世界银行官网(https://data.worldbank.org.cn/)的中国宏观经济数据集,现行版本的数据集共 45行12列,提供自1959年至2021年中国大陆12个指标每年的位置和数值。数据集格式采用国际通用惯例,每年的记录包含数值记录和比率记录,记录包含了时间(世界时)、人口(万人)、金额(亿美元)、比例等指标,数据集的结构如表1所示,图1画出了中国1949至2021年间的5个指标关系密切程度的热力图

表 1 世界银行数据列表 (↔️滑动查看更多)
出生年高考年新生儿人口(单位:万人)大学招生扩招政策,布尔变量,0表示无,1表示是出生年GDP(亿美元)高考年GDP(亿美元)高考年GDP占世界比例(%)参加高考人数(单位:万人)高考录取人数(单位:万人)高考录取率高等教育毛入学率参加高考人数同比增长
19591977163505501749.42.39570274.741.65NaN
1960197814020597.21495.41.7361040.26.592.870.07
196119799490500.61782.82.23468285.982.95-0.233
1962198024510472.11911.52.12333288.411.14-0.288
1963198129340507.11958.71.672592810.810.95-0.222
f5ecb3241a0f6ca2ce0670d5cb5a4eee.png
图1 相关性热力图

02 统计分析

在1959年~2020年的61年间,新生儿数量有较大波动,1987年后新生儿数量呈单调递减趋势,且2016年后下降最为明显。

GDP方面,呈上升趋势,1993年后变化较为明显。

整体上新生儿数量与出生年GDP无较为明显的关系,但存在部分区间负相关关系(1987年后)。

be714d864d760cc7419257a8a96cbf5d.png
图2 人口趋势图

高考录取率与当年GDP如图3。两者均整体呈上升趋势,初步判断两者之间存在正相关关系。

03013d521effbbb6cd49c0392450eec1.png
图3 高考年录取率与GDP图

高考参加人数及与之相关的情况:参加高考的人数逐年增加,但是参加高考的人数的年同比增长变化波动大,无明显特征,如图4。

e2b49dae9a8ff7346c6b6231d036b444.png
图4 高考录取人数详情图

观察高等教育毛入学率及当年GDP全球占比可知如图5。

68c653d4d1505bf22dc2d0a75e4fd6ad.png
图5 中国教育毛入学率与GDP占比动态图

毛入学率与全球GDP占比呈上升趋势,初步判断两者间存在正相关关系。

03 时间序列预测高考录取率

在此处,我们应用ARIMA模型进行高考录取率预测。这里ARIMA模型可以点击查看详情

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/109374
推荐阅读
相关标签