赞
踩
在这次美赛中,我写了两篇C题文章,分别用了不同的模型,但是是一个大概相同的一个思路。
在第一篇中:
1.本题需要我们开发一个模型来解释报告结果的数量变化,并且使用这个模型来预测2023年3月1日的结果数量区间,这里我们用梯度提升回归来对数据进行预测,接着我们确定了几个有趣的特征,包括单词报告的分布,谜题的难度,以及单词长度和报告频率之间的关系,这里采用单因素方差分析进行求解,最后,我们采用皮尔逊相关性对数据进行分析,通过热力图即可得出各个报告分布的相关性。
2.需要我们开发一个模型来预测单词报告的频率,我们使用LSTM模型来预测EERIE这个单词的百分比,该模型基于几个因素,使用三输入七输出的方式进行预测,通过结果去判断拟合结果是否较好。通过模型的准确性来展示我们对模型的信心。
3.我们首先使用critic权重法改进的灰色关联得出每天的难度得分,然后使用K-means聚类来分成三类,易,中,难。最后使用XGboost、Catboost、Adaboost三个模型同时解题,对比分类算法的三大评价指标,在三种算法中选择精度较高的模型进行后续求解,为了进一步查看预测结果,采用混淆矩阵查看真实值与预测值。
4.我们将分析数据集,寻找其其他有趣的特性。
在第二篇中:
1.需要预测报告实验结果,由于它是一个时间序列的数据,我们可以通过ARIMA模型来预测2023年3月1日这一天的结果区间。然后我们选择一些分类指标用单变量方差分析来确定是否对困难模式下的百分比有影响
2.首先,这是一个多输入多输出的问题,我们选择BP神经网络来进行拟合,选择上面的三个指标作为输入,而选择某一天的(1、2、3、4、5、6、X)的相对百分比作为输出,来预测EERIE这个单词的百分比
3.首先,我们利用KMEANS来对7维百分比数据进行聚类,成功将其聚为3类,分别是容易、一般、难。然后再使用随机森林对EERIE进行分类,得出分类结果
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。