赞
踩
大作业2:利用机器学习算法,实现:2022年考研成绩预测。
要求:
1.预测一下2022年考研各门课程的分数线。
2.样本数据的获得与收集,自己提供。
3.使用学过的机器学习算法,
4.编写程序代码
5.训练模型
6.模型测试
百度屏蔽博客园链接,点击访问我的博客园帖子查看代码。
针对传统考研成绩变量预测方法的变量关联性低,导致预测结果存在较大误差的问题,提出基于Logistic算法的考研成绩变量预测方法。收集并处理历年考研成绩数据和学生成绩数据,作为成绩变量预测的初始数据。设置考研成绩的预测变量,建立Logistic回归分类算法模型,通过该模型的运算提高考研成绩变量之间的关联性。综合历年考研成绩数据的发展规律以及变量的影响因素分析结果,得出考研成绩变量的预测结果。通过对比实验分析得出结论:基于Logistic算法的考研成绩变量预测方法的预测误差率较低,预测准确性较高。
从历年研究生考试的报名情况看,报考硕士研究生的学生人数持续增加,2018年我国研究生报名人数为238万人,2019年为…
百度屏蔽博客园链接,点击访问我的博客园帖子查看代码。
点击上方发链接获取,全部代码
# -*- coding:UTF-8 -*-
import matplotlib.pyplot as plt
import numpy as np
import types
def Gradient_Ascent_test():
def f_prime(x_old): # f(x)的导数
return -2 * x_old + 4
x_old = -1 # 初始值,给一个小于x_new的值
x_new = 0 # 梯度上升算法初始值,即从(0,0)开始
alpha = 0.01 # 步长,也就是学习速率,控制更新的幅度
presision = 0.00000001 # 精度,也就是更新阈值
while abs(x_new - x_old) > presision:
x_old = x_new
x_new = x_old + alpha * f_prime(x_old) # 上面提到的公式
print(x_new) # 打印最终求解的极值近似值
def loadDataSet():
dataMat = [] # 创建数据列表
labelMat = [] # 创建标签列表
fr = open('testSet.txt') # 打开文件
for line in fr.readlines(): # 逐行读取
lineArr = line.strip().split() # 去回车,放入列表
dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])]) # 添加数据
labelMat.append(int(lineArr[2])) # 添加标签
fr.close() # 关闭文件
return dataMat, labelMat # 返回
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。