赞
踩
读取数据后,先划分出自变量x和因变量y(不做过多解释),然后进行训练集和测试集的划分(划分方法如下)。
- from sklearn.model_selection import train_test_split
- X_train,X_test,y_train,y_test = train_test_split(x,y,test_size=0.2)#划分训练集和测试集,20%作为测试集,80%作为训练集
- random_model = RandomForestRegressor(n_estimators=300,random_state=42,n_jobs=-1)
- #n_jobs=-1表示训练时所有cpu都用上,可以加快训练速度
-
- random_model.fit(x_train,y_train) #进行训练
-
- y_pred = random_model.predict(x_test) #进行预测
- random_model.score(x_train,y_train) #评估训练集的准确度
- #对训练集进行预测,与实际值y_train进行比较
-
- random_model.score(x_test,y_test) #评估测试集的准确度
- #对测试集进行预测,与实际值y_test进行比较
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。