当前位置:   article > 正文

pandas对Excel.csv提取出数据,numpy成矩阵x和y 回归数据的特征选择之数据集处理_机器学习pandas处理excel提取特征值

机器学习pandas处理excel提取特征值

回归数据的特征选择

参考:https://machinelearningmastery.com/feature-selection-for-regression-data/

数据集的处理

利用pandas对Excel.CSV提取出数据,然后用numpy把它变成矩阵x和y。

import pandas as pd
import numpy as np
tab = pd.read_csv('D:/DICOM/train1.csv')
x_Weeks = tab['Weeks']
x_Weeks = np.array(x_Weeks)
x_Percent = tab['Percent']
x_Percent = np.array(x_Percent)
x_Age = tab['Age']
x_Age = np.array(x_Age)
x_Sex = tab['Sex']
x_Sex = np.array(x_Sex)
x_SmokingStatus = tab['SmokingStatus']
x_SmokingStatus = np.array(x_SmokingStatus)
y = tab['FVC']
y = np.array(y)
#变成列向量
x_Weeks = x_Weeks[:, np.newaxis]
x_Percent = x_Percent[:, np.newaxis]
x_Age = x_Age[:, np.newaxis]
x_Sex = x_Sex[:, np.newaxis]
x_SmokingStatus = x_SmokingStatus[:, np.newaxis]
y = y[:,np.newaxis]
#多个向量组合
X = np.concatenate((x_Weeks,x_Percent,x_Age,x_Sex,x_SmokingStatus),axis=1)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24

得到X和Y。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/354615
推荐阅读
相关标签
  

闽ICP备14008679号