赞
踩
数据集下载地址: https://www.kaggle.com/vikramb/mobile-price-eda-prediction
1. 提出问题
手机存在许多参数,包括电池容量,是否有蓝牙,微处理器执行命令的速度等等。本次实验意在探讨手机的价格与这些参数的关系,并尝试根据这些手机参数,预测手机的价格范围,并展示出预测的准确度。
2. 准备工作
导入需要用到的库,包括pandas,matplotlib以及机器学习的sklearn等等。
- import pandas as pd
- import matplotlib.pyplot as plt
- import seaborn as sns
-
-
- from sklearn.tree import DecisionTreeClassifier
- from sklearn.linear_model import LogisticRegression
- from sklearn import model_selection
- from sklearn.preprocessing import StandardScaler
- from sklearn.model_selection import train_test_split
- from sklearn.metrics import accuracy_score
- from sklearn.neural_network import MLPClassifier
3. 数据预处理
导入输入数据集,包括训练集和测试集。
- df_train = pd.read_csv('C:/Users/28555/Desktop/train.csv')
- df_test = pd.read_csv('C:/Users/28555/Desktop/test.csv')//文件存在电脑的位置
然后进行数据清洗,将训练集中的价格范围(price_range)这一列分离出去,方便之后的机器学习;同时将测试集中的ID一列剥离。
- X = df_train.drop(['price_range'],axis = 1)
- y = df_train['price_range']
- test = df_test.drop(['id'],axis = 1)
4. 可视化分析
由于与手机价格相关的参数较多,一个一个图地输出非常麻烦,因此可直接用热力图&
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。