当前位置:   article > 正文

顾客购买服装的分析与预测(决策树)_顾客购买决策树

顾客购买决策树

实验内容

采用决策树算法,对“双十一”期间顾客是否买服装的数据集进行分析与预测。
顾客购买服装数据集:包含review(商品评价变量)、discount(打折程度)、needed(是否必需)、shipping(是否包邮)、buy(是否购买)。

实验要求

1.读取顾客购买服装的数据集(数据集路径:…/3_buy.csv),探索数据。
2.分别用ID3算法和CART算法进行决策树模型的配置、模型的训练、模型的预测、模型的评估。

数据集的展示:
在这里插入图片描述

实验代码

import pandas as pd
import numpy as np
from sklearn import tree
from sklearn import metrics
from sklearn.model_selection import train_test_split

#1.读取顾客购买服装的数据集(数据集路径:data/data76088/3_buy.csv),探索数据。
data=pd.read_csv("E:/python/SpyderCode/work/3_buy.csv")
data.info()
print(data.columns)
print(data.head())


#2.分别用ID3算法和CART算法进行决策树模型的配置、模型的训练、模型的预测、模型的评估。
X=data.iloc[:,0:4]
y=data.iloc[:,4:]
X=np.array(X.values)
y=np.array(y.values)
train_X,test_X,train_y,test_y=train_test_split(X,y,test_size=0.5)
#用ID3算法
#模型配置
model=tree.DecisionTreeClassifier(criterion='entropy')#ID3
#模型训练
model.fit(train_X,train_y)
#模型的预测
pre_y=model.predict(test_X)
#模型的评估
print("\nID3算法的准确率:",metrics.accuracy_score(test_y,pre_y))


#用CART算法
#模型配置
model2=tree.DecisionTreeClassifier(criterion='gini')#CART
#模型训练
model2.fit(train_X,train_y)
#模型的预测
pre_y=model2.predict(test_X)
#模型的评估
print("\nCART算法的准确率:",metrics.accuracy_score(test_y,pre_y))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/329426
推荐阅读
相关标签
  

闽ICP备14008679号