当前位置:   article > 正文

数据分析实战之决策树(泰坦尼克号乘客生存预测)_泰坦尼克号决策树

泰坦尼克号决策树

本文利用已给特征属性和存活与否标签的训练集和只包含特征信息测试集数据,通过决策树模型来预测测试集数据乘客的生存情况

数据集来源为https://github.com/cystanford/Titanic_Data,可下载数据查看其各字段信息

生存预测的流程:

1、数据探索:

  1. import numpy as np
  2. import pandas as pd
  3. train_data = pd.read_csv(r'C:\Users\hzjy\Desktop\train.csv') #加载数据
  4. test_data = pd.read_csv(r'C:\Users\hzjy\Desktop\test.csv')

1)训练集数据的整体特征:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小惠珠哦/article/detail/894573
推荐阅读
相关标签
  

闽ICP备14008679号