当前位置:   article > 正文

数据挖掘实战系列 之 Kaggle 泰坦尼克号灾难(下)

数据挖掘实战系列 之 Kaggle 泰坦尼克号灾难(下)

更多原创文章请访问:
https://blog.csdn.net/xudailong_blog

如果没有看到上册的话:可以点击这里:

[数据挖掘实战系列] Kaggle之泰坦尼克号灾难(上)https://www.jianshu.com/p/fc5f33d4b84c

上主要是对数据进行一些处理,这里的下主要是对数据进行一些分析:

####(一)描述性分析

(1)单身存活率

d = train3[['isalone','Survived']].groupby(['isalone']).mean()
d
# d.loc[0,'Survived']
  • 1
  • 2
  • 3

在这里插入图片描述

看来秀恩爱死得早在这里并不适用啊。

(2.1) 单身与死亡率的直方图

# 6.2 单身与死亡率的直方图
plt.bar(
    [0,1],
    [1-d.loc[0,'Survived'],1-d.loc[1,'Survived']],
    0.5,
    color='r',
    alpha=1.0,
)

plt.xticks([0,1],['notalone','alone'])
plt.show()

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12

在这里插入图片描述

(3)男性女性存活率

n = train3[['Sex','Survived']].groupby(['Sex']).mean()
n
  • 1
  • 2

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/552584
推荐阅读
相关标签
  

闽ICP备14008679号