赞
踩
更多原创文章请访问:
https://blog.csdn.net/xudailong_blog
如果没有看到上册的话:可以点击这里:
[数据挖掘实战系列] Kaggle之泰坦尼克号灾难(上)https://www.jianshu.com/p/fc5f33d4b84c
上主要是对数据进行一些处理,这里的下主要是对数据进行一些分析:
####(一)描述性分析
(1)单身存活率
d = train3[['isalone','Survived']].groupby(['isalone']).mean()
d
# d.loc[0,'Survived']
看来秀恩爱死得早在这里并不适用啊。
(2.1) 单身与死亡率的直方图
# 6.2 单身与死亡率的直方图
plt.bar(
[0,1],
[1-d.loc[0,'Survived'],1-d.loc[1,'Survived']],
0.5,
color='r',
alpha=1.0,
)
plt.xticks([0,1],['notalone','alone'])
plt.show()
(3)男性女性存活率
n = train3[['Sex','Survived']].groupby(['Sex']).mean()
n
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。