使用逻辑回归对泰坦尼克号数据生存死亡情况预测_探索泰坦尼克号乘客存活情况逻辑回归模型

作者：繁依Fanyi0 | 2024-03-14 20:47:22

踩

探索泰坦尼克号乘客存活情况逻辑回归模型

泰坦尼克号数据集介绍

Titanic数据集是非常适合数据科学和机器学习新手入门练习的数据集。
数据集为1912年泰坦尼克号沉船事件中一些船员的个人信息以及存活状况。这些历史数据已经非分为训练集和测试集，你可以根据训练集训练出合适的模型并预测测试集中的存活状况。

数据描述

在这里插入图片描述
使用算法为逻辑回归
整个预测代码如下：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 导入数据
data_train = pd.read_csv('train.csv')
pd.set_option('display.max_columns', None)
data_train.describe()
data_train.info()

# 数据划分，并对特征进行初步筛选
X = data_train.iloc[:,[2,4,5,6,7,11]].values
y = data_train.iloc[:,1].values

# 缺失值处理
from sklearn.impute import SimpleImputer
imp_mean = SimpleImputer(missing_values=np.nan, strategy='mean')
imp_mean.fit(X[:,2:3])
X[:,2:3] = imp_mean.transform(X[:,2:3])
imp_mean = SimpleImputer(missing_val8ues=np.nan, strategy='most_frequent')
imp_mean.fit(X[:,5:6])
X[:,5:6] = imp_mean.transform(X[:,5:6])

# 虚拟编码
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelEncoder = LabelEncoder()
X[:,1] = labelEncoder.fit_transform(X[:,1])
X[:,5] = labelEncoder.fit_transform(X[:,5])

oneHotEncoder = OneHotEncoder(categorical_features=[5])
X = oneHotEncoder.fit_transform(X).toarray()
X = X[:,1:]

# 划分数据
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 特征缩放
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
# 建模
from sklearn.linear_model import LogisticRegression
classifier = LogisticRegression(random_state=0)
classifier.fit(X_train, y_train)

# 测试
y_pred = classifier.predict(X_test)

# 计算正确值
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_test, y_pred)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/237146?site

使用逻辑回归对泰坦尼克号数据 生存死亡情况预测_探索泰坦尼克号乘客存活情况 逻辑回归模型

泰坦尼克号数据集介绍

数据描述

使用逻辑回归对泰坦尼克号数据生存死亡情况预测_探索泰坦尼克号乘客存活情况逻辑回归模型