赞
踩
一、数据来源
数据集来自于Kaggle。Kaggle是一个数据分析建模的应用竞赛平台。当然也可以从其它地方下。
二、相关工具
2.1 Python 3.5.2
2.2 Anaconda 3
三、牛刀小试
3.1 导入训练数据集
import pandas as pd
import numpy as np
from pandas import Series,DataFrame
f = open(r'E:\Python\数据分析\data\train.csv')
data_train = pd.read_csv(f)
对数据进行初步分析
data_train.describe()
运行结果如下:
进一步分析
data_train.info()
运行结果:
3.2 数据图像化分析
数据中的各个属性
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=[&#
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。