赞
踩
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
# 读取数据
data = pd.read_csv('task1_data.csv')
data.head(),data.shape
# 数据可视化
fig1 = plt.figure(figsize=(8,6))
plt.scatter(data.loc[:,'frequency'],data.loc[:,'payment'],marker='x')
plt.title('raw data')
plt.xlabel('frequency')
plt.ylabel('payment')
plt.show()
# 数据赋值 x1 = data.loc[:,'frequency'] x2 = data.loc[:,'payment'] # 数据分布频次图 fig2 = plt.figure(figsize=(20,5)) fig2_1 = plt.subplot(121) plt.title('frequency data') plt.xlabel('frequency') plt.ylabel('counts') plt.hist(x1,bins=100) fig2_2 = plt.subplot(122) plt.title('payment data') plt.xlabel('payment') plt.ylabel('counts') plt.hist(x2,bins=100)
fig5 = plt.figure(figsize=(20,5)) fig5_1 = plt.subplot(121) # 计算数据均值,标准差 # 均值 x1_mean = x1.mean() # 标准差 x1_std = x1.std() # 计算对应的高斯分布数值: from scipy.stats import norm # 生成0-10区间的三百个点 x1_range = np.linspace(0,10,300) # 生成分布区间对应的关键参数 normal1 = norm.pdf(x1_range,x1_mean,x1_std) # 可视化高斯分布曲线 plt.plot(x1_range,normal1) '''第二张''' fig5_2 = plt.subplot(122) # 计算数据均值,标准差 # 均值 x2_mean = x2.mean() # 标准差 x2_std = x2.std() # 计算对应的高斯分布数值: from scipy.stats import norm # 生成0-10区间的三百个点 x2_range = np.linspace(0,10,300) # 生成分布区间对应的关键参数 normal2 = norm.pdf(x2_range,x2_mean,x2_std) # 可视化高斯分布曲线 plt.plot(x2_range,normal2)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。