当前位置:   article > 正文

python数据分析与挖掘基础

python数据分析与挖掘

1.python基础

python最具特色的就是不需要使用大括号{}。而是使用缩进来表示代码块。

python变量不需要声明数据类型

python3中有六种标准的数据类型:number(数字),String(字符串),list,tuple,set,dictinaoary。

 转义字符的应用:

 

 

 

字符串的常见方法和属性

 

 return语句可以提前结束语句。

 

 

2.Python内建数据结构

 

 列表推导式:
列表推导式提供了从序列创建列表的简单途径,根据判定条件确定序列,再根据表达式创建子序列。

 

 键值唯一

 

 

3.Nump数值运算基础

numpy是一个开源的python科学计算的基础库

numpy的两个重要对象是ndarry和ufunc,其中前者数据结构的基础,后者是接口方法的基础。

常用导入格式为:import numpy as np

 

 

 

numpy创建的ndarray对象属性,主要有shape,size等属性。

 

 

 

 

 

2.2数组变换

1.数组重塑

reshape,与reshape相反的方法是使数据散开(ravel)或数据扁平化(flatten)。

注意:数组重塑不会改变原来的数组的顺序。

 

 2.数组合并

横向组合利用hstack函数。纵向组合是利用vstack函数。

concatenate函数可以实现横向或纵向合并。

参数axis=1时进行纵向合并,axis=0时进行横向合并。

 

 

3.数组分割

 

4.数组转置和轴对换

 

 

 

2.3数组的索引和切片

 

 

 

 

 其实就是按照条件获取数组里面符合类型的元素。

2.4数组的运算

2*3的矩阵与3*2的矩阵无法相加。

 

import numpy as np
x1=np.array([1,2,3])
x2=np.array([4,5,6])
b1=np.array([True,False,True])
print('np.where=',np.where(b1,x1,x2))
print('np.where2=',np.where(x1>1)) #返回的都是索引
print('np.where2=',[x1[np.where(x1>1)]])

 

2.6数据统计与分析

 

 记住很重要的是,每个数组里的元素相当于一个向量,是竖着的一个维度。

 

 

 

import numpy as np
a0=np.array([[3,7,5],[8,4,3],[2,4,9]])
print('a0:',a0)
print('amin0:',np.amin(a0),'amax0:',np.amax(a0))

print('amin1:',np.amin(a0,0),'amax1:',np.amax(a0,0))#按照行查找最小值和最大值
print('amin1:',np.amin(a0,1),'amax1:',np.amax(a0,1))#按照列查找

print('ptp0:',np.ptp(a0,axis=0),'ptp1:',np.ptp(a0,axis=1))#最大值和最小值的差

print('median0:',np.median(a0,axis=0),'median:',np.median(a0,axis=1))#中位数

print('mean0:',np.mean(a0,axis=0),'mean1:',np.mean(a0,axis=1))#均值

print('sum0:',np.sum(a0,axis=0),'sum1:',np.sum(a0,axis=1))

a1=np.array([1,2,3,4])
print('加权均值:',np.average(a1,weights=[4,3,2,1]))#加权均值:加权总和除以权重总和
#也就是(1*4+2*3+3*2+4+1=20,20/10=2)

 

 做后再强调一遍,每一行实际上是一维,axis=0是按行查找,axis=1是按列查找。

本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/168401
推荐阅读
相关标签
  

闽ICP备14008679号