1 什么是numpy
numpy是一个在Python中做科学计算的基础库,重在数值计算,也是大部分Python科学计算库的基础库,多用于大型、多维数据上执行数值计算。
在NumPy 中,最重要的对象是称为 ndarray 的N维数组类型,它是描述相同类型的元素集合,numpy所有功能几乎都以ndarray为核心展开。ndarray 中的每个元素都是数据类型对象(dtype)的对象。ndarray 中的每个元素在内存中使用相同大小的块
2 numpy数组创建
创建Numpy数组一般有三种方法:
(1)通过传入可待跌对象创建,我将之称为基本方法
(2)使用Numpy内部功能函数,内部方法
(3)使用特殊的库函数,特殊方法
2.1 基本方法:np.array()
基本方法是通过给numpy提供的一些函数中传入可迭代对象来创建数组,这种方法通常是在已知所有元素的情况下使用。numpy中实现这种功能的函数包括:np.array()、np.arange()、np.line(),:
>>> np.array([0, 1, 2, 3, 4]) # 接收一个list作为参数 array([0, 1, 2, 3, 4]) >>> np.array([[11, 12, 13],[21, 22, 23]]) # 创建一个2*3的数组 array([[11, 12, 13], [21, 22, 23]]) >>> np.array((0, 1, 2, 3, 4)) # 接收一个tuple作为参数 array([0, 1, 2, 3, 4]) np.array()方法可以在创建数组的同时指定数据类型: >>> np.array([0, 1, 2, 3, 4], dtype=float) array([0., 1., 2., 3., 4.])
甚至还可以接受range()返回的可迭代对象作为参数:
>>> np.array(range(5)) array([0, 1, 2, 3, 4]) >>> np.array(range(10, 20, 2)) array([10, 12, 14, 16, 18])
2.2 通用方法:np.ones()、np.zeros()、np.eye()
通用方法指的是numpy中提供的arange()、ones()、zeros()、eye()、full()等方法,这些方法可以按照某种规则生成一个数组,并不需要传入已知的可迭代对象。
(1)np.arange()
上面我们将range()函数结果传递给np.array(),np.arange()实现的就是这个功能,所以说,np.arange()就是numpy中的range()方法。
>>> np.arange(5) array([0, 1, 2, 3, 4]) >>> np.arange(10, 20, 2) array([10, 12, 14, 16, 18])
(2)np.linspace()
np.linspace()方法以等间距的形式对给定的两数进行划分来创建数组:
>>> np.linspace(10, 20, 5) # 将10到20间的数等距取5个 array([10. , 12.5, 15. , 17.5, 20. ])
(3)np.ones()
创建一个元素值全为1的数组,接收一个list或者tuple作为参数
>>> np.ones([2]) # 创建一个一维数组 array([1., 1.]) >>> np.ones([2, 2]) # 创建一个2维数组 array([[1., 1.], [1., 1.]]) >>> np.ones([2, 2, 2]) array([[[1., 1.], [1., 1.]], [[1., 1.], [1., 1.]]])
(4)np.zeros()
创建一个元素值全为0的数组,接收一个list或者tuple作为参数
>>> np.zeros([3]) array([0., 0., 0.]) >>> np.zeros([3, 3]) array([[0., 0., 0.], [0., 0., 0.], [0., 0., 0.]])
(5)np.random.random()
创建一个元素为0到1之间随机数的数组,接收一个list或者tuple作为参数:
>>> np.random.random((3, 3)) array([[0.19414645, 0.2306415 , 0.08072019], [0.68814308, 0.48019088, 0.61438206], [0.5361477 , 0.33779769, 0.38549407]])
既然有random()方法,那么就会有randint()方法,也就是取随机整数的方法,不过这个randint()方法参数形式更random()不太一样,具体请看下面实例:
>>> np.random.randint(1, 10, 3) # 从1到10之间随机取3个整数创建数组 array([6, 4, 6])
(6)np.eye()
创建一个从左上角到右下角的对角线上全为1,其余元素全为0的数组(单位矩阵)。注意,np.eye()的参数可不再是list或者tuple了。
>>> np.eye(3, 3) array([[1., 0., 0.], [0., 1., 0.], [0., 0., 1.]])
(7) np.full()
np.full()函数可以创建一个填充给定数值的数组,第一个参数是定义数组形状的list或tuple,第2个参数是需要填充的数值:
>>> np.full((2, 3), 3) # 创建一个2*3的数组,所有元素都填充3 array([[3, 3, 3], [3, 3, 3]])
2.3 读取外部数据
numpy也支持从外部读取数据来创建数组,例如从硬盘中读取csv、txt等文件来创建数组。np.genfromtxt()是numpy中读取文件的一个方法,例如在当前目录下有一个data.csv文件,文件内容为:
id,height,length
1,100,101
2,200,230
3,300,350
通过numpy读取:
>>> np.genfromtxt('data.csv',delimiter=',',skip_header=1) array([[ 1., 100., 101.], [ 2., 200., 230.], [ 3., 300., 350.]])
读取外部数据的方法不止np.genfromtxt(),还有np.load(等,但numpy读取外部数据的应用情况其实并不多,这里不再细说。
3 numpy中数组的数据类型
作为一个强大的科学计算库,numpy中支持的数据类型远不止Python原生的几种数据类型。如下所示为numpy中支持的数据类型:
数据类型
|
描述
|
bool_
|