当前位置:   article > 正文

《零基础实践深度学习》 Numpy 线性代数 应用举例 张量表示

《零基础实践深度学习》 Numpy 线性代数 应用举例 张量表示

1.7.3 线性代数

线性代数(如矩阵乘法、矩阵分解、行列式以及其他方阵数学等)是任何数组库的重要组成部分,NumPy中实现了线性代数中常用的各种操作,并形成了numpy.linalg线性代数相关的模块。本节主要介绍如下函数:

  • diag :以一维数组的形式返回方阵的对角线(或非对角线)元素,或将一维数组转换为方阵(非对角线元素为0)。
  • dot矩阵乘法。
  • trace :计算对角线元素的和
  • det :计算矩阵行列式
  • eig :计算方阵的特征值和特征向量
  • inv :计算方阵的

In [130]

  1. # 矩阵相乘
  2. a = np.arange(12)
  3. b = a.reshape([3, 4])
  4. c = a.reshape([4, 3])
  5. # 矩阵b的第二维大小,必须等于矩阵c的第一维大小
  6. d = b.dot(c) # 等价于 np.dot(b, c)
  7. print('a: \n{}'.format(a))
  8. print('b: \n{}'.format(b))
  9. print('c: \n{}'.format(c))
  10. print('d: \n{}'.format(d))

a:

[ 0 1 2 3 4 5 6 7 8 9 10 11]

b:

[[ 0 1 2 3]

[ 4 5 6 7]

[ 8 9 10 11]]

c:

[[ 0 1 2]

[ 3 4 5]

[ 6 7 8]

[ 9 10 11]]

d:

[[ 42 48 54]

[114 136 158]

[186 224 262]]

In [131]

  1. # numpy.linalg 中有一组标准的矩阵分解运算以及诸如求逆和行列式之类的东西
  2. # np.linalg.diag 以一维数组的形式返回方阵的对角线(或非对角线)元素,
  3. # 或将一维数组转换为方阵(非对角线元素为0)
  4. e = np.diag(d)
  5. f = np.diag(e)
  6. print('d: \n{}'.format(d))
  7. print('e: \n{}'.format(e))
  8. print('f: \n{}'.format(f))

d:

[[ 42 48 54]

[114 136 158]

[186 224 262]]

e:

[ 42 136 262]

f:

[[ 42 0 0]

[ 0 136 0]

[ 0 0 262]]

In [132]

  1. # trace, 计算对角线元素的和
  2. g = np.trace(d)
  3. g

In [133]

  1. # det,计算行列式
  2. h = np.linalg.det(d)
  3. h

1.3642420526593978e-11

In [134]

  1. # eig,计算特征值和特征向量
  2. i = np.linalg.eig(d)
  3. i

(array([ 4.36702561e+02, 3.29743887e+00, -2.00728619e-14]),

array([[ 0.17716392, 0.77712552, 0.40824829],

[ 0.5095763 , 0.07620532, -0.81649658],

[ 0.84198868, -0.62471488, 0.40824829]]))

In [135]

  1. # inv,计算方阵的逆
  2. tmp = np.random.rand(3, 3)
  3. j = np.linalg.inv(tmp)
  4. j

array([[ -5.81993172, 15.83159278, -11.18756558],

[ 3.67058369, -6.46065502, 4.50665723],

[ 2.11102657, -5.91510414, 5.31932688]])

1.7.4 NumPy保存和导入文件

1.7.4.1 文件读写

NumPy可以方便的进行文件读写,如下面这种格式的文本文件:

In [4]

  1. # 使用np.fromfile从文本文件'housing.data'读入数据
  2. # 这里要设置参数sep = ' ',表示使用空白字符来分隔数据
  3. # 空格或者回车都属于空白字符,读入的数据被转化成1维数组
  4. d = np.fromfile('./work/housing.data', sep = ' ')
  5. d

array([6.320e-03, 1.800e+01, 2.310e+00, ..., 3.969e+02, 7.880e+00,

1.190e+01])

1.7.4.2 文件保存

NumPy提供了saveload接口,直接将数组保存成文件(保存为.npy格式),或者从.npy文件中读取数组。

In [137]

  1. # 产生随机数组a
  2. a = np.random.rand(3,3)
  3. np.save('a.npy', a)
  4. # 从磁盘文件'a.npy'读入数组
  5. b = np.load('a.npy')
  6. # 检查a和b的数值是否一样
  7. check = (a == b).all()
  8. check

1.7.5 NumPy应用举例

1.7.5.1 计算激活函数Sigmoid和ReLU

使用ndarray数组可以很方便的构建数学函数,并利用其底层的矢量计算能力快速实现计算。下面以神经网络中比较常用激活函数Sigmoid和ReLU为例,使用Numpy计算激活函数Sigmoid和ReLU的值,并使用matplotlib画出图形,代码实现如下。

In [138]

  1. # ReLU和Sigmoid激活函数示意图
  2. import numpy as np
  3. %matplotlib inline
  4. import matplotlib.pyplot as plt
  5. import matplotlib.patches as patches
  6. #设置图片大小
  7. plt.figure(figsize=(8, 3))
  8. # x是1维数组,数组大小是从-10. 到10.的实数,每隔0.1取一个点
  9. x = np.arange(-10, 10, 0.1)
  10. # 计算 Sigmoid函数
  11. s = 1.0 / (1 + np.exp(- x))
  12. # 计算ReLU函数
  13. y = np.clip(x, a_min = 0., a_max = None)
  14. #########################################################
  15. # 以下部分为画图程序
  16. # 设置两个子图窗口,将Sigmoid的函数图像画在左边
  17. f = plt.subplot(121)
  18. # 画出函数曲线
  19. plt.plot(x, s, color='r')
  20. # 添加文字说明
  21. plt.text(-5., 0.9, r'$y=\sigma(x)$', fontsize=13)
  22. # 设置坐标轴格式
  23. currentAxis=plt.gca()
  24. currentAxis.xaxis.set_label_text('x', fontsize=15)
  25. currentAxis.yaxis.set_label_text('y', fontsize=15)
  26. # 将ReLU的函数图像画在右边
  27. f = plt.subplot(122)
  28. # 画出函数曲线
  29. plt.plot(x, y, color='g')
  30. # 添加文字说明
  31. plt.text(-3.0, 9, r'$y=ReLU(x)$', fontsize=13)
  32. # 设置坐标轴格式
  33. currentAxis=plt.gca()
  34. currentAxis.xaxis.set_label_text('x', fontsize=15)
  35. currentAxis.yaxis.set_label_text('y', fontsize=15)
  36. plt.show()

<Figure size 576x216 with 2 Axes>

1.7.5.2 图片翻转和裁剪

图片是由像素点构成的矩阵,其数值可以用ndarray来表示。将上述介绍的操作用在图像数据对应的ndarray上,可以很轻松的实现图片的翻转、裁剪和亮度调整,代码实现如下。

In [1]

  1. # 导入需要的包
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. from PIL import Image
  5. # 读入图片
  6. image = Image.open('./work/pic1.jpg')
  7. image = np.array(image)
  8. # 查看数据形状,其形状是[H, W, 3],
  9. # 其中H代表高度, W是宽度,3代表RGB三个通道
  10. image.shape

(404, 640, 3)

In [2]

  1. # 原始图片
  2. plt.imshow(image)

<matplotlib.image.AxesImage at 0x7f0a345583d0>

<Figure size 640x480 with 1 Axes>

In [3]

  1. # 垂直方向翻转
  2. # 这里使用数组切片的方式来完成,
  3. # 相当于将图片最后一行挪到第一行,
  4. # 倒数第二行挪到第二行,...,
  5. # 第一行挪到倒数第一行
  6. # 对于行指标,使用::-1来表示切片,
  7. # 负数步长表示以最后一个元素为起点,向左走寻找下一个点
  8. # 对于列指标和RGB通道,仅使用:表示该维度不改变
  9. image2 = image[::-1, :, :]
  10. plt.imshow(image2)

<matplotlib.image.AxesImage at 0x7f0a3448c810>

<Figure size 640x480 with 1 Axes>

In [4]

  1. # 水平方向翻转
  2. image3 = image[:, ::-1, :]
  3. plt.imshow(image3)

<matplotlib.image.AxesImage at 0x7f0a34480690>

<Figure size 640x480 with 1 Axes>

  1. # 保存图片
  2. im3 = Image.fromarray(image3)
  3. im3.save('im3.jpg')
  1. # 高度方向裁剪
  2. H, W = image.shape[0], image.shape[1]
  3. # 注意此处用整除,H_start必须为整数
  4. H1 = H // 2
  5. H2 = H
  6. image4 = image[H1:H2, :, :]
  7. plt.imshow(image4)
  1. # 宽度方向裁剪
  2. W1 = W//6
  3. W2 = W//3 * 2
  4. image5 = image[:, W1:W2, :]
  5. plt.imshow(image5)
  1. # 两个方向同时裁剪
  2. image5 = image[H1:H2, \
  3. W1:W2, :]
  4. plt.imshow(image5)
  1. # 调整亮度
  2. image6 = image * 0.5
  3. plt.imshow(image6.astype('uint8'))
  1. # 调整亮度
  2. image7 = image * 2.0
  3. # 由于图片的RGB像素值必须在0-255之间,
  4. # 此处使用np.clip进行数值裁剪
  5. image7 = np.clip(image7, \
  6. a_min=None, a_max=255.)
  7. plt.imshow(image7.astype('uint8'))
  1. #高度方向每隔一行取像素点
  2. image8 = image[::2, :, :]
  3. plt.imshow(image8)
  1. #宽度方向每隔一列取像素点
  2. image9 = image[:, ::2, :]
  3. plt.imshow(image9)
  1. #间隔行列采样,图像尺寸会减半,清晰度变差
  2. image10 = image[::2, ::2, :]
  3. plt.imshow(image10)
  4. image10.shape

1.7.6 飞桨的张量表示

飞桨使用张量(Tensor)表示数据。Tensor可以理解为多维数组,具有任意的维度,如一维、二维、三维等。不同Tensor可以有不同的数据类型 (dtype) 和形状 (shape),同一Tensor的中所有元素的数据类型均相同。Tensor是类似于Numpy数组(ndarray)的概念。飞桨的Tensor高度兼容Numpy数组,在基础数据结构和方法上,增加了很多适用于深度学习任务的参数和方法,如:反向计算梯度,指定运行硬件等。

如下述代码声明了两个张量类型的向量xx和yy,指定CPU为计算运行硬件,要自动反向求导。两个向量除了可以与Numpy类似的做相乘的操作之外,还可以直接获取到每个变量的导数值。

  1. import paddle
  2. x = paddle.to_tensor([1.0, 2.0, 3.0], dtype='float32', place=paddle.CPUPlace(), stop_gradient=False)
  3. y = paddle.to_tensor([4.0, 5.0, 6.0], dtype='float32', place=paddle.CPUPlace(), stop_gradient=False)
  4. z = x * y
  5. z.backward()
  6. print("tensor's grad is: {}".format(x.grad))

此外,飞桨的张量还可以实现与Numpy的数组转换,代码实现如下。

In [ ]

  1. import paddle
  2. import numpy as np
  3. tensor_to_convert = paddle.to_tensor([1.,2.])
  4. #通过 Tensor.numpy() 方法,将张量转化为 Numpy数组
  5. tensor_to_convert.numpy()
  6. #通过paddle.to_tensor() 方法,将 Numpy数组 转化为张量
  7. tensor_temp = paddle.to_tensor(np.array([1.0, 2.0]))

虽然飞桨的张量可以与Numpy的数组互相转换,但实践时频繁地转换会导致无效的性能消耗。目前飞桨Tensor支持的操作已经超过NumPy,推荐读者在使用飞桨完成深度学习任务时,优先使用Tensor完成各种数据处理和组网操作。更多飞桨张量的介绍,可以参考“飞桨官网文档-Tensor介绍”

作业1-7:使用NumPy计算tanh激活函数

tanh是神经网络中常用的一种激活函数,其定义如下:

请参照讲义中Sigmoid激活函数的计算程序,用NumPy实现tanh函数的计算,并画出其函数曲线。

提交方式:请用NumPy写出计算程序,并画出tanh函数曲线图,xx的取值范围设置为[-10., 10.]。

作业1-8: 统计随机生成矩阵中有多少个元素大于0?

假设使用np.random.randn生成了随机数构成的矩阵:

    p = np.random.randn(10, 10)

请写一段程序统计其中有多少个元素大于0?

提示:可以试下使用q=(p>0)q = (p > 0),观察qq是什么的数据类型和元素的取值。

提交方式:提交计算的代码,能够直接运行输出统计出来的结果。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/317793
推荐阅读
相关标签
  

闽ICP备14008679号