当前位置:   article > 正文

004_matrix_conventions_in_Matlab中的矩阵约定

004_matrix_conventions_in_Matlab中的矩阵约定

Matlab中的矩阵约定

Matlab这个名字,是Matrix Laboratory的缩写,以前(真的以前,互联网前时代)有一个清华还是北大的几个学生,做的魔性视频里,有个配音:马特拉博,马特拉波,我到现在还能随时想起来,每次想起来大脑里都要响起这个声音。所以我现在使用Matlab,简直是……

Matlab中倒是随处可见Mat,甚至数据文件的后缀名也是.mat,这门所谓的语言,也称为M语言,因为脚本和函数的后缀名是.m

Matlab中,矩阵是其非常核心的概念和数据结构。就像是Python,在numpy之前,也是个弱鸡。Matlab能打,基础就是矩阵和相关的计算工具箱。

1. 矩阵形状

Matlab仲可以表示N维数组,这里用数组,主要是表示一般编程语言中的非稀疏矩阵,类似于C#的MathNet.Numerics库中的DensityMatrix。因为Matlab还有一种稀疏矩阵的表示方式,以后再说。

N为数组,假设每个维度的长度分别为n1, n2, ..., nN,那么这个数组就是一个n1 x n2 x ... x nN的矩阵。数组的元素一共是n1 * n2 * ... * nN个。Matlab专门有个函数size来获取数组的维度信息,还有个函数numel来获取数组元素总长度信息。

前者返回一个行向量,后者返回一个标量。
m ≡ m n 1 × n 2 × ⋯ × n N ∈ R n 1 × n 2 × . . . × n N m \equiv m_{n1\times n2 \times \cdots \times nN} \in \mathbb{R}^{n1 \times n2 \times ... \times nN} mmn1×n2××nNRn1×n2×...×nN

size ( m ) = [ n 1 , n 2 , . . . , n N ] \text{size}(m) = [n1, n2, ..., nN] size(m)=[n1,n2,...,nN]

numel ( m ) = n 1 × n 2 × . . . × n N \text{numel}(m) = n1 \times n2 \times ... \times nN numel(m)=n1×n2×...×nN

此外,还有一个函数ndims,返回数组的维度数目。length函数返回数组的最大维度长度。

ndims ( m ) = N \text{ndims}(m) = N ndims(m)=N

length ( m ) = max ⁡ ( n 1 , n 2 , . . . , n N ) \text{length}(m) = \max(n1, n2, ..., nN) length(m)=max(n1,n2,...,nN)

2. 矩阵元素访问

要访问矩阵的元素,在Matlab中,使用()符号,里面是一个逗号分隔的下标列表。下标列表的长度应该等于数组的维度数目。

约定1:Matlab中的下标从1开始,不是从0开始。

3. 矩阵的全索引

上面我们在讨论向量的约定时,提到了行向量和列向量,这里再次强调一下,Matlab中的矩阵是列优先的。那么列对于矩阵来说什么意思呢?

对于二维数组(包含列向量和行向量),列优先的意思很简单,就是按照列来存储数据。对于如下的 m × n m\times n m×n的矩阵,它在内存中就等同为 m × n m\times n m×n的列向量。

A m × n = a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n A_{m\times n} =

a11a12a1na21a22a2nam1am2amn
Am×n=a11a21am1a12a22am2a1na2namn

A ( : ) = a 11 a 21 ⋮ a m 1 a 12 a 22 ⋮ a m 2 ⋮ a 1 n a 2 n ⋮ a m n A(:) =

a11a21am1a12a22am2a1na2namn
A(:)=a11a21am1a12a22am2a1na2namn

其实这里说到内存中存储,通常对于很多人来说没有任何意义。但是上面这个事实,对于矩阵的访问也有一定的影响。

实际上,如果我们对于上面那个矩阵:

A = rand(m, n);
A
  • 1
  • 2

打印出就是矩阵的形式。

A(:)
  • 1

打印出就是下面的列向量。

那么对于二维矩阵,这中列优先的方式实际上预期下标(size(A)所获得值),[m, n]是有内在的一致性的。

那个列向量其实也可以写成:

[
    A(1, 1);
    A(2, 1);
    ...
    A(m, 1);
    A(1, 2);
    A(2, 2);
    ...
    A(m, 2);
    ...
    A(1, n);
    A(2, n);
    ...
    A(m, n);
]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

使用: 符号,又可以写成

[
    A(:, 1)
    A(:, 2)
    ...
    A(:, n)
]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

这个写法,对于二维数组就是列先,对于多维数组,就是排在size返回的维度数组中的后面的维度优先。也就是,先确定最后一个维度,然后确定倒数第二个维度,然后确定倒数第三个维度,以此类推。

约定2:多维矩阵,高维优先。

对于上面的N维数组,A(:, :, ..., :, i_i, i_{i+1}, ..., i_{N})确定了一个n1 x n2 x ... x n_{i-1}的矩阵。也就是,i维到N全部确定,前面的维度都是:,可以在内存中确定一个连续的区域。

如果我们对一个三维数组,采用如下的方式访问:

A(1,1,:)
  • 1

得到的是n3个不连续的值。如果我们把size函数得到的维度向量中后面的维称为高维,前面的维称为低维。从前到后对应第一维到最后一维。

在这里插入图片描述

那么高维的维度确定后,访问的效率会更高。

约定3:访问矩阵时,当某个维限定,比这个维度高的所有维度都应该被限定,计算会更有效率。

4. 矩阵降维索引

Matalb中的多维数组,还可以采用降维索引的方式访问。

约定4:矩阵降维索引时,没有给定的高维,按高维优先的方式,连接到最后一个维度,这样最后一个维度 i i i 的范围就是 [ 1 , ∏ j = i N n j ] [1, \prod_{j=i}^N n_j] [1,j=iNnj]

这个也很好理解,当我们用一个索引来访问一个二维矩阵 A m × n A_{m\times n} Am×n 时,我们只给定了一个索引,那么这个索引就是列优先的索引,也就是 A ( : ) A(:) A(:) 的索引,它的范围就是 [ 1 , m × n ] [1, m\times n] [1,m×n]

同理,这也可以推到到多维数组上。

5. 矩阵左值和矩阵右值

在Matlab中,语句约定写为:

A = B;
  • 1

这里的=是赋值操作符,A是左值,B是右值。这个语句的意思是,把右值B的值赋给左值A

当我们按照矩阵的索来引用矩阵作为左值时,右值必须是一个和左值长度相同的数组。或者是一个标量,这个标量会被广播到左值的每一个元素上。当右值和左值长度一样,但是形状不一样,就会按照高维优先的方式,将右值的每个元素对应到左值的每个元素上。

约定5:矩阵作为左值,右值必须是一个和左值长度相同的矩阵,或者是一个标量。

在每个涉及数组(矩阵)的操作中,高维优先可以始终保持访问顺序的一致性。

6. 结论

  1. Matlab矩阵索引从1开始(这个第0条是故意的)。
  2. Matlab中的矩阵是列优先的,多维数组是高维优先的。
  3. 访问矩阵时,当某个维限定,比这个维度高的所有维度都应该被限定,计算会更有效率。
  4. 矩阵作为左值,右值必须是一个和左值长度相同的矩阵,或者是一个标量。
  5. 在每个涉及数组(矩阵)的操作中,高维优先可以始终保持访问顺序的一致性。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/341365
推荐阅读
相关标签
  

闽ICP备14008679号