赞
踩
数学符号在数学领域是非常重要的。在论文中,使用数学符号可以使得论文更加简洁明了,同时也能够准确地描述各种概念和理论。在本篇博客中,我将介绍一些常见的数学符号及其含义(省去特别简单的符号),希望能够帮助读者更好地理解数学论文。
∑ i = 1 n x i \sum_{i=1}^n x_i ∑i=1nxi (求和符号):表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 中的所有数相加,例如 ∑ i = 1 n x i \sum_{i=1}^n x_i ∑i=1nxi 表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 中的所有数相加。
∏ i = 1 n x i \prod_{i=1}^n x_i ∏i=1nxi (乘积符号):表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 中的所有数相乘,例如 ∏ i = 1 n x i \prod_{i=1}^n x_i ∏i=1nxi 表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 中的所有数相乘。
lim x → a \lim_{x\rightarrow a} limx→a (极限符号):表示函数在 x x x 趋近于 a a a 时的极限值,例如 lim x → a f ( x ) \lim_{x\rightarrow a} f(x) limx→af(x) 表示当 x x x 趋近于 a a a 时,函数 f ( x ) f(x) f(x) 的极限值。
inf \inf inf (下确界):表示一组数的下确界。例如 i n f { 1 , 2 , 3 } = 1 inf\{1,2,3\}=1 inf{1,2,3}=1。
sup \sup sup (上确界):表示一组数的上确界。
± \pm ± (加减号):表示一个数可以是正数或负数,例如 x = ± 5 x=\pm 5 x=±5 表示 x x x 可以是 5 5 5 或 − 5 -5 −5。
≡ \equiv ≡ (恒等于):表示两个数或表达式相等,例如 x ≡ y x\equiv y x≡y 表示 x x x 和 y y y 相等。
≠ \neq = (不等于):表示两个数或表达式不相等,例如 x ≠ y x\neq y x=y 表示 x x x 不等于 y y y。
\sqrt{}
这个符号表示平方根。例如,
4
=
2
\sqrt{4}=2
4
=2,表示4的平方根为2。
∞
\infty
∞
这个符号表示无穷大,表示一个数或值趋近于无穷大。例如,
lim
x
→
∞
1
x
=
0
\lim_{x\to\infty}\frac{1}{x}=0
limx→∞x1=0 表示当
x
x
x 趋近于无穷大时,
1
x
\frac{1}{x}
x1 的极限值为0。
∇ \nabla ∇ (梯度):表示多元函数在某一点处的梯度,是一个向量。
∂ \partial ∂ (偏导数):表示多元函数的偏导数。
∫ \int ∫ (积分):表示求函数在某个区间上的积分值。
∮ \oint ∮ (环积分):表示在一个封闭曲线上的积分值。
∬ \iint ∬ (二重积分符号):表示对二元函数进行积分运算,例如 ∬ D f ( x , y ) d x d y \iint_{D} f(x,y) dxdy ∬Df(x,y)dxdy 表示对函数 f ( x , y ) f(x,y) f(x,y) 在平面区域 D D D 上进行积分运算。
∭ \iiint ∭ (三重积分符号):表示对三元函数进行积分运算,例如 ∭ E f ( x , y , z ) d x d y d z \iiint_{E} f(x,y,z) dxdydz ∭Ef(x,y,z)dxdydz 表示对函数 f ( x , y , z ) f(x,y,z) f(x,y,z) 在空间区域 E E E 上进行积分运算。
∮ \oint ∮ (曲线积分符号):表示对曲线上的函数进行积分运算,例如 ∮ C f ( x , y ) d s \oint_{C} f(x,y) ds ∮Cf(x,y)ds 表示对函数 f ( x , y ) f(x,y) f(x,y) 沿曲线 C C C 进行积分运算。
∭ Ω \iiint_{\Omega} ∭Ω (三重积分符号带限制):表示对三元函数在特定区域 Ω \Omega Ω 上进行积分运算,例如 ∭ x 2 + y 2 + z 2 ≤ R 2 f ( x , y , z ) d x d y d z \iiint_{x^2+y^2+z^2 \leq R^2} f(x,y,z) dxdydz ∭x2+y2+z2≤R2f(x,y,z)dxdydz 表示对函数 f ( x , y , z ) f(x,y,z) f(x,y,z) 在球体 x 2 + y 2 + z 2 ≤ R 2 x^2+y^2+z^2 \leq R^2 x2+y2+z2≤R2 上进行积分运算。
n ! n! n! (阶乘符号):表示自然数 n n n 的阶乘,即 n ! = n × ( n − 1 ) × ⋯ × 1 n!=n\times(n-1)\times\cdots\times1 n!=n×(n−1)×⋯×1。
( n k ) \binom{n}{k} (kn) (组合数符号):表示从 n n n 个元素中选出 k k k 个元素的组合数,即 ( n k ) = n ! k ! ( n − k ) ! \binom{n}{k}=\frac{n!}{k!(n-k)!} (kn)=k!(n−k)!n!。例如 ( 5 2 ) \binom{5}{2} (25) 表示从 5 5 5 个元素中选取 2 2 2 个元素的组合数,即 C ( 5 , 2 ) C(5,2) C(5,2)。
P n k P_n^k Pnk (排列数符号):表示从 n n n 个元素中选出 k k k 个元素的排列数,即 P n k = n ( n − 1 ) ⋯ ( n − k + 1 ) P_n^k=n(n-1)\cdots(n-k+1) Pnk=n(n−1)⋯(n−k+1)。
C n k C_n^k Cnk (二项式系数符号):表示二项式 ( a + b ) n (a+b)^n (a+b)n 的展开式中第 k k k 项的系数,即 C n k = ( n k ) C_n^k=\binom{n}{k} Cnk=(kn)。
∑ k = 0 n \sum_{k=0}^n ∑k=0n (求和符号):表示对序列 a k k = 0 n {a_k}{k=0}^n akk=0n 中的元素进行求和运算,即 ∑ k = 0 n a k = a 0 + a 1 + ⋯ + a n \sum{k=0}^n a_k=a_0+a_1+\cdots+a_n ∑k=0nak=a0+a1+⋯+an。
∏ k = 1 n \prod_{k=1}^n ∏k=1n (乘积符号):表示对序列 a k k = 1 n {a_k}{k=1}^n akk=1n 中的元素进行乘积运算,即 ∏ k = 1 n a k = a 1 × a 2 × ⋯ × a n \prod{k=1}^n a_k=a_1\times a_2\times\cdots\times a_n ∏k=1nak=a1×a2×⋯×an。
( n k ) q \binom{n}{k}_q (kn)q ( q q q-组合数符号):表示在 q q q-分之一意义下从 n n n 个元素中选出 k k k 个元素的组合数,即 ( n k ) q = ( 1 − q n ) ( 1 − q n − 1 ) ⋯ ( 1 − q n − k + 1 ) ( 1 − q k ) ( 1 − q k − 1 ) ⋯ ( 1 − q ) \binom{n}{k}_q=\frac{(1-q^n)(1-q^{n-1})\cdots(1-q^{n-k+1})}{(1-q^k)(1-q^{k-1})\cdots(1-q)} (kn)q=(1−qk)(1−qk−1)⋯(1−q)(1−qn)(1−qn−1)⋯(1−qn−k+1)。
P ( A ) P(A) P(A) (概率符号):表示事件 A A A 发生的概率,取值范围在 [ 0 , 1 ] [0,1] [0,1] 之间。
E [ X ] E[X] E[X] (期望):表示一个随机变量 X X X 的期望值,也可以写作 E [ X ] \mathbb{E}[X] E[X],例如 E [ X ] E[X] E[X] 表示随机变量 X X X 的期望值。
V a r ( X ) \mathrm{Var}(X) Var(X) (方差):表示一个随机变量 X X X 的方差,例如 V a r ( X ) \mathrm{Var}(X) Var(X) 表示随机变量 X X X 的方差。
C o v ( X , Y ) \mathrm{Cov}(X,Y) Cov(X,Y) (协方差):表示两个随机变量 X X X 和 Y Y Y 的协方差,例如 C o v ( X , Y ) \mathrm{Cov}(X,Y) Cov(X,Y) 表示随机变量 X X X 和 Y Y Y 的协方差。
σ X \sigma_X σX (标准差符号):表示随机变量 X X X 的标准差,是方差的算术平方根。
ρ X , Y \rho_{X,Y} ρX,Y (相关系数符号):表示随机变量 X X X 和 Y Y Y 之间的相关系数,是协方差除以两个随机变量的标准差的积。
∼ \sim ∼ (服从符号):表示一个随机变量服从某个概率分布,如 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) X∼N(μ,σ2) 表示 X X X 服从正态分布,其均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2。
∪ \cup ∪ (并符号):表示事件的并集,如 A ∪ B A\cup B A∪B 表示事件 A A A 和事件 B B B 的并集。
∩ \cap ∩ (交符号):表示事件的交集,如 A ∩ B A\cap B A∩B 表示事件 A A A 和事件 B B B 的交集。
P ( A ∣ B ) P(A|B) P(A∣B):这是条件概率的最基本表述,表示在事件B发生的前提下,事件 A A A发生的概率。其中,符号“ ∣ | ∣”表示“给定”的意思, P ( A ∣ B ) P(A|B) P(A∣B)就是给定B的情况下, A A A发生的概率。
P ( A ∩ B ) P(A∩B) P(A∩B):这个符号表示事件 A A A和事件 B B B同时发生的概率,其中符号“ ∩ ∩ ∩”表示交集,也就是 A A A和 B B B的共同部分。因此, P ( A ∩ B ) P(A∩B) P(A∩B)就是 A A A和 B B B都发生的概率。
P ( A ∪ B ) P(A∪B) P(A∪B):这个符号表示事件 A A A和事件 B B B至少有一个发生的概率,其中符号“ ∪ ∪ ∪”表示并集,也就是 A A A和 B B B的全部部分。因此, P ( A ∪ B ) P(A∪B) P(A∪B)就是 A A A或者 B B B至少一个发生的概率。
P ( A ′ ) P(A') P(A′):这个符号表示事件 A A A不发生的概率,也可以写成 P ( n o t A ) P(not A) P(notA)。其中符号“ ′ ' ′”表示补集,也就是 A A A的相反情况。
P ( A ∣ B ) = P ( A ∩ B ) / P ( B ) P(A|B) = P(A∩B) / P(B) P(A∣B)=P(A∩B)/P(B):这个符号表示条件概率的公式,也是条件概率的定义式。其中, P ( A ∩ B ) P(A∩B) P(A∩B)表示 A A A和 B B B同时发生的概率, P ( B ) P(B) P(B)表示 B B B发生的概率, P ( A ∣ B ) P(A|B) P(A∣B)表示在 B B B发生的情况下, A A A发生的概率。
P ( A ∩ B ) = P ( A ∣ B ) × P ( B ) P(A∩B) = P(A|B) × P(B) P(A∩B)=P(A∣B)×P(B):这个符号表示条件概率的乘法公式,也称为贝叶斯公式。其中, P ( A ∣ B ) P(A|B) P(A∣B)表示在 B B B发生的情况下, A A A发生的概率,P(B)表示B发生的概率,P(A∩B)表示A和B同时发生的概率。
P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A∪B) = P(A) + P(B) - P(A∩B) P(A∪B)=P(A)+P(B)−P(A∩B):这个符号表示条件概率的加法公式,也称为容斥原理。其中,P(A)表示A发生的概率,P(B)表示B发生的概率,P(A∩B)表示A和B同时发生的概率,P(A∪B)表示A或者B发生的概率。
P ( A 1 ∩ A 2 ∩ . . . ∩ A n ) = P ( A 1 ) × P ( A 2 ∣ A 1 ) × P ( A 3 ∣ A 1 ∩ A 2 ) × . . . × P ( A n ∣ A 1 ∩ A 2 ∩ . . . ∩ A n − 1 ) P(A1∩A2∩...∩An) = P(A1) × P(A2|A1) × P(A3|A1∩A2) × ... × P(An|A1∩A2∩...∩An-1) P(A1∩A2∩...∩An)=P(A1)×P(A2∣A1)×P(A3∣A1∩A2)×...×P(An∣A1∩A2∩...∩An−1):这个符号表示条件概率的乘法公式的扩展,也称为全概率公式。其中, A 1 , A 2 , . . . , A n A1,A2,...,An A1,A2,...,An是一个完备事件组,也就是它们是互斥且构成了整个样本空间,P(A1)表示A1发生的概率, P ( A 2 ∣ A 1 ) P(A2|A1) P(A2∣A1)表示在 A 1 A1 A1发生的情况下, A 2 A2 A2发生的概率, P ( A 3 ∣ A 1 ∩ A 2 ) P(A3|A1∩A2) P(A3∣A1∩A2)表示在A1和A2同时发生的情况下, A 3 A3 A3发生的概率,以此类推。
det
(
A
)
\det(A)
det(A) (行列式):表示矩阵
A
A
A 的行列式,例如
det
(
A
)
\det(A)
det(A) 表示矩阵
A
A
A 的行列式。矩阵行列式(Matrix Determinant)
矩阵行列式是一个标量,可以用于判断矩阵是否可逆,通常也可以用符号“
∣
A
∣
|A|
∣A∣”表示矩阵
A
A
A的行列式。对于一个
n
n
n阶矩阵
A
A
A,它的行列式可以通过以下公式计算得出:
∣ A ∣ = ∑ i = 1 n ( − 1 ) i + j a i , j ∣ A i , j ∣ |A| = \sum_{i=1}^{n}(-1)^{i+j}a_{i,j}|A_{i,j}| ∣A∣=i=1∑n(−1)i+jai,j∣Ai,j∣
A T A^T AT (转置矩阵):表示矩阵 A A A 的转置矩阵,例如 A T A^T AT 表示矩阵 A A A 的转置矩阵。
A − 1 A^{-1} A−1 (逆矩阵):表示矩阵 A A A 的逆矩阵,例如 A − 1 A^{-1} A−1 表示矩阵 A A A 的逆矩阵。
A ⋅ B A\cdot B A⋅B (矩阵乘积):表示矩阵 A A A 和矩阵 B B B 的乘积,例如 A ⋅ B A\cdot B A⋅B 表示矩阵 A A A 和矩阵 B B B 的乘积。有时也用 A × B A\times B A×B表示,不过不够标准。
t r ( A ) \mathrm{tr}(A) tr(A):是指矩阵对角线上所有元素的和,通常用符号“ t r ( A ) \mathrm{tr}(A) tr(A)”表示矩阵 A A A的迹。对于一个 n n n阶方阵 A A A,它的迹可以用以下公式计算得出:
t r ( A ) = ∑ i = 1 n a i , i \mathrm{tr}(A) = \sum_{i=1}^{n}a_{i,i} tr(A)=i=1∑nai,i
∥ A ∥ \Vert A \Vert ∥A∥:表示矩阵 A A A的范数。常见的矩阵范数有以下几种:
第一范数(
L
1
L_1
L1范数):
∥
A
∥
1
=
max
j
∑
i
=
1
n
∣
a
i
,
j
∣
\Vert A \Vert_1 = \max_{j}\sum_{i=1}^{n}|a_{i,j}|
∥A∥1=maxj∑i=1n∣ai,j∣
第二范数(
L
2
L_2
L2范数):
∥
A
∥
2
=
λ
max
(
A
T
A
)
\Vert A \Vert_2 = \sqrt{\lambda_{\max}(A^{\mathrm{T}}A)}
∥A∥2=λmax(ATA)
无穷范数(
L
∞
L_{\infty}
L∞范数):
∥
A
∥
∞
=
max
i
∑
j
=
1
n
∣
a
i
,
j
∣
\Vert A \Vert_{\infty} = \max_{i}\sum_{j=1}^{n}|a_{i,j}|
∥A∥∞=maxi∑j=1n∣ai,j∣
其中,
λ
max
(
A
T
A
)
\lambda_{\max}(A^{\mathrm{T}}A)
λmax(ATA)表示矩阵
A
T
A
A^{\mathrm{T}}A
ATA的最大特征值。
“ r a n k ( A ) \mathrm{rank}(A) rank(A):矩阵秩(Matrix Rank)是指矩阵中所有线性无关的行向量或列向量的个数,通常用符号“ r a n k ( A ) \mathrm{rank}(A) rank(A)”表示矩阵 A A A的秩。矩阵的秩可以通过高斯消元法或奇异值分解等方法计算得出。
∀ \forall ∀ (全称量词):表示“对于所有的”。
∃ \exists ∃ (存在量词):表示“存在”。
∈ \in ∈ (属于):表示某个元素属于某个集合,例如 x ∈ S x\in S x∈S 表示 x x x 属于集合 S S S。
⊆ \subseteq ⊆ (子集或相等):表示一个集合包含在另一个集合中或两个集合相等,例如 S 1 ⊆ S 2 S_1\subseteq S_2 S1⊆S2 表示集合 S 1 S_1 S1 包含在集合 S 2 S_2 S2 中。
∪ \cup ∪ (并集):表示两个集合的并集,例如 S 1 ∪ S 2 S_1\cup S_2 S1∪S2 表示由 S 1 S_1 S1 和 S 2 S_2 S2 中所有元素构成的集合。
∩ \cap ∩ (交集):表示两个集合的交集,例如 S 1 ∩ S 2 S_1\cap S_2 S1∩S2 表示同时属于 S 1 S_1 S1 和 S 2 S_2 S2 的元素构成的集合。
⇒ \Rightarrow ⇒ (蕴含):表示逻辑上的蕴含关系,例如 A ⇒ B A\Rightarrow B A⇒B 表示如果 A A A 成立,则 B B B 也一定成立。
⇔ \Leftrightarrow ⇔ (等价):表示逻辑上的等价关系,例如 A ⇔ B A\Leftrightarrow B A⇔B 表示 A A A 和 B B B 是等价的。
∼ \sim ∼ (取反):表示逻辑上的否定,例如 ∼ A \sim A ∼A 表示 A A A 不成立。
⊕ \oplus ⊕ (异或):表示逻辑上的异或关系,例如 A ⊕ B A\oplus B A⊕B 表示 A A A 和 B B B 中恰有一个成立。
→ \rightarrow → (箭头):表示一个数、向量、函数等的趋势或者变化方向,例如 f ( x ) → ∞ f(x)\rightarrow \infty f(x)→∞ 表示 x x x 趋向于无穷大时, f ( x ) f(x) f(x) 趋向于正无穷。
∀ i = 1 n \forall_{i=1}^n ∀i=1n (全称量词带下标):表示对于一个有限个数的序列或集合中的所有元素,例如 ∀ i = 1 n x i > 0 \forall_{i=1}^n x_i > 0 ∀i=1nxi>0 表示对于 n n n 个数 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn,每个数都大于 0 0 0。
→ \rightarrow → (蕴含符号):在逻辑学和数学中,表示一个命题中的“如果…那么”。
∴ \therefore ∴ (因此):表示推理的结论。
□ \Box □ (证毕符号):表示证明结束,证明得证。
表示 X X X 是一个 n 1 n_1 n1 行 n 2 n_2 n2 列的矩阵,其中 R \mathbb{R} R 表示实数集合,即 X X X 的元素都属于实数集合。矩阵的元素可以是实数,也可以是复数,具体取决于具体的上下文。
表示将矩阵
X
X
X 按列展开成一个向量。具体来说,如果矩阵
X
X
X 是一个
n
1
×
n
2
n_1 \times n_2
n1×n2 的矩阵,那么
vec
(
X
)
\operatorname{vec}(X)
vec(X) 是一个
n
1
n
2
×
1
n_1n_2 \times 1
n1n2×1 的列向量,其元素按列排列,即
vec
(
X
)
=
[
x
1
,
1
,
x
2
,
1
,
…
,
x
n
1
,
1
,
x
1
,
2
,
…
,
x
n
1
,
n
2
]
⊤
\operatorname{vec}(X) = [x_{1,1}, x_{2,1}, \dots, x_{n_1,1}, x_{1,2}, \dots, x_{n_1,n_2}]^\top
vec(X)=[x1,1,x2,1,…,xn1,1,x1,2,…,xn1,n2]⊤,其中
⊤
\top
⊤ 表示向量的转置操作。
v
e
c
(
X
)
=
[
x
11
x
21
⋮
x
n
1
x
12
x
22
⋮
x
n
2
⋮
x
n
1
n
2
]
vec(\mathbf{X}) =
表示一个 n 1 n 2 n_1n_2 n1n2 行 n 1 n 2 n_1n_2 n1n2 列的实数矩阵。这种表示法通常在涉及到向量化操作时出现,它可以将一个二维的矩阵映射到一个一维的向量,方便我们进行一些数学运算和处理。例如,如果我们对一个 n 1 × n 2 n_1 \times n_2 n1×n2 的矩阵进行向量化操作,得到的向量的长度为 n 1 n 2 n_1n_2 n1n2,我们可以用一个 n 1 n 2 × n 1 n 2 n_1n_2 \times n_1n_2 n1n2×n1n2 的矩阵 K K K 来表示这个向量。具体来说, K K K 的每一行可以看作是一个原始矩阵中的一个元素,而每一列可以看作是一个向量化后的矩阵中的一个元素。例如,如果原始矩阵 X X X 中的第 ( i , j ) (i,j) (i,j) 个元素为 x i , j x_{i,j} xi,j,那么对应的向量化后的矩阵中的第 k k k 个元素为 x i , j x_{i,j} xi,j,其中 k = ( j − 1 ) n 1 + i k = (j-1)n_1 + i k=(j−1)n1+i。因此, K K K 的第 k k k 行第 l l l 列的元素可以表示为 K k , l = δ i , l δ j , k K_{k,l} = \delta_{i,l}\delta_{j,k} Kk,l=δi,lδj,k,其中 δ \delta δ 表示克罗内克(Kronecker)δ符号,满足当 i = l i = l i=l 且 j = k j = k j=k 时取值为 1,否则取值为 0。
通常表示 Kronecker积(Kronecker product)运算。Kronecker积是一种基于矩阵的张量积(tensor product)扩展的一种运算,它将两个矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A∈Rm×n 和 B ∈ R p × q B \in \mathbb{R}^{p \times q} B∈Rp×q 分别按元素逐一相乘,并按照矩阵的形式进行组合,得到一个新的矩阵 C ∈ R m p × n q C \in \mathbb{R}^{mp \times nq} C∈Rmp×nq,具体地:
C
=
A
⊗
B
=
[
a
11
B
⋯
a
1
n
B
⋮
⋱
⋮
a
m
1
B
⋯
a
m
n
B
]
C = A \otimes B =
其中, a i j a_{ij} aij 表示矩阵 A A A 中的第 i i i 行第 j j j 列的元素, B B B 表示一个 p × q p \times q p×q 的矩阵, a i j B a_{ij}B aijB 表示将矩阵 B B B 的每个元素都乘以 a i j a_{ij} aij,得到一个 p × q p \times q p×q 的矩阵。Kronecker积的一个重要应用是在线性代数和信号处理领域中。它可以用来表示矩阵的重复和扩展,从而简化一些复杂的运算和计算。例如,当我们需要对两个向量进行外积运算时,可以使用 Kronecker积来简化计算;在卷积神经网络中,可以使用 Kronecker积来表示卷积操作和池化操作;在信号处理中,可以使用 Kronecker积来表示多维信号的卷积和相关操作等。
在强化学习中,通常表示在一个给定的状态 x x x 下,智能体在执行强化学习任务时采取动作 y y y 的概率。具体来说, π R L ( y ∣ x ) \pi^{RL}(y|x) πRL(y∣x) 是一个策略函数(policy function),它描述了智能体如何根据环境的状态来选择动作。在强化学习中,一个智能体通常通过与环境的交互来学习策略函数,即根据当前状态选择一个最优的动作,从而最大化累积奖励(cumulative reward)。因此,策略函数的设计和优化是强化学习中的一个核心问题。需要注意的是, π R L ( y ∣ x ) \pi^{RL}(y|x) πRL(y∣x) 的具体形式和实现方式因任务和算法而异。在某些情况下,策略函数可以直接通过映射状态到动作的函数来表示,例如 π R L ( y ∣ x ) = f ( x ) \pi^{RL}(y|x)=f(x) πRL(y∣x)=f(x);在其他情况下,策略函数可能需要根据一些参数或价值函数来决定动作,例如 π R L ( y ∣ x ) = softmax ( f θ ( x ) ) \pi^{RL}(y|x)=\text{softmax}(f_\theta(x)) πRL(y∣x)=softmax(fθ(x)),其中 f θ ( x ) f_\theta(x) fθ(x) 表示带有参数 θ \theta θ 的函数。
在论文中, d i a g ( x ) diag(\mathbf{x}) diag(x) 表示将向量 x \mathbf{x} x 的每个元素放在一个对角线上,其余位置为零的对角矩阵,即:
d
i
a
g
(
x
)
=
[
x
1
0
⋯
0
0
x
2
⋯
0
⋮
⋮
⋱
⋮
0
0
⋯
x
n
]
diag(\mathbf{x}) =
而 v e c ( X ) vec(\mathbf{X}) vec(X) 表示将矩阵 X \mathbf{X} X 按列展开成一个列向量,即:
v
e
c
(
X
)
=
[
x
11
x
21
⋮
x
n
1
x
12
x
22
⋮
x
n
2
⋮
x
n
1
n
2
]
vec(\mathbf{X}) =
因此, d i a g ( v e c ( K p ) ) diag(vec(\mathbf{K}_p)) diag(vec(Kp)) 表示将矩阵 K p \mathbf{K}_p Kp 按列展开成一个列向量后,将其放在一个对角线上,其余位置为零的对角矩阵,即:
d
i
a
g
(
v
e
c
(
K
p
)
)
=
[
K
p
,
11
K
p
,
21
⋱
K
p
,
n
1
n
2
,
n
1
n
2
]
diag(vec(\mathbf{K}_p)) =
其中 K p , i j \mathbf{K}_{p,ij} Kp,ij 表示矩阵 K p \mathbf{K}_p Kp 中第 i i i 行、第 j j j 列的元素。
表示一个从区间 [ 1 , d ] [1, d] [1,d] 到自身的映射,也就是一个自同态。其中 [ 1 , d ] [1, d] [1,d] 表示包含从 1 1 1 到 d d d 所有整数的闭区间。
这个映射通常用来表示一种数据的排列方式,例如排列矩阵的行或列。具体而言,对于一个 d d d 维向量 x = ( x 1 , x 2 , ⋯ , x d ) \mathbf{x} = (x_1, x_2, \cdots, x_d) x=(x1,x2,⋯,xd), π ( x ) \pi(\mathbf{x}) π(x) 表示对 x \mathbf{x} x 进行排列后的结果。在实际应用中,这种排列方式通常与某种特定的数据结构或算法相关。
需要注意的是,虽然符号 π \pi π 在一些特定的上下文中可能有不同的含义,但是在不同的文献中可能存在差异,需要具体根据文献背景来理解。
表示函数合成,也就是将函数 π 2 \pi_2 π2 的输出作为函数 π 1 \pi_1 π1 的输入,然后输出 π 1 \pi_1 π1 的结果。具体来说,对于两个从区间 [ 1 , d ] [1,d] [1,d] 到自身的映射 π 1 \pi_1 π1 和 π 2 \pi_2 π2,符号 π 1 ∘ π 2 \pi_1 \circ \pi_2 π1∘π2 定义如下:
( π 1 ∘ π 2 ) ( i ) = π 1 ( π 2 ( i ) ) , i = 1 , 2 , ⋯ , d . (\pi_1 \circ \pi_2)(i) = \pi_1(\pi_2(i)), \qquad i = 1, 2, \cdots, d. (π1∘π2)(i)=π1(π2(i)),i=1,2,⋯,d.
这个符号在某些场景下可以用来表示对一个多维数组进行多次排列的结果。比如,对于一个形状为 n × d n \times d n×d 的矩阵 X \mathbf{X} X,可以使用 π 1 ∘ π 2 \pi_1 \circ \pi_2 π1∘π2 来表示先对矩阵的行进行排列,再对排列后的结果的列进行排列得到的新矩阵。具体来说,假设 X i , j \mathbf{X}_{i,j} Xi,j 表示矩阵 X \mathbf{X} X 中第 i i i 行第 j j j 列的元素, π 1 \pi_1 π1 表示行的排列方式, π 2 \pi_2 π2 表示列的排列方式,则排列后的矩阵可以表示为:
( π 1 ∘ π 2 ) ( X ) i , j = X π 1 ( π 2 ( i ) ) , π 2 ( j ) . (\pi_1 \circ \pi_2)(\mathbf{X}){i,j} = \mathbf{X}{\pi_1(\pi_2(i)), \pi_2(j)}. (π1∘π2)(X)i,j=Xπ1(π2(i)),π2(j).
需要注意的是,符号 π 1 ∘ π 2 \pi_1 \circ \pi_2 π1∘π2 通常要满足结合律,即 ( π 1 ∘ π 2 ) ∘ π 3 = π 1 ∘ ( π 2 ∘ π 3 ) (\pi_1 \circ \pi_2) \circ \pi_3 = \pi_1 \circ (\pi_2 \circ \pi_3) (π1∘π2)∘π3=π1∘(π2∘π3),但是在某些特定的场景下,这个条件可能不满足,需要具体根据上下文来理解。
表示定义在置换群 S d S_d Sd上,取值为实数 R R R中的函数 f f f,即 f f f完成了 S d S_d Sd到 R R R空间的映射。其中 S d S_d Sd是由 d d d个元素的置换组成的群(d个元素的排列组合),通常也称为对称群。在机器学习中,置换群通常用于处理具有对称性质的问题,例如图像识别、图像处理等。函数 f f f可以是任意函数,例如特征函数、损失函数等。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。