赞
踩
在编码理论第十一章:LDPC码原理学习及其习题分析中当时为便于复习记了个简易的blog。另外起一篇长文,详细谈谈LDPC和SPA算法,以及SPA算法后续的一些改进。
面向人群:具有编码理论背景但通原知识不牢而且对LDPC码知识了解不多的人,大佬们刷到时建议跳过,新进展google学术。
参考文献:
[1] Ryan, William. (2004). An introduction to LDPC codes. 10.1201/9780203490310.ch36.
[2] Shokrollahi, Amin. (2004). LDPC Codes: an Introduction. 10.1007/978-3-0348-7865-4_5.
[3] Gallager, Robert G. “Principles of Digital Communication”.
LDPC码由Gallager于1960年首次提出,由Tanner在1981年推广了LDPC码并引入了称为Tanner图的图形表示。LDPC想要解决的问题是:高速数据无线传输时的误码和噪声问题,其设计初衷在不同的信道条件下通过不同的码率,希望能以较少的冗余比特达到尽可能高的纠错性能,且译码延迟尽可能低。
根据Claude E. Shannon信息论的定义和证明就是遍历完所有可能的信道输入分布后,找到那个可以使互信息最大的那个分布,互信息最大时就是信道容量。第二定理 (有噪信道编码定理) 给出,当信道的信息传输率R不超过信道容量C时(R < C),采用合适的信道编码方法可以实现任意高的传输可靠性,但若信息传输率超过了信道容量(R > C),就不可能实现可靠的传输。
It is possible to transmit information over this channel reliably (with probability of error → 0) if and only if:
R = def # information bits channel use < C R \stackrel{\text { def }}{=} \frac{\# \text { information bits }}{\text { channel use }}<C R= def channel use # information bits <C信息传输率R即单位时间内由数据通路传输数据的数量,可以是每秒钟传输二进制码元的个数(比特率bit/s),也可以是每秒钟传输信号码元的个数(波特率Bd),但本文都指比特率。
通俗点想,如果一个信道信息传输率R<C,编码符号数量足够多时,总能找到M个编码符号,组成一个码用对应的译码规则正确译码(译码错误概率任意小)。比如带限AWGN信道容量的无约束容量: C awgn ( P , B ) = B log 2 ( 1 + P N 0 B ) bits / s C_{\text {awgn }}(P, B)=B \log _2\left(1+\frac{P}{N_0 B}\right) \quad \text { bits } / s Cawgn (P,B)=Blog2(1+N0BP) bits /s带宽限制为B Hz(正负两边的),均接收功率限制为P瓦特, P = E b R P=E_bR P=EbR是每个信息位的平均信号能量和数据传输率R的乘积。加性白高斯噪声的功率谱密度为 N 0 2 \frac{N_0}{2} 2N0。
虽然有噪信道编码定理理论上可以实现信道容量,但实际上需要高效的编码和译码算法才能用于通信。因为
R
=
k
n
R=\frac{k}{n}
R=nk将k个bit编码为n个bit时意味着,码表大小为
2
k
2^k
2k,虽然采用最大似然译码器时错误概率会在块长度趋向无穷大时迅速趋近于零,但这更说明需要高效的编码和译码算法。
可以在多项式时间内进行编码的线性码——LDPC出现了。但最大似然译码问题的复杂性对于线性码来说问题很大,所以也引出了多项式时间的次优译码算法SPA。
LDPC编码可以用矩阵表示也可以用图表示。矩阵和图结构的稀疏性是LDPC码的算法效率的关键特性。
LDPC码可以概括到非二进制字母表,这里暂时只考虑二进制LDPC码。LDPC码属于一类线性分组码,同样可以描述为二进制域
F
2
\mathbb{F}_2
F2上的二进制n元组向量空间
F
2
n
\mathbb{F}_2^n
F2n中的一个k维子空间
C
\mathcal{C}
C:一组基
B
=
{
g
0
,
g
1
,
…
,
g
k
−
1
}
B=\{\mathbf{g}_0, \mathbf{g}_1, \ldots, \mathbf{g}_{k-1}\}
B={g0,g1,…,gk−1},它们生成了
C
\mathcal{C}
C,这样每个
c
∈
C
\mathbf{c} \in \mathcal{C}
c∈C都可以写成
c
=
u
0
g
0
+
u
1
g
1
+
…
+
u
k
−
1
g
k
−
1
\mathbf{c}=u_0 \mathbf{g}_0+u_1 \mathbf{g}_1+\ldots+u_{k-1} \mathbf{g}_{k-1}
c=u0g0+u1g1+…+uk−1gk−1的形式。
c
=
u
G
\mathbf{c}=\mathbf{u} G
c=uG,其中
u
\mathbf{u}
u是
u
i
{u_i}
ui的向量,
G
G
G是称为生成矩阵的
k
×
n
k \times n
k×n矩阵,其行是
g
i
{\mathbf{g}_i}
gi向量。生成矩阵
G
G
G的零空间是
C
⊥
\mathcal{C}^{\perp}
C⊥,它是一个
(
n
−
k
)
(n-k)
(n−k)维的向量空间,其中的向量
x
\mathbf{x}
x满足
x
G
T
=
0
\mathbf{x} G^T=\mathbf{0}
xGT=0。
C
⊥
\mathcal{C}^{\perp}
C⊥的基是
B
⊥
=
{
h
0
,
h
1
,
…
,
h
n
−
k
−
1
}
B^{\perp}=\{\mathbf{h}_0, \mathbf{h}_1, \ldots, \mathbf{h}_{n-k-1}\}
B⊥={h0,h1,…,hn−k−1},因此对于每个
c
∈
C
\mathbf{c} \in \mathcal{C}
c∈C,
c
h
i
T
=
0
\mathbf{c h}_i^T=0
chiT=0对于所有
i
i
i成立,或者更紧凑地,
c
H
T
=
0
\mathbf{c} H^T=\mathbf{0}
cHT=0。
H
H
H被称为奇偶校验矩阵,它执行接收字的
m
=
n
−
k
m=n-k
m=n−k个单独的奇偶校验检查。
LDPC的名字来源就是因为其奇偶校验矩阵
H
H
H中1的密度很低。规则LDPC码是一种线性分组码,其奇偶校验矩阵
H
H
H的每列都包含精确的
w
c
w_c
wc个1 ,每行都包含精确的
w
r
=
w
c
(
n
/
m
)
w_r=w_c(n/m)
wr=wc(n/m)个1,其中
w
c
<
<
m
w_c << m
wc<<m、
w
c
<
<
n
w_c << n
wc<<n。码率
R
=
k
/
n
R=k/n
R=k/n与这些参数之间的关系是
R
=
1
−
w
c
/
w
r
R=1-w_c/w_r
R=1−wc/wr(前提是
H
H
H满秩的)。如果
H
H
H的1的密度较低,但每列或每行中的1的数量不是固定的,那么该码是不规则LDPC码。
Tanner图是LDPC码的图形表示,其中包括变量节点(v-nodes)和校验节点(c-nodes)。Tanner图的构建规则是:如果奇偶校验矩阵 H H H中的元素 h j i h_{ji} hji为1,那么检查节点 j j j与变量节点 i i i相连。
PS:变量节点可以理解为bit或者说源符号节点,校验节点可以称为函数节点。
举例一个
(
10
,
5
)
(10,5)
(10,5)线性分组码,
w
r
=
w
c
(
=
2
)
n
m
=
4
w_r=w_c(=2)\frac{n}{m}=4
wr=wc(=2)mn=4 ,其奇偶校验矩阵
H
H
H包含了特定的1的分布:
H
=
[
1
1
1
1
0
0
0
0
0
0
1
0
0
0
1
1
1
0
0
0
0
1
0
0
1
0
0
1
1
0
0
0
1
0
0
1
0
1
0
1
0
0
0
1
0
0
1
0
1
1
]
H=\left[
相应的Tanner图如图中所示,其中
v
v
v节点
c
0
,
c
1
,
c
2
c_0, c_1, c_2
c0,c1,c2和
c
3
c_3
c3与
c
c
c节点
f
0
f_0
f0相连,对应于
H
H
H的第0行(所以H的第
i
i
i行,表示了第
i
i
i个校验节点
f
i
f_i
fi和所有变量节点的链接关系,同理,H的第
i
i
i列,也表明了第
i
i
i个变量节点和所有校验节点的链接关系)。Tanner图的规则性表示是指每个
v
v
v节点具有两个边连接,每个
c
c
c节点具有四个边连接。这与变量节点的度(或者说H矩阵的列权重)
w
c
=
d
v
=
2
w_c=d_v=2
wc=dv=2和检查节点的度(或者说H矩阵的行权重)
w
r
=
d
c
=
4
w_r=d_c=4
wr=dc=4相吻合,同时满足了
m
w
r
=
n
w
c
m w_r=n w_c
mwr=nwc。
重点:Tanner图中的长度为
ν
\nu
ν的环(或循环)是由
ν
\nu
ν条边构成的路径,最终回到自身。示例中图中的六条粗边表示了一个长度为6的环。Tanner图的环的长度
γ
\gamma
γ是图中的最小循环长度。 在二分图中 最短可能的循环明显是长度为4的循环(无论如何构造),这些循环在
H
H
H矩阵中体现为位于子矩阵的角上的四个1。 短循环会降低LDPC码所使用的迭代译码算法的性能 。 这一事实将在迭代译码算法中讨论。
补充说明两个点:
不规则LDPC怎么去表示节点的分布:
对于不规则LDPC码,参数 w c w_c wc和 w r w_r wr是列和行数的函数,通常不采用此表示法。相反,通常采用 λ ( x ) \lambda(x) λ(x)和 ρ ( x ) \rho(x) ρ(x)表示 v v v节点和 c c c节点的度分布多项式。 在多项式 λ ( x ) \lambda(x) λ(x)中, λ d \lambda_d λd表示与度为 d d d的 v v v节点相连的边的比例, d v d_v dv表示最大的 v v v节点度: λ ( x ) = ∑ d = 1 d v λ d x d − 1 , \lambda(x)=\sum_{d=1}^{d_v} \lambda_d x^{d-1}, λ(x)=d=1∑dvλdxd−1,
类似地,在多项式 ρ ( x ) \rho(x) ρ(x)中, ρ d \rho_d ρd表示与度为 d d d的 c c c节点相连的边的比例, d c d_c dc表示最大的 c c c节点度: ρ ( x ) = ∑ d = 1 d c ρ d x d − 1 , \rho(x)=\sum_{d=1}^{d_c} \rho_d x^{d-1}, ρ(x)=d=1∑dcρdxd−1,
对举例中的规则码, w c = d v = 2 w_c=d_v=2 wc=dv=2和 w r = d c = 4 w_r=d_c=4 wr=dc=4,我们有 λ ( x ) = x \lambda(x)=x λ(x)=x和 ρ ( x ) = x 3 \rho(x)=x^3 ρ(x)=x3。
在说完LDPC编码的表示后应该明晰一点,怎么设计LDPC编码,一个评判标准应该是怎么降低短循环;怎么设计LDPC译码,一个评判标志是应该怎么降低短循环干扰。
本文后续统一记check节点为c节点,节点集合为
f
\mathbf{f}
f,variable节点为v节点,节点集合为
c
\mathbf{c}
c,并且在tanner图中,c节点在上方,v节点在下方。
梳理一下参考文献中的,最新进展请自行调研。列出来码是极其有意义的,属于是指出了LDPC码的可能研究方向,很多人沿着他们的方向做。这里没有标注每一个码的设计年代是因为没有意义,很多人已经在他们的方向上进行了改进。
最早的LDPC码:Gallager码,这里说其在1981年由Tanner推广后的形式[3]。
正则LDPC码,其奇偶校验矩阵 H H H具有特定的结构。假设有两个任意整数 μ > 1 \mu>1 μ>1和 w r > 1 w_r>1 wr>1,其 H H H矩阵由多个子矩阵 H d H_d Hd组成,其中每个子矩阵 H d H_d Hd都是 μ × μ w r \mu \times \mu w_r μ×μwr的矩阵。每个 H d H_d Hd的行权重为 w r w_r wr,列权重为1。
重点特征为 H 1 H_1 H1具有特定的形式:
- 对于 i = 1 , 2 , … , μ i=1,2,\ldots,\mu i=1,2,…,μ,第 i i i行包含了所有 w r w_r wr个1且位置在列 ( i − 1 ) w r + 1 (i-1)w_r+1 (i−1)wr+1到 i w r iw_r iwr之间。
- 其他子矩阵 H d H_d Hd只是 H 1 H_1 H1的列置换。
H H H矩阵是正则的,具有维数 μ w c × μ w r \mu w_c \times \mu w_r μwc×μwr,行权重为 w r w_r wr,列权重为 w c w_c wc。 H H H矩阵中不一定不存在长度为4的循环,但可以通过计算机设计来避免它们。Gallager证明了这类编码的集合在 w c ≥ 3 w_c \geq 3 wc≥3和 w r > w c w_r > w_c wr>wc的条件下具有出色的距离特性,而且这些编码具有低复杂度的编码器。
Irregular LDPC 码(luby):假设使用消息传递解码,针对信道条件设计过的度分布多项式 λ ( x ) \lambda(x) λ(x)和 ρ ( x ) \rho(x) ρ(x)参数化的编码集合中的典型编码能够在更差的信道条件下进行可靠通信,而不在集合外部的编码则不能。
PS1:最差情况下的信道条件被称为解码阈值,而 λ ( x ) \lambda(x) λ(x)和 ρ ( x ) \rho(x) ρ(x)的优化通过密度演化算法和优化算法的组合找到的。
PS2:密度演化是指解码器的Tanner图中传递的各种量的概率密度函数(pdf)的演化。给定 λ ( x ) \lambda(x) λ(x) - ρ ( x ) \rho(x) ρ(x)对的解码阈值是通过评估编码比特的计算对数似然比的pdf来确定的。单独的优化算法是在 λ ( x ) \lambda(x) λ(x) - ρ ( x ) \rho(x) ρ(x)对上进行优化。
PS3: 一般来说,通过密度演化设计算法最适用于速率不太高的编码( R ≲ 3 / 4 R \lesssim 3/4 R≲3/4)和长度不太短的编码( n ≳ 5000 n \gtrsim 5000 n≳5000)。 原因在于密度演化设计算法假设 n → ∞ n \rightarrow \infty n→∞(因此, m → ∞ m \rightarrow \infty m→∞),因此对于非常长的编码而言,最优的 λ ( x ) \lambda(x) λ(x) - ρ ( x ) \rho(x) ρ(x)对将不适用于中等长度和短编码。这些 λ ( x ) \lambda(x) λ(x) - ρ ( x ) \rho(x) ρ(x)对应用于中等长度和短编码会导致较高的错误率底线。针对短块对密度演进做出其他调整的除外哈
Finite Geometry Codes(包含了cyclic finite geometry codes和quasi-cyclic finite geometry codes):基于有限几何的传统技术设计的正则LDPC码,该方法产生了循环和准循环的LDPC码。循环有限几何码往往具有相对较大的最小码字距离,准循环码的最小码字距离往往较小。使用这些技术设计的短LDPC码( n n n在200比特左右)通常优于使用伪随机 H H H矩阵设计的短LDPC码。
缺点
- 在解码中使用的奇偶校验矩阵是 n × n n \times n n×n而不是 ( n − k ) × n (n-k) \times n (n−k)×n。(可以选择 n × n n \times n n×n矩阵的 ( n − k ) × n (n-k) \times n (n−k)×n子矩阵进行解码,但性能损失通常不可忽略。)
- w r w_r wr和 w c w_c wc的值相对较大,这是不希望的,因为迭代消息传递解码器的复杂度与这些值成正比。
- 在长度和速率的选择方面没有灵活性,只能通过编码的缩短和削减来处理这个问题。
RA, IRA, and eIRA Codes:一种兼具串行Turbo码和LDPC码特征的编码类型。
RA:用户比特被重复(通常是2次或3次),然后经过排列,最后通过一个累加器(差分编码器)进行编码。这些编码已经证明能够接近容量极限,但它们的缺点是它们通常具有较低的速率(速率 1 / 2 1/2 1/2或更低)。
IRA:一些比特重复的次数多于其他比特,形成了不规则的重复累积。通常是非系统编码,尽管它们可以转换成系统编码形式,但这会大大降低速率
eIRA:系统编码,并允许低速率和高速率。
数组码(Array Codes):采用一种独特的校验矩阵 H 结构,简化了编码。以低误差率底部而闻名,可以设计用于低码率和高码率。然而,由于 H 矩阵的特定格式,只能实现特定的码长和码率。对于应用中需要较短码长的情况,这种编码方案可以是不错的选择。
Combinatorial LDPC Codes:利用组合数学原理来设计具有特定约束条件的 LDPC 码。对于应用中需要较短码长的情况,这种编码方案可以是不错的选择。
PS:这里列的LPDC发展方向是不全面的,其他方向请自行调研。
SPA(Sum-Product Algorithm)和积算法是Gallager在1960年提出的迭代解码算法,迭代译码算法也叫belief propagation algorithm (BP algorithm), and the message passing algorithm (MPA)。
PS: BP算法是SPA算法在译码中的具体应用。在LDPC码的上下文中,两者通常可以互换使用。SPA 包括“概率域”版本(计算 APP)及其对数域版本log-SPA(计算 LLR)以及某些近似值,BP一般指其对数域版本。
后验概率:a posteriori probability (APP)
给定
- 传输码字 c = [ c 0 c 1 … c n − 1 ] \mathbf{c}=\left[
\right] c=[c0c1…cn−1]c0c1…cn−1 - 接受码字 y = [ y 0 y 1 … y n − 1 ] \mathbf{y}=\left[
\right] y=[y0y1…yn−1]y0y1…yn−1 定义
- 第i个bit的后验概率/第i位的后验概率 : Pr ( c i = 1 ∣ y ) \operatorname{Pr}\left(c_i=1 \mid \mathbf{y}\right) Pr(ci=1∣y)
- the APP ratio/the likelihood ratio, LR : l ( c i ) ≜ Pr ( c i = 0 ∣ y ) Pr ( c i = 1 ∣ y ) . l\left(c_i\right) \triangleq \frac{\operatorname{Pr}\left(c_i=0 \mid \mathbf{y}\right)}{\operatorname{Pr}\left(c_i=1 \mid \mathbf{y}\right)} . l(ci)≜Pr(ci=1∣y)Pr(ci=0∣y).
- the log-APP ratio/the log-likelihood ratio (LLR) : L ( c i ) ≜ log ( Pr ( c i = 0 ∣ y ) Pr ( c i = 1 ∣ y ) ) L\left(c_i\right) \triangleq \log \left(\frac{\operatorname{Pr}\left(c_i=0 \mid \mathbf{y}\right)}{\operatorname{Pr}\left(c_i =1 \mid \mathbf{y}\right)}\right) L(ci)≜log(Pr(ci=1∣y)Pr(ci=0∣y))
其中此处和后续内容均假定自然对数。
迭代译码算法目的:在已知接受码字的情况下,计算第i位的概率分布情况
计算
Pr
(
c
i
=
1
∣
y
)
、
l
(
c
i
)
\operatorname{Pr}\left(c_i=1 \mid \mathbf{y}\right)、l\left(c_i\right)
Pr(ci=1∣y)、l(ci) 或
L
(
c
i
)
L\left(c_i\right)
L(ci)
迭代译码算法思想:基于图的消息传递。
2.1.1先说迭代过程,2.1.2说迭代过程中的消息传递信息的是什么
下文中,输出信息被分解为内信息 (intrinsic information) 和内信息 (extrinsic information), 来自外部的信息叫外部信息,来自节点内部的信息叫做内信息,实际上外信息和外部信息由于没用特殊映射,在LR和LLR中就是线性加减关系,可以认为就是等同。
在1.2.2中,变量节点v的集合 { c 0 , c 1 , . . . , c n − 1 } \{c_0,c_1,...,c_{n-1}\} {c0,c1,...,cn−1}可以理解为编码后的bit或者说源符号节点,校验节点c的集合 { f 0 , f 1 , . . . , f n − k } \{f_0,f_1,...,f_{n-k}\} {f0,f1,...,fn−k}可以称为函数节点。但是在消息迭代中,将v节点代表一种类型的处理器,c 节点代表另一种类型的处理器,边代表消息路径,会更好理解:
经过一定数量的迭代或者达到迭代停止条件后,译码器就会根据LLR计算每一个变量节点 c i c_i ci的bit判决情况,最普适最常见的迭代停止准则就是 c ^ H T = 0 \hat{\mathbf{c}} \mathbf{H}^T=0 c^HT=0, c ^ \hat{\mathbf{c}} c^上的尖尖表示tentatively解码码字,也就是暂定估计值。
- 假设成立条件,当接受bit位 y i y_i yi 独立时,如果 Tanner 图不存在环,则该独立性假设成立;如果存在周长为 γ \gamma γ 的环,独立性假设仅在第 γ / 2 \gamma / 2 γ/2 次迭代之前成立,之后消息开始在图的各个周期中自行循环。
- 模拟表明,避免长度为四的周期,消息传递算法通常非常有效,且部分长度为四周期的配置是无害的。H. Tang, J. Xu, S. Lin, and K. Abdel-Ghaffar, “Codes on finite geometries,” submitted to IEEE Trans. Inf. Theory. 2002.
- 有害性可以通过the message-passing schedule/flooding schedule大量缓解。H. Xiao and A. Banihashemi, “Message-passing schedules for decoding LDPC codes,” submitted to IEEE Trans. Comm., 2003.
引入文献中的符号表示:
注意,消息 q i j ( b ) q_{i j}(b) qij(b) 和 r j i ( b ) r_{j i}(b) rji(b) 虽然在这里被解释为概率,但本身还是随机变量 (random variables, rv’s),因为它们是关于随机变量 y i y_i yi 和其他消息的函数。
对于
q
i
j
(
b
)
q_{i j}(b)
qij(b)的生成,用贝叶斯公式两次,将一大坨常数概率值用常数
K
i
j
K_{ij}
Kij表示
q
i
j
(
0
)
=
Pr
(
c
i
=
0
∣
y
i
,
S
i
,
M
c
(
∼
j
)
)
=
(
1
−
P
i
)
Pr
(
S
i
∣
c
i
=
0
,
y
i
,
M
c
(
∼
j
)
)
/
Pr
(
S
i
)
=
K
i
j
(
1
−
P
i
)
∏
j
′
∈
C
i
\
j
r
j
′
i
(
0
)
同理:
q
i
j
(
1
)
=
K
i
j
P
i
∏
j
′
∈
C
i
\
j
r
j
′
i
(
1
)
.
公式(1)合并为
q
i
j
(
b
)
=
K
i
j
P
i
∏
j
′
∈
C
i
\
j
r
j
′
i
(
b
)
.
\quad q_{i j}(b)=K_{i j} P_i \prod_{j^{\prime} \in C_i \backslash j} r_{j^{\prime} i}(b) .
qij(b)=KijPi∏j′∈Ci\jrj′i(b).示意图如下:
定理1:假设有一个长度为 M M M的独立二进制数列{ a i a_i ai},且 P r ( a i − 1 ) = p i Pr(a_i-1)=p_i Pr(ai−1)=pi,则 { a i } i = 1 M \left\{a_i\right\}_{i=1}^M {ai}i=1M包含偶数个1的概率为 1 2 + 1 2 ∏ l = i M ( 1 − 2 p i ) \frac{1}{2}+\frac{1}{2} \prod_{l=i}^M\left(1-2 p_i\right) 21+21∏l=iM(1−2pi)。
根据定理1,考虑令
p
i
↔
q
i
j
(
1
)
p_i \leftrightarrow q_{i j}(1)
pi↔qij(1),则有公式(2):
r
j
i
(
0
)
=
1
2
+
1
2
∏
i
′
∈
V
j
\
i
(
1
−
2
q
i
′
j
(
1
)
)
r_{j i}(0)=\frac{1}{2}+\frac{1}{2} \prod_{i^{\prime} \in V_j \backslash i}\left(1-2 q_{i^{\prime} j}(1)\right)
rji(0)=21+21i′∈Vj\i∏(1−2qi′j(1))该公式的含义为:当
c
i
=
0
c_i=0
ci=0时,
{
c
i
′
:
i
′
∈
V
j
\
i
}
\left\{c_{i^{\prime}}: i^{\prime} \in V_j \backslash i\right\}
{ci′:i′∈Vj\i}bit位上的bit,必须包含偶数个1,才能满足校验方程
f
i
f_i
fi。此外,
r
j
i
(
1
)
=
1
−
r
j
i
(
0
)
r_{j i}(1)=1-r_{j i}(0)
rji(1)=1−rji(0)。
公式(2)可归纳为:
1
−
2
r
j
i
(
b
)
=
∏
i
′
∈
V
j
\
i
(
1
−
2
q
i
′
j
(
b
)
)
.
1-2 r_{j i}(b)=\prod_{i^{\prime} \in V_j \backslash i}\left(1-2 q_{i^{\prime} j}(b)\right) .
1−2rji(b)=i′∈Vj\i∏(1−2qi′j(b)).
MPA算法在计算bit位的APP序列时,初始化根据H矩阵完成:
对于
h
i
j
=
1
h_{ij}=1
hij=1(对应Tanner中存在连接关系的一对检查节点&变量节点),由于
q
i
j
(
b
)
=
Pr
(
c
i
=
b
∣
y
i
)
q_{i j}(b)=\operatorname{Pr}\left(c_i=b \mid y_i\right)
qij(b)=Pr(ci=b∣yi),根据先前定义的符号,即
q
i
j
(
1
)
=
P
i
q_{i j}(1)=P_i
qij(1)=Pi and KaTeX parse error: Expected '\right', got 'EOF' at end of input: …_{i j}(0)=1-P_i,显然,
y
i
y_i
yi为实际接收到的信道符号,这个概率是和信道类型有关的,所以初始化也需要根据信道情况进行初始化:
BEC信道,
y
i
∈
{
0
,
1
,
E
}
y_i \in\{0,1, E\}
yi∈{0,1,E} where
E
E
E is the erasure symbol,定义擦除概率为
δ
=
Pr
(
y
i
=
\delta=\operatorname{Pr}\left(y_i=\right.
δ=Pr(yi=
E
∣
c
i
=
b
)
\left.E \mid c_i=b\right)
E∣ci=b),则初始化为:
Pr
(
c
i
=
b
∣
y
i
)
=
{
1
when
y
i
=
b
0
when
y
i
=
b
c
1
/
2
when
y
i
=
E
\operatorname{Pr}\left(c_i=b \mid y_i\right)=\left\{
BSC信道,
y
i
∈
{
0
,
1
}
y_i \in\{0,1\}
yi∈{0,1},定义错误概率为
ε
=
Pr
(
y
i
=
b
c
∣
c
i
=
b
)
\varepsilon=\operatorname{Pr}\left(y_i=b^c \mid c_i=b\right)
ε=Pr(yi=bc∣ci=b),则初始化为:
Pr
(
c
i
=
b
∣
y
i
)
=
{
1
−
ε
when
y
i
=
b
ε
when
y
i
=
b
c
.
\operatorname{Pr}\left(c_i=b \mid y_i\right)=\left\{
Binary Input Additive White Gaussian Noise Channel (BI-AWGNC),假定传输时,第 i i i个bit值 c i c_i ci被BPSK映射为 x i = 1 − 2 c i x_i=1-2c_i xi=1−2ci,即 x i = + 1 ( − 1 ) x_i=+1(-1) xi=+1(−1) 对应 c i = 0 ( 1 ) c_i=0(1) ci=0(1)。那么第 i i i 个接收到的样本是 y i = x i + n i y_i=x_i+n_i yi=xi+ni,其中 n i n_i ni 是独立的并且正态分布为 η ( 0 , σ 2 ) \eta\left(0, \sigma^2\right) η(0,σ2)。此时,初始化为: Pr ( x i = x ∣ y i ) = [ 1 + exp ( − 2 y x / σ 2 ) ] − 1 \operatorname{Pr}\left(x_i=x \mid y_i\right)=\left[1+\exp \left(-2 y x / \sigma^2\right)\right]^{-1} Pr(xi=x∣yi)=[1+exp(−2yx/σ2)]−1其中 x ∈ { ± 1 } x \in\{ \pm 1\} x∈{±1}。
初步总结:
为简化上述算法中的计算过程,步骤4应在步骤3之前计算,然后步骤3可用简单除法 q i j ( b ) = K i j Q i ( b ) / r j i ( b ) q_{i j}(b)=K_{i j} Q_i(b) / r_{j i}(b) qij(b)=KijQi(b)/rji(b)代替。
为什么要过渡:与概率域 Viterbi 算法一样,概率域 SPA 因为涉及许多概率乘法,会在数值上变得不稳定。因此,和log - Viterbi一样 ,SPA 的对数域版本是首选,将开销大且不稳定的概率乘法转化为开销小的加法。
怎么实现过渡:
首先定义以下LLRs:
L ( c i ) = log ( Pr ( c i = 0 ∣ y i ) Pr ( c i = 1 ∣ y i ) ) L ( r j i ) = log ( r j i ( 0 ) r j i ( 1 ) ) L ( q i j ) = log ( q i j ( 0 ) q i j ( 1 ) ) L ( Q i ) = log ( Q i ( 0 ) Q i ( 1 ) )L(ci)L(rji)L(qij)L(Qi)=log(Pr(ci=1∣yi)Pr(ci=0∣yi))=log(rji(1)rji(0))=log(qij(1)qij(0))=log(Qi(1)Qi(0))L(ci)L(rji)L(qij)L(Qi)=log(Pr(ci=0∣yi)Pr(ci=1∣yi))=log(rji(0)rji(1))=log(qij(0)qij(1))=log(Qi(0)Qi(1))
初始化过程中的转化为:
( B E C ) L ( q i j ) = L ( c i ) = { + ∞ , y i = 0 − ∞ , y i = 1 0 , y i = E ( B S C ) L ( q i j ) = L ( c i ) = ( − 1 ) y i log ( 1 − ε ε ) ( B I − A W G N C ) L ( q i j ) = L ( c i ) = 2 y i / σ 2(BEC)L(qij)=L(ci)=⎩ ⎨ ⎧+∞,yi=0−∞,yi=10,yi=E(BSC)L(qij)=L(ci)=(−1)yilog(ε1−ε)(BI−AWGNC)L(qij)=L(ci)=2yi/σ2(BEC)L(qij)=L(ci)=⎧⎩⎨⎪⎪+∞,yi=0−∞,yi=10,yi=E(BSC)L(qij)=L(ci)=(−1)yilog(1−εε)(BI−AWGNC)L(qij)=L(ci)=2yi/σ2
Step1转化过程:
想要简化对数计算和除法运算,根据 tanh [ 1 2 log ( p 0 / p 1 ) ] = p 0 − p 1 = 1 − 2 p 1 \tanh \left[\frac{1}{2} \log \left(p_0 / p_1\right)\right]=p_0-p_1=1-2 p_1 tanh[21log(p0/p1)]=p0−p1=1−2p1,考虑公式(2)可转化为 tanh ( 1 2 L ( r j i ) ) = ∏ i ′ ∈ V j \ i tanh ( 1 2 L ( q i ′ j ) ) \tanh \left(\frac{1}{2} L\left(r_{j i}\right)\right)=\prod_{i^{\prime} \in V_j \backslash i} \tanh \left(\frac{1}{2} L\left(q_{i^{\prime} j}\right)\right) tanh(21L(rji))=i′∈Vj\i∏tanh(21L(qi′j))
想要简化tanh函数,首先将 L ( q i j ) L\left(q_{i j}\right) L(qij)分解成符号函数 α i j = sign [ L ( q i j ) ] \alpha_{i j} =\operatorname{sign}\left[L\left(q_{i j}\right)\right] αij=sign[L(qij)]*绝对值 β i j = ∣ L ( q i j ) ∣ \beta_{i j} =\left|L\left(q_{i j}\right)\right| βij=∣L(qij)∣的形式: L ( q i j ) = α i j β i j L\left(q_{i j}\right) =\alpha_{i j} \beta_{i j} L(qij)=αijβij进而将公式(2)转化为: tanh ( 1 2 L ( r j i ) ) = ∏ i ′ ∈ V j \ i α i ′ j ⋅ ∏ i ′ ∈ V j \ i tanh ( 1 2 β i ′ j ) \tanh \left(\frac{1}{2} L\left(r_{j i}\right)\right)=\prod_{i^{\prime} \in V_j \backslash i} \alpha_{i^{\prime} j} \cdot \prod_{i^{\prime} \in V_j \backslash i} \tanh \left(\frac{1}{2} \beta_{i^{\prime} j}\right) tanh(21L(rji))=i′∈Vj\i∏αi′j⋅i′∈Vj\i∏tanh(21βi′j)LLR代入后化简得到公式(4): L ( r j i ) = ∏ i ′ α i ′ j ⋅ 2 tanh − 1 ( ∏ i ′ tanh ( 1 2 β i ′ j ) ) = ∏ i ′ α i ′ j ⋅ 2 tanh − 1 log − 1 log ( ∏ i ′ tanh ( 1 2 β i ′ j ) ) = ∏ i ′ α i ′ j ⋅ 2 tanh − 1 log − 1 ∑ i ′ log ( tanh ( 1 2 β i ′ j ) ) = ∏ i ′ ∈ V j \ i α i ′ j ⋅ ϕ ( ∑ i ′ ∈ V j \ i ϕ ( β i ′ j ) )L(rji)=i′∏αi′j⋅2tanh−1(i′∏tanh(21βi′j))=i′∏αi′j⋅2tanh−1log−1log(i′∏tanh(21βi′j))=i′∏αi′j⋅2tanh−1log−1i′∑log(tanh(21βi′j))=i′∈Vj\i∏αi′j⋅ϕ i′∈Vj\i∑ϕ(βi′j) 其中, ϕ ( x ) = − log [ tanh ( x / 2 ) ] = log ( e x + 1 e x − 1 ) \phi(x)=-\log [\tanh (x / 2)]=\log \left(\frac{e^x+1}{e^x-1}\right) ϕ(x)=−log[tanh(x/2)]=log(ex−1ex+1)L(rji)=∏i′αi′j⋅2tanh−1(∏i′tanh(12βi′j))=∏i′αi′j⋅2tanh−1log−1log(∏i′tanh(12βi′j))=∏i′αi′j⋅2tanh−1log−1∑i′log(tanh(12βi′j))=∏i′∈Vj∖iαi′j⋅ϕ⎛⎝∑i′∈Vj∖iϕ(βi′j)⎞⎠ ϕ ( x ) \phi(x) ϕ(x)函数性质: ϕ − 1 ( x ) = ϕ ( x ) \phi^{-1}(x)=\phi(x) ϕ−1(x)=ϕ(x) when x > 0 x>0 x>0
该特性能够简化计算,或者更直接的,The function may be implemented by a look-up table.
Step2将公式(1)转化为公式(3): L ( q i j ) = L ( c i ) + ∑ j ′ ∈ C i \ j L ( r j ′ i ) . L\left(q_{i j}\right)=L\left(c_i\right)+\sum_{j^{\prime} \in C_i \backslash j} L\left(r_{j^{\prime} i}\right) . L(qij)=L(ci)+j′∈Ci\j∑L(rj′i).
step3转化为公式(5): L ( Q i ) = L ( c i ) + ∑ j ∈ C i L ( r j i ) . L\left(Q_i\right)=L\left(c_i\right)+\sum_{j \in C_i} L\left(r_{j i}\right) . L(Qi)=L(ci)+j∈Ci∑L(rji).
总结:
与概率域 SPA 算法相比,对数域 SPA 算法的复杂度更低,数值更稳定。Min-Sum Decoder是复杂度更低的解码器,在性能方面通常只受到一点影响,性能上通常约弱 0.5dB。
Min-Sum Decoder的思想是信息在节点之间传递时,只需进行最小值的计算:
ϕ
(
∑
i
′
ϕ
(
β
i
′
j
)
)
≃
ϕ
(
ϕ
(
min
i
′
β
i
′
j
)
)
=
min
i
′
∈
V
j
\
i
β
i
′
j
.
此时,step2的更新公式转化为:
L
(
r
j
i
)
=
∏
i
′
∈
V
j
\
i
α
i
′
j
⋅
min
i
′
∈
V
j
\
i
β
i
′
j
.
L\left(r_{j i}\right)=\prod_{i^{\prime} \in V_j \backslash i} \alpha_{i^{\prime} j} \cdot \min _{i^{\prime} \in V_j \backslash i} \beta_{i^{\prime} j} .
L(rji)=i′∈Vj\i∏αi′j⋅i′∈Vj\iminβi′j.
注意:在 BI-AWGNC 情况下,当采用最小和算法时,初始化
L
(
q
i
j
)
=
2
y
i
/
σ
2
L\left(q_{i j}\right)=2 y_i / \sigma^2
L(qij)=2yi/σ2 可以替换为
L
(
q
i
j
)
=
y
i
L\left(q_{i j} \right)=y_i
L(qij)=yi。 优点是在这种情况下不需要知道噪声功率
σ
2
\sigma^2
σ2。
min-sum变体1:Normalized Min-Sum Decoding
L ( r j i ) = (系数 α ) ∏ i ′ ∈ V j \ i α i ′ j ⋅ min i ′ ∈ V j \ i β i ′ j . L\left(r_{j i}\right)=(系数\alpha)\prod_{i^{\prime} \in V_j \backslash i} \alpha_{i^{\prime} j} \cdot \min _{i^{\prime} \in V_j \backslash i} \beta_{i^{\prime} j} . L(rji)=(系数α)i′∈Vj\i∏αi′j⋅i′∈Vj\iminβi′j., α ∈ ( 0 , 1 ] \alpha \in (0,1] α∈(0,1]
min-sum变体2:Offset Min-Sum Decoding
L ( r j i ) = ∏ i ′ ∈ V j \ i α i ′ j ⋅ ( min i ′ ∈ V j \ i β i ′ j − 系数 β ) . L\left(r_{j i}\right)=\prod_{i^{\prime} \in V_j \backslash i} \alpha_{i^{\prime} j} \cdot (\min _{i^{\prime} \in V_j \backslash i} \beta_{i^{\prime} j}- 系数\beta). L(rji)=i′∈Vj\i∏αi′j⋅(i′∈Vj\iminβi′j−系数β).,其中 β ≥ 0 \beta \geq 0 β≥0
在长码LDPC情况下,2304bit+200次迭代次数
短块长度LDPC 码的性能存在译码的有限长度效应,导致 error floors 的出现。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。