核范数为什么能够作为矩阵秩的凸替换、核范数如何应用到张量中从而进行张量秩的约束_张量的核范数

作者：Monodyee | 2024-03-01 19:16:57

踩

张量的核范数

对于经典的低秩矩阵补全优化问题:
$\begin{aligned} min_{X} : r a n k (X) \\ s . t . : X_{Ω} = M_{Ω} \end{aligned}$
$(1)$ 中的优化问题是非凸的,因为 $r ank (X)$ 是非凸函数
- 一种常见的方法是采用核范数来近似矩阵的秩，核范数被证明是在一定意义下，rank的最佳凸估计/凸松弛[1]
- 进而可以将 $(1)$ 中的问题转变成以下的矩阵补全的凸优化问题:
  $\begin{aligned} min_{X} : ‖ X ‖_{*} \\ s . t . : X_{Ω} = M_{Ω} \end{aligned}$
- 张量是矩阵概念的推广。通过求解以下优化问题，可以将矩阵情况下的补全算法推广到高阶张量：
  $\begin{aligned} min_{X} : ‖ X ‖_{*} \\ s . t . : X_{Ω} = T_{Ω} \end{aligned}$
- 第一个问题是一般张量情况下的核范数的定义。[2]提出了以下关于张量迹范数的定义：
  $\begin{aligned} min_{X} : \sum_{i = 1}^{n} α_{i} ‖ X_{(i)} ‖_{*} \\ s . t . : X_{Ω} = T_{Ω} \end{aligned}$
- 这里有人可能会问，为什么不把张量核范数定义为张量秩的凸包络。与矩阵不同，计算一般张量（阶数> 2）的秩是一个NP困难问题[3]。此外，据所知[2]，张量秩的凸包络并没有显式的表达式。

2、a simple low rank tensor completion algorithm(SiLRTC)

$(4)$ 中的问题由于不同矩阵核范数项相互依赖而难以解决，即当优化多个矩阵核范数的和时，矩阵共享相同的元素，不能够独立优化。所以需要首先分离变量，然后再独立的进行求解。因此引入 $M_1,...,M_n$ ,然后将 $(4)$ 转换成如下方案:
$\begin{aligned} min_{X} : \sum_{i = 1}^{n} α_{i} ‖ M_{(i)} ‖_{*} \\ s . t . : X_{(i)} = M_{i} f o r i = 1, . . ., n \\ X_{Ω} = T_{Ω} . \end{aligned}$
在上述方案中,核范数仍然不是独立的,因为 $M_i=\mathcal{X}_{(i)}$ ，导致矩阵 $M_i$ 共享相同的元素。可以放宽等式约束，即用 $\|M_i-\mathcal{X}_{(i)}\|_F^2 < d_i$ 替换 $\mathcal{X}_{(i)}=M_i$ :
$\begin{aligned} min_{X} : \sum_{i = 1}^{n} α_{i} ‖ M_{(i)} ‖_{*} \\ s . t . : ‖ M_{i} - X_{(i)} ‖_{F}^{2} < d_{i} f o r i = 1, . . ., n \\ X_{Ω} = T_{Ω} . \end{aligned}$
$d_i$ 是一个可以由用户定义的阈值，进一步可以将不等式约束转换成等式约束。
$\begin{aligned} min_{X} : \sum_{i = 1}^{n} α_{i} ‖ M_{(i)} ‖_{*} + \frac{β_{i}}{2} ‖ M_{i} - X_{(i)} ‖_{F}^{2} \\ s . t . X_{Ω} = T_{Ω} . \end{aligned}$
这是一个凸但不可微的优化问题。
对于上述问题采用块坐标下降法进行优化(块坐标下降的基本思想是在固定其他组变量时，进而优化剩余变量组)，将 $(4)$ 中的变量分为 $\mathcal{X},M_1,M_2,\cdots,M_n$ .
- 计算 $\mathcal{X}$ :当固定其他变量时，即需要解决以下问题:
  $\begin{aligned} min_{X} : \sum_{i = 1}^{n} \frac{β_{i}}{2} ‖ M_{i} - X_{(i)} ‖_{F}^{2} \\ s . t . : X_{Ω} = T_{Ω} . \end{aligned}$
  $(7)$ 问题求解结果为:
  ${\begin{cases} (\frac{\sum_{i} β_{i} f o l d_{i} (M_{i})}{\sum_{i} β_{i}})_{i_{1}, \dots, i_{n}} & (i_{1}, \dots, i_{n}) \notin Ω \\ T_{i_{1}, \dots, i_{n}} & (i_{1}, \dots, i_{n}) \in Ω \end{cases}$
- 计算 $M_i$ . $M_i$ 是以下形式的最优解:
  $\begin{aligned} min_{M_{i}} & : \frac{β_{i}}{2} ‖ M_{i} - X_{(i)} ‖_{F}^{2} + α_{i} ‖ M_{i} ‖_{*} \\ \equiv \frac{1}{2} ‖ M_{i} - X_{(i)} ‖_{F}^{2} + \frac{α_{i}}{β_{i}} ‖ M_{i} ‖_{*} \end{aligned}$
  $(8)$ 问题的最优解 $M_i$ 可以直接通过计算 $D_{\tau}(\mathcal{X}_{(i)})$ ,其中 $\tau=\frac{\alpha_i}{\beta_i} (SVT:奇异值阈值算法)[4]$

3、a high accuracy low rank tensor completion algorithm(HaLRTC)

采用 $\text{ADMM}$ 算法，基于 $\text{SiLRTC}$ 算法，并在此基础上给出了一个使用 $\text{ADMM}$ 框架的简单实现。在算法 $\text{SiLRTC}$ 中引入了 $M_1,...,M_n$ ，是作为 $\mathcal{X}_{(i)}$ 的替代。此处仍采用这种方式，但是采用的是 $\mathcal{M}_i$ 代替 $\mathcal{X}$ .目标函数如下:

\begin{aligned} min_{X, M_{1}, \dots, M_{n}} & : \sum_{i = 1}^{n} α_{i} ‖ M_{i (i)} ‖_{*} \\ s . t . & : X_{Ω} = T_{Ω} \\ X = M_{i}, i = 1, \dots, n . \end{aligned}

$\begin{aligned} \min_{\mathcal{X,M_1,\cdots,M_n}} &:\sum_{i=1}^{n} \alpha_i \|\mathcal{M}_{i(i)} \|_* \\ s.t. &:\mathcal{X_{\Omega}=T_{\Omega}} \\ & \mathcal{X}=\mathcal{M_i},~ i=1,\dots,n. \end{aligned}$ \tag{10}

X, M_{1}, \dots, M_{n} min s . t . : i = 1 \sum n α_{i} ∥ M_{i (i)} ∥_{*} : X_{Ω} = T_{Ω} X = M_{i}, i = 1, \dots, n . (10)

将增广拉格朗日函数定义如下：
$\begin{aligned} L_{ρ} (X, M_{1}, \dots, M_{n}, Y_{1}, \dots, Y_{n}) \\ = \sum_{i = 1}^{n} α_{i} ‖ M_{i (i)} ‖_{*} + < X - M_{i}, Y_{i} > + \frac{ρ}{2} ‖ M_{i} - X ‖_{F}^{2} \end{aligned}$
计算 $\mathcal{M_i,X,Y_i}$ 分别求解下列三个函数即可:
- $\{\mathcal{M}_1^{k+1},\dots,\mathcal{M}_1^{k+1}\} =\argmin_{\mathcal{M_1},\dots,\mathcal{M_n}}: L_{\rho}(\mathcal{X^k,M_1,\dots,M_n,Y_1^{k+1},\dots,Y_n^{k+1}})$
- $\mathcal{X}^{k+1} =\argmin_{\mathcal{X} \in Q}: L_{\rho}(\mathcal{X,M_1^{k+1},\dots,M_n^{k+1},Y_1^{k+1},\dots,Y_n^{k+1}})$
- $\mathcal{Y}_i^{k+1} = \mathcal{Y}_i^{k} - \rho(\mathcal{M}_i^{k+1} - \mathcal{X}^{k+1})$
- 更新 $\mathcal{M}_{i}$ :
  可以写出 $\mathcal{M}_i$ 的目标函数 $f(\mathcal{M}_i) =\alpha_i \|\mathcal{M}_{i(i)} \|_* + <\mathcal{X-M_i},\mathcal{Y}_i> + \frac{\rho}{2} \|\mathcal{M_i - X}\|_F^2$
  对上述目标函数进行求导 $(\alpha_i \|\mathcal{M}_{i(i)} \|_*)^{'} - \mathcal{Y}_i + \rho (\mathcal{M}_i - \mathcal{X})$
  然后对上述导数求积分形式为: $f(\mathcal{M}_i)=\alpha_i \|\mathcal{M}_{i(i)} \|_* + \frac{\rho}{2} \|\mathcal{M}_i - \mathcal{X} - \frac{1}{\rho} \mathcal{Y}_i \|_F^2 + C_{M_i}$
  上述目标函数可以采用 $\text{SVT}$ 进行求解，结果为:
  $\mathcal{M}_i = fold_i[D_{\frac{\alpha_i}{\rho}}(\mathcal{X_{(i)} + \frac{1}{\rho} \mathcal{Y}_{i(i)} })]$
- 更新 $\mathcal{X}$ :
  可以写出 $\mathcal{X}$ 的目标函 $f(\mathcal{X}) = \sum_{i=1}^{n} \alpha_i \|\mathcal{M}_{i(i)} \|_* + <\mathcal{X-M_i},\mathcal{Y}_i> + \frac{\rho}{2} \|\mathcal{M_i - X}\|_F^2$
  对上述目标函数进行求导: $\sum_{i=1}^{n}\mathcal{Y}_i + \rho(\mathcal{X}-\mathcal{M}_i)$
  令其等于零即可: $\mathcal{X}_{\Omega} = \frac{1}{n} (\sum_{i=1}^n \mathcal{M}_i - \frac{1}{\rho}\mathcal{Y}_i)$
- 更新 $\mathcal{Y}_i$ : $\mathcal{Y}_i = \mathcal{Y}_i - \rho(\mathcal{M}_i-\mathcal{X})$

参考文献

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/Monodyee/article/detail/176282

核范数为什么能够作为矩阵秩的凸替换 、 核范数如何应用到张量中从而进行张量秩的约束_张量的核范数

2、a simple low rank tensor completion algorithm(SiLRTC)

3、a high accuracy low rank tensor completion algorithm(HaLRTC)

参考文献

核范数为什么能够作为矩阵秩的凸替换、核范数如何应用到张量中从而进行张量秩的约束_张量的核范数