赞
踩
题目:用于全幻灯片图像的多示例学习可微缩放 (Differentiable zooming for multiple instance learning on whole-slide images)
背景:多示例学习 (MIL) 在数字病理学中对十亿像素级的全幻灯片图像 (WSI) 分类变得愈发流行
问题:
方法:受病理学诊断过程的启发,提出了ZoomMIL
,其以端到端的方式学习且执行多级缩放,即汇聚多级尺度上的组织-上下文信息为多个WSI表示
https://github.com/histocartography/zoommil
@inproceedings{Thandiackal:2022:699715,
authorq = {Kevin Thandiackal and Bo Qi Chen and Pushpak Pati and Guillaume Jaume and Drew FK Williamson and Maria Gabrani and Orcun Goksel},
title = {Differentiable zooming for multiple instance learning on whole-slide images},
booktitle = {{ECCV}},
pages = {699--715},
year = {2022}
url = {https://doi.org/10.1007/978-3-031-19803-8_41}
}
详情参见GAMIL中的门控注意力。
假设WSI在不同缩放下是可评估的,以 m ∈ { 1 , 2 , … , M } m\in\{ 1,2,\dots, M \} m∈{1,2,…,M}为索引,其中 M M M表示最大的缩放尺度。与特征金字塔类似,假设 m + 1 m+1 m+1处的放大倍数是 m m m处的两倍。为了高效地将MIL扩展到多级缩放,本文将从低到高倍率放大以分级鉴别高信息区块,并汇聚为最终的WSI表示:
与已有通过预处理获得多级缩放的方法不同,本文通过分类器 f ( ⋅ ) f(\cdot) f(⋅)的预测结果在第 m m m步直接选择区块。该过程不需要任何的损失或者额外的超参数。然后,由于top- K K K操作,该方法是不可导的。对此,扰动最大方法 (Perturbed maximum method) 被使用:
为了实验缩放目标,我们将索引矩阵
T
m
\mathbf{T}_m
Tm进行扩充,以选择区块特征
H
m
′
∈
R
N
⋅
4
(
m
′
−
1
)
×
D
\mathbf{H}_{m'}\in\mathbf{R}^{N\cdot4^{(m'-1)\times D}}
Hm′∈RN⋅4(m′−1)×D,其中
m
′
>
m
m'>m
m′>m。特别地,计算
T
m
\mathbf{T}_m
Tm和单位矩阵
1
m
′
=
diag
(
1
,
…
,
1
)
∈
R
4
(
m
′
−
1
)
×
4
(
m
′
−
1
)
1_{m'}=\text{diag}(1,\dots,1)\in\mathbb{R}^{4^{(m'-1)}\times4^{(m'-1)}}
1m′=diag(1,…,1)∈R4(m′−1)×4(m′−1)的Kronecker内积来获得索引矩阵
T
m
′
∈
{
0
,
1
}
N
⋅
4
(
m
′
−
1
)
×
K
⋅
4
(
m
′
−
1
)
\mathbf{T}_{m'}\in\{0,1\}^{N\cdot4^{(m'-1)}\times K\cdot4^{(m'-1)}}
Tm′∈{0,1}N⋅4(m′−1)×K⋅4(m′−1)。与公式3类似,在更高放大倍率
m
′
m'
m′使用注意力权重的区块选择可以计算为:
H
~
m
′
=
(
T
m
⊗
1
m
′
)
⊤
H
m
′
.
(6)
\tag{6} \tilde{\mathbf{H}}_{m'}=(\mathbf{T}_m\otimes1_{m'})^\top\mathbf{H}_{m'}.
H~m′=(Tm⊗1m′)⊤Hm′.(6)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。