当前位置:   article > 正文

CLOCS:跨空间、时间和患者的心脏信号对比学习_chapman数据集

chapman数据集

医疗行业产生了大量未标记的生理数据。这些数据可以通过对比学习加以利用。对比学习是一种自监督的预训练方法,鼓励实例表示之间的彼此相似。我们提出了一系列对比学习方法,即CLOCS,鼓励跨空间、时间和患者的表示彼此相似。我们发现,当对下游任务进行线性评估和微调时,CLOCS的性能始终优于SOTA方法BYOL和SimCLR。我们还发现,在只有25%的标记训练数据的情况下,CLOCS实现了较强的泛化性能。此外,我们的训练过程自然地产生了特定患者的表示,可用于量化患者的相似度。

图1. ECG(心电图)记录反映了时间和空间信息。这是因为他们在一段时间内使用不同的leads(导联)来测量心电活动。时间不变性:心电图记录不太可能在几秒钟内发生突然变化,因此持续时间较短的相邻段将继续共享上下文。空间不变性:来自不同导联的记录反映的是相同的心脏功能,从而共享上下文。

图2. 对比多段编码(CMSC)、对比多导联编码(CMLC)、对比多段多导联编码(CMSMLC)的小批量相似矩阵。为了识别阳性配对,我们将每个实例与其患者ID关联起来。通过设计,对角线元素(绿色)对应于同一患者。类似地,实例1和50(黄色)属于同一患者。蓝色区域对应于阴性示例,因为它们来自不同患者。

图3. 应用于SimCLR和CMSC的单次(蓝色)和顺序(绿色)扰动对线性评估的影响。我们使用4个导联在PhysioNet 2020数据集上进行了预训练和评估。我们发现,无论施加何种扰动,CMSC都优于SimCLR。

表1. 在Chapman或PhysioNet 2020数据集上进行预训练后,表示的线性评估的测试AUC。粗体表示性能最好的方法。

表2. 在Chapman或PhysioNet 2020数据集上进行预训练后,F=0:5微调的测试AUC。我们发现,CMSC或CMSMLC的表现优于BYOL和SimCLR。

图4. 随机初始化或通过CMSC初始化并且暴露于不同数量训练数据的网络的验证AUC。阴影部分表示一个标准差。我们发现,使用CMSC初始化并暴露于较少数据(F<1)的网络优于随机初始化并暴露于所有数据(F=1)的网络。

图5. 在Chapman数据集上预训练并且在Cardiology数据集上微调时,嵌入维度和标记分数对测试AUC的影响。误差条表示一个标准差。

图6. 同一患者(Intra-Patient)的表示与不同患者(Inter-Patient)的表示之间的成对欧氏距离分布。与SimCLR相比,使用CMSC的同一患者平均距离较低,两种分布之间的可分性也有所改善。

总结与展望

在本文中,我们提出了一系列基于生理信号对比学习的自监督预训练机制,称为CLOCS。我们鼓励跨空间、时间和患者的表示彼此相似。我们发现,在对下游任务进行线性评估和微调时,我们的方法优于SOTA方法BYOL和SimCLR。在施加干扰,以及使用不同数量的导联进行预训练和评估时,这一结论依然成立。未来几个值得探索的方向如下:

量化患者相似度。我们已经学习了特定患者的表示。这些表示可用于量化患者的相似度,以协助诊断或更好地了解医疗状况。可以通过比较已知的相似患者来验证这些表示。

多模态迁移。我们将参数从一个任务迁移到另一个具有相同输入模态(ECG)的任务。这些数据不一定总能用于自监督学习。一个有趣的探索方向是一种模态的对比自监督学习能否很好地迁移到另一种模态。

多模态对比学习。我们利用单模态ECG的时间和空间不变性来进行对比学习。然而,我们也设想CLOCS应用于其他模态(如心脏超声、脑MRI和ICU生命数据)。例如,随时间记录的血氧饱和度和呼吸频率可解释为同一生理现象的两个空间“视图”,因此可以被CMLC利用。此外,ECG信号通常与其他模态一起记录,如光电容积图(PPG)。一种潜在的方法是利用时间对齐的ECG和PPG的表示进行多模态对比学习。

原文:

Kiyasseh D, Zhu T, Clifton D A. Clocs: Contrastive learning of cardiac signals across space, time, and patients[C]//International Conference on Machine Learning. PMLR, 2021: 5606-5615.

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/787300
推荐阅读
相关标签
  

闽ICP备14008679号