当前位置:   article > 正文

【医学AI顶刊·05-21速递】单细胞|免疫分析|肠道菌群|主流算法性能比较|GPT4辅助论文撰写

【医学AI顶刊·05-21速递】单细胞|免疫分析|肠道菌群|主流算法性能比较|GPT4辅助论文撰写

小罗碎碎念

大家早上好!!欢迎查收小罗2024-05-21整理的医学AI最新顶刊速递,文献目录如下:

image-20240521070714229

今天推荐的文章都很有意思,基本上覆盖了当下的研究热点,临床方面可以了解单细胞、免疫分析以及肠道菌群的最新进展,医工结合方面可以了解主流的模型在9种数据集上的比较,尤其适合目前还在挑选算法的老师和同学,周末我也会仔细分析这一篇,敬请关注。

另外,最后一篇文章明确提到了,论文的撰写使用了GPT4,大家可以拿到原文,仔细读一读,看效果如何,如果还不错的话,自己也可以用起来,哈哈。


交流群

欢迎大家来到【医学AI】交流群,本群设立的初衷是提供交流平台,方便大家后续课题合作。

公众号发表的文章会分享到群里,学术会议和比赛也会不定期分享,欢迎组队参与和线下交流!!

最后再介绍一下小罗自己:课题组位于广州,专业方向是医学人工智能,研究内容主要是病理组学,目前已借助自媒体与华盛顿大学北大北航华科北科南方医等院校的课题组建立了联系,欢迎更多的人加入我们的队伍!!

image-20240521071119810


一、跨物种细胞对话:单细胞图谱揭示生命演化的秘密

image-20240521071211809

文献概述

这篇文章是关于单细胞数据分析的未来发展,特别是使用参考图谱映射技术的快速自动化分析。文章由Mohammad Lotfollahi、Yuhan Hao、Fabian J. Theis和Rahul Satija撰写,发表在《Cell》上。

摘要

随着单细胞数据集的快速增长,将新数据映射到经过良好整理的参考图谱上的工作流程,为生物学界提供了巨大的应用前景。

文章讨论了单细胞参考映射算法的关键计算挑战和机遇,并预测这种映射算法将促进跨疾病状态、分子模式、遗传扰动和不同物种的多样化数据集的整合,并最终取代手动和劳动密集型的无监督聚类流程。

引言

参考数据集和映射算法正在改变单细胞测序数据集的分析工作流程,类似于人类基因组图谱的构建所带来的趋势。基于参考的分析将数据解释从无监督领域转移到有监督领域,使得多个先前实验积累的信息能够帮助解释新数据。

参考映射工作流程

文章讨论了将新生成的生物“查询”数据映射到经过策划的参考图谱的概念,以及如何通过参考映射工作流程支持广泛的应用,包括疾病状态的识别、跨物种和进化分析,以及包含细胞位置和形态信息的空间分辨数据集。

疾病状态的识别

通过将疾病样本映射到健康参考图谱上,可以快速识别疾病状态。成功的映射应该满足保持参考中健康细胞状态的异质性、整合参考和查询中的相同细胞类型,以及保留在疾病数据集中出现而不在参考中出现的未被表征的细胞类型和状态。

人群规模的参考映射

参考映射方法对于分析和探索样本人群之间的大规模变异也具有重要的潜力,类似于人类变异的大型遗传数据库,如gnomAD。

构建细胞扰动图谱

单细胞健康图谱正在通过诸如人类细胞图谱等联盟变得越来越可用。然而,针对药物发现和再生医学的大型规模扰动实验,被称为“扰动图谱”,代表了一个新的前沿领域。

单细胞数据在分子模式间的映射

尽管上述技术侧重于将scRNA-seq查询数据集映射到scRNA-seq参考图谱上,但单细胞基因组学领域正在迅速过渡到常规地分析其他分子模式。

跨物种映射

单细胞测序现在已经能够在“整个动物”规模上对细胞进行分子特征的表征,包括蠕虫、苍蝇、斑马鱼、青蛙、小鼠,甚至是人类胎儿。

走向基于机器学习的开源图谱

文章最后讨论了如何制作、发布和迭代更新参考图谱的问题,以及如何通过机器学习和开源工具来实现这一点。

结论

文章认为,参考映射算法将逐渐取代无监督聚类和手动注释工作流程,使单细胞分析从专家为中心和繁琐的流程转变为快速、易于访问和准确的程序。


重点关注

Figure 1 展示了使用参考图谱映射的单细胞数据自动化分析的三个主要步骤和应用:

(A) 参考基因组映射

这一步描述了如何将 RNA 或 DNA 短序列读段映射到参考基因组上。与传统的从头组装(de novo assembly)相比,使用参考映射器(reference mappers)是一种计算成本较低的替代方法。这种方法简化了分析流程,因为它允许研究人员利用现有的参考基因组,而不是每次都重新组装基因组。

image-20240521071624673

(B) 单细胞参考图谱的组装

这一部分强调了单细胞参考图谱的创建,类似于参考基因组的概念。通过创建这样的参考图谱,可以自动化地分析新生成的查询数据集。通过将查询数据映射到参考图谱中,可以快速地进行数据分析和解释。这种方法提高了效率,因为它允许重复使用经过精心策划的参考数据,而不是对每个新的数据集都进行单独的处理。

image-20240521071646975

© 单细胞参考映射的应用

这一部分展示了单细胞参考映射的三个主要应用领域:

  1. 自动化细胞类型注释:使用参考图谱可以自动识别和注释查询数据中的细胞类型,这减少了手动分类和注释的工作量。
  2. 分析单细胞扰动:参考图谱可以用于分析疾病状态或其他扰动对单细胞的影响,以及在查询数据中推断缺失的扰动信息。
  3. 连续信息的填充:对于 scRNA-seq 数据,可以使用空间图谱来推断细胞的空间位置;对于多模态参考,包括 scRNA-seq 和 scATAC-seq,可以推断细胞的染色质可及性。这有助于提供更全面的细胞特性描述。

image-20240521071722047


在人群规模上的参考映射如何工作,以及它如何帮助理解和分析大规模的单细胞数据集。

image-20240521071827668

以下是对图中各个部分的详细解释:

(A) 人群水平的单细胞参考图谱的可用性

这一部分强调了拥有人群水平的单细胞参考图谱的重要性。这样的参考图谱允许研究人员收集和分析来自多个样本或患者的数据,从而能够学习和理解不同人群和细胞之间的异质性。

(B) 学习人群和细胞间的异质性

延续 (A) 的概念,(B) 部分进一步说明了如何利用这些参考图谱来理解不同人群之间以及细胞内部的多样性和差异性。这对于研究疾病如何在不同人群中表现,以及不同细胞类型如何对疾病作出反应至关重要。

© 查询样本的多级映射

这一部分说明了查询样本(新的单细胞数据集)是如何被映射到细胞和样本两个层次上的。细胞层次的映射有助于识别和理解单个细胞的特性,而样本层次的映射则有助于理解整个样本或患者群体的特性。

(D) 利用细胞嵌入和监督分析对疾病表型进行分类

在这一步中,通过将新样本映射到参考图谱上,并利用细胞嵌入(一种将细胞特征编码为数学表示的方法)和监督分析(一种使用已知标签来训练模型的机器学习方法),可以对查询样本的疾病表型进行分类。例如,可以根据细胞的特性来确定肿瘤的类型。

(E) 样本层次的表示可以推断样本间的相似性

最后,(E) 部分展示了样本层次的表示如何帮助推断参考图谱和查询数据之间样本的相似性。图中的圆圈代表了查询数据中具有不同细胞组成的供体群体,这些信息在参考嵌入中得到了反映。通过这种方式,研究人员可以识别出哪些患者或样本在细胞特性上是相似的,这有助于理解疾病的亚型和患者的异质性。


Figure 3 解释了单细胞数据跨分子模式的参考映射,特别是如何建立不同数据模式之间的特征对应关系。这里介绍了两个框架:

(A) 建立跨模态特征对应关系的两个框架

  1. 特征转换(Feature conversion):这是一种将一种类型的测量转换为另一种类型的方法。例如,可以将ATAC-seq(一种表观遗传学测序技术)测得的基因体内的峰值转换为基因活性得分,这些得分与scRNA-seq(单细胞RNA测序)测量的特征集相同。通过这种方式,可以将ATAC-seq数据集映射到基于scRNA-seq的参考图谱上。

  2. 多组学桥接(Multi-omics bridge):这个框架利用同时测量多种分子模式的单细胞多组学数据集来建立不同模式之间的联系。例如,使用同时测量ATAC峰值和基因表达的数据集作为桥梁,将这两种模式的数据关联起来。

image-20240521072105798

(B) 使用单细胞多组学数据集扩展RNA参考到其他查询模式

这一部分讨论了如何利用单细胞多组学技术作为分子桥梁,将RNA参考图谱扩展到包括其他模式,如:

  • DNA甲基化(DNA met)
  • ATAC峰值
  • 表面蛋白
  • CUT&Tag(靶向切割和标记)
  • 空间数据

image-20240521072129632

这些技术包括:

  • snmC2T-seq:单核甲基化胞嘧啶、染色质可及性和转录组测序。
  • SNARE-seq:单核染色质可及性和mRNA表达测序。
  • ASAP-seq:ATAC结合选择性抗原分析的测序。
  • CITE-seq:通过测序对细胞转录组和表位进行细胞索引。
  • Paired-Tag:通过靶向切割测序并行分析单个细胞的RNA表达和DNA。
  • CUT&TagPro:带有细胞表面蛋白的单细胞靶向切割和标记。
  • SpatialCUT&Tag:空间靶向切割和标记。

通过这些方法,可以将RNA数据与其他类型的分子数据相结合,从而在单细胞水平上提供更全面的细胞状态和功能的理解。这种方法允许研究人员跨不同的数据类型进行比较和整合,从而更好地理解细胞的复杂性和异质性。


二、深度学习在前列腺癌Gleason分级和评分中的系统比较研究

image-20240521072158895

文献概述

这篇文章是关于深度学习方法在前列腺癌Gleason分级和评分中的系统比较研究。

Gleason分级系统是一种评估前列腺组织样本中细胞异常性的系统,它基于不同的Gleason模式来确定肿瘤的侵袭性。随着计算病理学的发展,出现了大量公开的数据集和算法,用于Gleason分级和评分,但目前尚无共识哪种方法最适合特定问题。

文章提供了对九个数据集上的最新训练方法(8种)的系统比较,包括:

  1. 全监督学习
  2. 弱监督学习
  3. 半监督学习
  4. 加性多实例学习
  5. 基于注意力的多实例学习
  6. 双流多实例学习
  7. TransMIL
  8. CLAM

这些数据集来自病理学研究所和公开可访问的存储库。研究结果表明,全监督学习CLAM分别是Gleason分级和评分任务的最佳方法,这为研究人员提供了根据要解决的任务和可用标签选择最佳实践的指导。

文章还讨论了数字病理学的进步,包括数字幻灯片扫描技术、软件应用和高速网络的发展,这些技术使得数字病理学能够整合到传统的工作流程中。此外,文章还探讨了使用卷积神经网络(CNNs)进行图像分析的挑战,包括需要大量标记数据以及处理高分辨率图像的需求。

最后,文章总结了不同训练方法的主要贡献,包括对Gleason分级和评分任务的最新训练方法的系统比较、在高度异构的数据源上训练最新模型、使用最大的公开可用数据集作为外部测试集进行测试,以及发现全监督学习在补丁级别分类任务中表现最佳,而MIL方法,特别是CLAM,在图像级别分类任务中表现最佳。


重点关注

本研究所使用的数据集

下表列出了每个数据集的患者数量、图像数量、是否包含像素级注释以及是否包含图像级注释。

image-20240521072639391

具体来说,表格中的数据集包括:

  • TMAZ 数据集:包含 886 名患者的 886 个组织微阵列(TMA)核心图像。
  • Gleason Challenge 数据集:未指定患者数量,包含 237 个核心图像。
  • SICAPv2 数据集:包含 95 名患者的 119 个全幻灯片图像(WSIs)。
  • Valme 数据集:包含 199 名患者的 938 个 WSIs。
  • PANDA Challenge 数据集:未指定患者数量,包含来自 2,113 名患者的 10,516 个 WSIs。
  • Diagset 数据集:未指定患者数量,包含 375 个 WSIs。
  • 子集的 TCGA-PRAD 数据集:包含 300 名患者的 300 个 WSIs。
  • Clinic 数据集:包含 43 名患者的 221 个 WSIs。
  • Puerta del Mar 数据集:包含 18 名患者的 144 个 WSIs。

注释说明:

  • “Pixel-wise annotations” 指的是对图像中每个像素或小区域的详细注释。
  • “Image-level annotations” 指的是对整个图像的总体注释,通常不涉及图像内部特定区域的细节。

全监督学习方法的工作流程图

image-20240521072852036

在这个流程中,首先从局部注释(即由病理学家精确标注的区域)中密集提取图像块(patches)。这些图像块随后被用来训练卷积神经网络(CNN)。

具体来说,全监督学习的工作流程包括以下几个步骤:

  1. 图像块提取:从包含详细注释的组织微阵列(TMA)核心或全幻灯片图像(WSI)中提取图像块。这些注释指出了图像中感兴趣的特定区域,例如癌症细胞的位置。

  2. 密集提取:图像块以密集的方式提取,意味着它们紧密地排列在一起,以覆盖所有被注释的区域。这样做可以确保捕获到病理学家认为重要的所有特征。

  3. 训练CNN:使用这些带有精确标签的图像块来训练CNN模型。每个图像块都与一个特定的类别标签相关联,例如良性(benign)、Gleason模式3(GP3)、GP4或GP5。

  4. 模型学习:CNN通过学习这些图像块的特征,学会识别和分类前列腺癌的不同Gleason模式。

  5. 评估和优化:训练过程中,模型的性能会通过验证集进行评估,以优化模型参数并防止过拟合。

全监督学习方法的优势在于它能够利用精确的像素级注释来训练模型,这通常可以导致较高的分类精度。然而,这种方法的一个限制是它需要大量的手动注释工作,这既耗时又成本高昂。因此,全监督学习可能不适用于大型数据集或那些难以获得详细注释的情况。


三种不同的弱监督学习方法及其变体的流程图

image-20240521072957419

"弱监督学习"意味着使用全局图像注释(image-level annotations)来训练模型,而不是像素级的详细注释(patch-level annotations)。下面是对这三种变体的详细解释:

  1. 变体 1(Weak supervision)

    • 在这种方法中,CNN模型仅使用带有全局注释的图像来训练。
    • 首先,从带有全局注释的图像中密集提取图像块(patches)。
    • 然后,基于蓝比率(Blue Ratio, BR)值对这些图像块进行排序,选择排名最高的图像块用于训练。
    • BR值是一个衡量图像块中细胞核密度的指标,较高的BR值意味着图像块中细胞核更密集。
    • 这种方法不使用任何像素级的注释。
  2. 变体 2(Transfer learning)

    • 这种方法采用两步训练过程。
    • 首先,模型使用带有全局注释的图像块进行训练,类似于变体 1。
    • 训练完成后,模型的权重被保留,并使用带有像素级注释的图像块进行微调(fine-tune)。
    • 微调过程旨在提高模型对特定类别的识别精度,因为像素级注释提供了更精确的区域信息。
  3. 变体 3(Combination of image-level and patch-level annotations)

    • 这种方法结合了全局注释和像素级注释的图像块来训练模型。
    • 模型同时使用从全局注释图像中提取的图像块和从局部注释图像中提取的像素级注释图像块。
    • 这种方法旨在结合两种类型的注释来提高模型的性能和泛化能力。

这三种变体的共同点在于它们都首先从带有全局注释的图像中提取图像块,但它们在如何利用这些图像块以及是否结合像素级注释方面有所不同。弱监督学习的方法可以减少对耗时且成本高昂的像素级注释的依赖,同时仍然能够训练出性能良好的模型。通过这些方法,研究者可以更有效地利用可用的数据和资源来开发深度学习模型。


半监督学习方法的工作流程图

image-20240521073126546

在这种方法中,结合了少量的标记数据(有监督学习)和大量的未标记数据(无监督学习)来提高模型的性能。下面是这个流程的详细步骤:

  1. 训练教师模型(Teacher Model)

    • 使用带有像素级注释的图像块来训练一个教师模型。
    • 这些注释提供了精确的类别信息,帮助模型学习区分不同的模式或特征。
  2. 使用教师模型进行预测

    • 教师模型被用来预测未标记图像中的图像块的类别。
    • 这些图像块是从未经注释的图像(即没有像素级注释的图像)中提取的。
  3. 生成伪标签(Pseudo-Labeling)

    • 教师模型为这些未标记的图像块生成伪标签。
    • 这些伪标签是基于模型的预测结果,虽然可能不完全准确,但可以为模型提供额外的训练数据。
  4. 训练学生模型(Student Model)

    • 学生模型使用两组数据进行训练:一组是带有真实像素级注释的图像块,另一组是带有由教师模型生成的伪标签的图像块。
    • 结合这两组数据,学生模型可以学习从标记和未标记的数据中提取特征。
  5. 模型优化

    • 通过这种方式,学生模型不仅学习了从有限的标记数据中获得的确定性信息,还从大量的未标记数据中学习到了更广泛的特征表示。
    • 这有助于提高模型的泛化能力,使其能够更好地处理新的、未见过的数据。

半监督学习的核心优势在于它能够利用未标记的数据来增强模型的学习过程,这在标记数据稀缺或成本高昂的情况下尤其有用。通过教师-学生模型的框架,这种方法有效地结合了监督学习和无监督学习的优点,提高了深度学习模型在各种任务上的性能。


基于实例的多实例学习(Instance-based Multiple Instance Learning, Instance-based MIL)方法的工作流程

image-20240521073218391

在这种学习方法中,重点是利用全局图像注释来训练模型,并在图像块(patches)级别和图像(image)级别上进行预测。以下是详细步骤:

  1. 图像块提取

    • 从带有全局注释的图像中密集提取图像块。这意味着从整个图像中提取许多小的图像块,以覆盖图像的所有区域。
  2. 选择高排名图像块

    • 基于蓝比率(Blue Ratio, BR)值对这些图像块进行排序。BR值是一个衡量图像块中细胞核密度的指标,较高的BR值表明图像块更有可能包含重要的细胞特征。
    • 选择BR值最高的图像块,因为它们被认为更有信息量,可能与疾病特征更相关。
  3. CNN预测

    • 使用卷积神经网络(CNN)对选定的图像块进行预测。CNN在每个图像块上独立地进行分类预测,生成关于图像块可能属于的类别的输出。
  4. 聚合模型

    • 实现一个聚合模型(aggregation model),它将所有图像块的预测结果汇总起来。
    • 这个聚合过程可以采用不同的策略,例如最大投票、平均分数或其他更复杂的方法,以整合来自多个图像块的信息。
  5. 报告预测结果

    • 聚合模型不仅在图像块级别上报告预测结果,还在整个图像级别上提供预测。
    • 在图像块级别上,可以识别出具体哪些区域表现出特定的特征或模式。
    • 在图像级别上,聚合模型的输出可以代表整个图像的分类结果,例如,判断整个图像是否包含某种疾病模式。

Instance-based MIL 方法的一个关键优势是它能够在两个层面上提供洞察:单个图像块的细节和整个图像的总体情况。这种方法特别适用于处理包含大量图像块的全幻灯片图像(WSIs),其中只有一部分区域可能与疾病相关。通过这种方式,Instance-based MIL 可以提高模型对病理图像的诊断能力,并有助于揭示疾病在组织中的分布和模式。


基于嵌入的多实例学习(Embedding-based Multiple Instance Learning, Embedding-based MIL)方法的工作流程

image-20240521073319350

这种方法侧重于从图像中提取特征嵌入,并通过聚合这些嵌入来做出图像级别的预测。以下是详细步骤:

  1. 图像块提取

    • 从带有全局注释的图像中密集提取图像块。这些图像块覆盖了图像的各个区域,目的是捕获组织的不同特征。
  2. 选择高排名图像块

    • 基于蓝比率(Blue Ratio, BR)值对提取的图像块进行排序。BR值是一个衡量图像块中细胞核密度的指标,有助于识别出包含重要细胞特征的图像块。
    • 选择BR值最高的图像块,因为它们更有可能包含与疾病相关的信息。
  3. CNN生成嵌入

    • 使用卷积神经网络(CNN)为每个选定的图像块生成特征嵌入。嵌入是高维空间中的点,能够捕捉图像块的关键视觉特征。
  4. 聚合模型

    • 实现一个聚合模型来整合所有图像块的特征嵌入。
    • 聚合可以采取不同的形式,例如取嵌入的平均值、加权平均或其他更复杂的函数,以生成代表整个图像的单一嵌入向量。
  5. 图像级别预测

    • 聚合模型的输出是一个综合嵌入向量,它捕捉了整个图像的全局特征。
    • 基于这个综合嵌入向量,模型对图像进行分类,生成图像级别的预测结果。

Embedding-based MIL 方法的关键优势在于它能够从多个图像块中提取丰富的局部特征,并有效地将这些局部特征整合为全局图像表示。这种方法特别适合处理大规模的全幻灯片图像(WSIs),因为它可以在整个图像范围内捕获疾病的分布和模式。

与Instance-based MIL方法相比,Embedding-based MIL不直接在图像块级别上进行预测,而是通过聚合嵌入向量来专注于图像级别的分类。这种方法在处理具有大量图像块的数据集时特别有用,因为它减少了对每个单独图像块进行分类的需要,从而可以提高计算效率并可能提高整体分类的准确性。


三、一滴血揭示癌症治疗反应·五种免疫型揭示个性化治疗路径

image-20240521073416806

文献概述

这篇文章是关于一项研究,开发了一个基于机器学习的临床免疫分析平台,利用简单的血液测试揭示个体的免疫系统状态

研究团队通过多参数流式细胞术外周血的大量RNA测序来描述免疫状态,识别并验证了五种免疫型,这些免疫型在不同的诊断中都得到了保留。这些免疫型具有反映个体疾病状态或对特定治疗反应的潜力,因此可能在临床上对癌症患者的治疗反应分层具有潜在的用途。

研究的主要亮点包括:

  1. 开发了一个基于机器学习的临床免疫分析平台。
  2. 使用多参数流式细胞术和外周血的大量RNA测序来描述免疫状态。
  3. 识别并验证了五种免疫型,这些免疫型在不同的诊断中都得到了保留。
  4. 这些免疫型可能在临床上对癌症患者的治疗反应分层具有潜在的用途。

研究团队由Daniiar Dyikanov, Aleksandr Zaitsev, Tatiana Vasileva等多位科学家组成,他们通过分析17,800个开放源代码转录组,确认了这些发现。研究结果表明,通过简单的血液测试,可以作为灵活的工具,根据系统免疫分析将癌症患者分层到治疗反应组

文章还详细讨论了人类群体在遗传和发展上的多样性,以及免疫系统如何受到老化、微生物暴露、代谢变化和慢性疾病(如癌症)等独特免疫学挑战的影响。此外,文章还探讨了免疫治疗在癌症治疗中的重要性,以及如何通过分析外周血液中的免疫细胞来为癌症患者选择合适的免疫治疗方案。


重点关注

免疫分析流程的开发:

  • 从健康捐赠者和癌症患者的外周血样本中分离出白血球(WBCs)。
  • 使用血液分析仪测量完整的血液计数。
  • 在96孔板中使用定制的抗体组对WBCs进行染色。
  • 通过多参数流式细胞术处理WBCs。
  • 手动标记的流式细胞术数据用于训练机器学习模型,以自动识别细胞群体。
  • 最后,实施了健康/癌症和免疫型分类。

image-20240521073928815

流式细胞术面板的示意图热图:

  • 热图展示了使用的标记物的一部分(x轴)和识别出的人群示例(y轴)。
  • 热图显示了通过结合不同抗体组(例如,通用、NK细胞和树突细胞)的读数生成的特定细胞类型的细胞表面标记物的标准化信号强度。
  • 图的右侧展示了使用这种策略识别的免疫细胞家族的代表性tSNE图。

image-20240521073948947

基于细胞群体的免疫状态差异:

  • 使用极坐标图展示了健康捐赠者和癌症患者之间的免疫状态差异。
  • 每个点代表外周血单核细胞(PBMCs)所有分数的0.5%,共展示了200个分数。
  • 这部分强调了通过视觉手段展示健康个体与癌症患者之间在免疫细胞群体上的显著差异。

image-20240521074015484


Figure 2 展示了健康/癌症分类器的训练和性能,它由几个部分组成:

(A) 队列描述,包括疾病细分和临床注释:

  • 队列首先被分为不同的临床组,然后进一步分为训练和验证子集,分别用于构建和评估健康/癌症分类器。

(B) UMAP分析的原始流式细胞术数据的可视化:

  • 展示了所有细胞群体(在筛选之前)的UMAP分析,队列分布基于癌症的存在与否以及年龄、诊断或治疗组。

image-20240521074148617

© 火山图:

  • 火山图显示了健康捐赠者和癌症患者之间20种差异表达的细胞群体,这些细胞群体是使用MRMR算法选择的,用于构建二元健康/癌症分类器(Mann-Whitney U检验与Bonferroni校正,见表S5)。
  • 两组气泡图显示了不同年龄组(以45岁为界分为“老年”和“年轻”)之间以及健康捐赠者和癌症患者之间这些细胞群体的对数倍变化(效应大小)和统计显著性差异。

image-20240521074213323

(D) 细胞群体的分布:

  • 展示了健康捐赠者和癌症患者之间naive CD4+ T细胞、未转换记忆B细胞、CX3CR1neg CD8+ TEMRA细胞和单核细胞群体的分布。
  • 使用Mann-Whitney U检验并调整Bonferroni校正方法:p < 0.0001。
  • 箱线图表示中位数和第25百分位数和第75百分位数,须线延伸至1.53四分位距内的最低和最高值。

image-20240521074323665

(E) UMAP分析:

  • 对选定的细胞群体进行UMAP分析,比较真实标签和预测标签,展示了患者和健康个体之间的概率梯度。

(F) 健康/癌症分类器的建立:

  • 使用20种选定细胞群体的标准化百分比作为特征建立健康/癌症分类器,并与基于TBNK面板和CBC分析的主要细胞群体的基本模型进行比较。
  • 展示了该分类器在训练集(n = 503)和验证集(n = 347来自内部队列)上的性能,使用ROC-AUC指标。

image-20240521074254471


四、AI革新炎症性肠病诊断:从主观评分到精准医疗的跨越

image-20240521074354122

文献概述

这篇文章是关于人工智能(AI)在炎症性肠病(IBD)的临床实践和研究中应用的综述。文章指出,将AI集成到IBD的临床实践和研究中,有潜力彻底改变临床实践和研究。AI利用先进的算法提供IBD内窥镜和组织学的准确评估,提供疾病的精确评估、标准化评分和结果预测。此外,AI还提供了通过整合内窥镜、组织学和组学数据,向精准医疗迈进的全面内窥镜-组织学-组学方法的潜力。

文章强调,AI在IBD内窥镜和组织学中的应用,以及机器学习模型在协调内窥镜、组织学和组学技术(如基因组学、转录组学、蛋白质组学和宏基因组学)方面的作用,这种所谓的内窥镜-组织学-组学方法有望扩展IBD的精准医疗。

尽管AI在IBD的应用前景光明,但仍存在挑战,包括数据质量、标准化、可复制性、随机对照试验的稀缺性、临床实施、伦理问题、法律责任和监管问题。因此,制定标准化指南和跨学科合作,包括政策制定者和监管机构,对于解决这些挑战和推进IBD临床实践和试验中的AI至关重要。

文章还讨论了AI在IBD内窥镜检查中的应用,包括如何使用先进的算法评估疾病活动并实现图像的标准化评分。此外,AI在预测治疗反应和结果方面也显示出潜力,这可能有助于提高患者管理的质量。

在组织学方面,AI的应用包括自动化和加速组织学评分,提高诊断的准确性和重复性,并可能指导治疗决策。

最后,文章讨论了AI在临床试验中的应用,如何通过整合多种数据类型来提高临床试验结果的质量,并促进精准医疗方法的发展。


重点关注

Figure 1 在文章中提供了一个关于人工智能(AI)在炎症性肠病(IBD)内窥镜检查中潜在应用的概览。

image-20240521074541319

以下是对图1的分析:

  1. 高级内窥镜工具:图1提到了几种新的内窥镜技术,包括高清晰度的白光内窥镜(WLE)、虚拟电子染色内窥镜(VCE)、基于探针的共聚焦激光显微内窥镜(pCLE)和内细胞内窥镜。这些工具能够获取高质量的图像,对IBD的诊断和评估至关重要。

  2. 存在的挑战:尽管有先进的成像技术,但在IBD的内窥镜评估中仍然存在挑战。这些挑战包括评估的主观性、高观察者间和观察者内部的变异性,以及对专家的需求。

  3. AI的潜力:图1强调了AI在解决这些挑战中的作用。AI有潜力通过提供更客观、标准化和准确的疾病活动评估来改善IBD的内窥镜评估。

  4. 预测治疗反应和结果:AI不仅可以改善内窥镜评估,还可以准确预测治疗结果和对治疗的反应,这对于个性化治疗计划的制定至关重要。

  5. 代表性图像:图1中包括了通过VCE启用的AI(使用ResNet-50模型)、EndoBRAIN-UC和Red Density(日本宾得公司)获取的代表性图像。这些图像展示了AI在实际内窥镜图像分析中的应用。

  6. 定义和缩写:图中还定义了一些关键术语,如AI(人工智能)、ER(内窥镜缓解)、IBD(炎症性肠病)、pCLE(基于探针的共聚焦激光显微内窥镜)、VCE(虚拟电子染色内窥镜)和WLE(白光内窥镜)。


Figure 2 在文章中概述了人工智能(AI)模型在IBD(炎症性肠病)组织学中的潜在应用,并展示了AI如何增强疾病评估和预测治疗反应的能力。

image-20240521074721498

以下是对图2的分析:

  1. 组织学图像注释:组织学家首先对全切片图像(WSI)进行注释,这是卷积神经网络(CNN)进行幻灯片分割的基础。

  2. 主动学习模型:通过一个利用不确定性计算的主动学习模型,实现了标准化的数字组织注释。这有助于减轻与人工注释相关的工作负担和偏见。

  3. AI增强的组织学:AI技术被用来增强组织学评估,这可能有助于提高疾病评估的准确性,并预测IBD患者的治疗结果和反应。

  4. CNN检测中性粒细胞:图2中包括了通过CNN获得的代表性类激活图,这些图可以检测到中性粒细胞。中性粒细胞的存在通常与炎症活动有关,因此,AI在识别这些细胞方面的应用可能有助于评估IBD的炎症程度。

  5. 减少变异性:AI的应用有助于减少不同观察者之间以及同一观察者在不同时间点上的评估变异性,从而提供更一致和可靠的结果。

  6. 预测能力:AI模型不仅可以用于诊断,还可以预测疾病的发展和治疗反应,这对于个性化医疗和精准医疗具有重要意义。

  7. 定义和缩写:图2还定义了一些关键术语,包括AI(人工智能)、IBD(炎症性肠病)、CNN(卷积神经网络)和WSI(全切片图像)。


Figure 3 在文章中提供了一个关于炎症性肠病(IBD)的内窥镜-组织学-组学(endo-histo-omics)方法的示意图。

image-20240521074850681

以下是对图3的分析:

  1. 内窥镜-组织学-组学方法的三个组成部分

    • 高级内窥镜:通过虚拟电子染色内窥镜(VCE)、内细胞内窥镜(endocytoscopy)和基于探针的共聚焦激光显微内窥镜(pCLE)获取的高级内窥镜图像。
    • 组织学:展示了全切片图像(WSI)和一个针对肠道屏障蛋白的多重免疫荧光图像。
    • 组学技术:包括基因组学、转录组学和宏基因组学技术,这些技术在图3中以示意图的形式表示。
  2. AI的使能作用:图3强调了人工智能(AI)在内窥镜-组织学-组学方法中的使能作用,预示着AI在推进IBD精准医疗方面的潜力。

  3. 高级内窥镜图像:提供了通过VCE、endocytoscopy和pCLE获得的高级内窥镜图像示例,这些图像有助于在微观层面上评估肠道状况。

  4. 组织学图像:展示了WSI和多重免疫荧光图像,这些图像可以用于详细分析肠道组织的细胞和分子结构。

  5. 组学技术:组学技术可以提供关于IBD病理生理的分子层面的深入理解,包括基因表达、微生物组成和蛋白质表达。

  6. 精准医疗:内窥镜-组织学-组学方法通过整合临床、内窥镜、组织学和组学数据,有助于实现IBD的精准医疗,从而为患者提供个性化的治疗方案。

  7. 定义和缩写

    • AI:人工智能
    • Endo-histo-omics:内窥镜、组织学和组学
    • IBD:炎症性肠病
    • pCLE:基于探针的共聚焦激光显微内窥镜
    • VCE:虚拟电子染色内窥镜
    • WSI:全切片图像

总体而言,Figure 3 突出了通过结合内窥镜成像、组织学评估和组学分析,AI如何有助于提供IBD的全面诊断和治疗策略。这种方法有望改善IBD患者的治疗结果,通过精准医疗实现个性化治疗。


Figure 4 在文章中展示了人工智能(AI)如何使炎症性肠病(IBD)的精准医疗和内窥镜-组织学-组学(endo-histo-omics)方法成为可能。

image-20240521074929914

以下是对图4的分析:

  1. 综合集成:图4强调了通过AI模型将临床数据、实验室结果、内窥镜检查、组织学和组学数据综合集成的重要性。这种集成是实现IBD精准医疗的关键步骤。

  2. 精准医疗的潜力:该图指出,这种综合方法有潜力启用IBD的精准医疗,这可能彻底改变患者的治疗和管理方式。

  3. 患者档案革新:AI的应用可以革新患者的档案创建,通过分析大量数据,为每位患者提供更详细、个性化的医疗档案。

  4. 早期诊断:结合AI的endo-histo-omics方法有助于早期诊断IBD,因为AI可以快速分析临床和实验室数据,及早发现疾病迹象。

  5. 新生物标志物的探索:AI可以帮助识别和验证新的生物标志物,这些标志物可能指示疾病的存在、严重程度或对治疗的反应。

  6. 预测治疗结果:AI模型可以预测患者的治疗结果,包括对特定药物的反应和疾病进展的可能性。

  7. 个性化治疗:图4强调了从一种通用治疗方法向AI辅助的个性化治疗方法的转变。这意味着治疗方案可以根据患者的具体情况进行定制。

  8. AI在IBD护理中的革命性变化:AI的使用标志着IBD护理的革命性变化,因为它允许更精确地针对每个患者的疾病特征和需求。

  9. 定义和缩写

    • AI:人工智能
    • Endo-histo-omics:内窥镜、组织学和组学
    • IBD:炎症性肠病

五、肠道微生物群:乳腺癌治疗的新希望?

image-20240521075014269

文献概述

这篇文章是一项关于肠道微生物群癌症(特别是乳腺癌)之间关系的研究。研究团队使用机器学习方法分析了乳腺癌结直肠癌胃癌患者肠道微生物群,以识别它们共享的代谢途径以及这些途径在癌症发展中的重要性

基于与肠道微生物群相关的代谢途径、人类基因表达谱和患者预后,研究者建立了一个新的乳腺癌亚型系统,并识别出了一个称为“具有挑战性的乳腺癌”的亚型。这种亚型的肿瘤比其他亚型具有更多的基因突变和更复杂的免疫环境。研究者提出了一个评分指数,用于深入分析,并发现它与患者预后呈显著负相关

特别是,TPK1-FOXP3介导的Hedgehog信号通路和TPK1-ITGAE介导的mTOR信号通路的激活与评分高的“具有挑战性的乳腺癌”患者的不良预后相关,这在患者衍生的异种移植(PDX)模型中得到了验证。

此外,研究者的亚型系统和评分指数是当前新辅助疗法方案反应的有效预测因子,评分指数与治疗效果和免疫细胞数量显著负相关。因此,研究结果为预测“具有挑战性的乳腺癌”患者的分子特征和治疗反应提供了宝贵的见解。

文章还讨论了肠道微生物群在不同癌症中的作用,以及它们如何通过共同的代谢物和途径影响各种疾病。研究者指出,尽管不同类型的肿瘤表现出不同的微生物组成,但它们在36条代谢途径上有保守的影响,暗示这些共享的代谢途径可能在肿瘤发展中起重要作用。

研究者进一步通过单细胞表达图谱和空间转录组测序数据,探索了与“具有挑战性的乳腺癌”预后相关的免疫细胞,并发现特定的免疫细胞群体与此亚型的预后相关。此外,研究还利用PDX模型验证了通过评分指数识别出的与不良预后相关的免疫信号通路,并发现使用针对这些信号通路的抑制剂能显著抑制肿瘤生长。

最后,文章强调了这项研究的创新性,即首次为乳腺癌建立了一个综合考虑肠道微生物群、人类基因表达和患者预后的亚型系统,并提出了一个新的与患者预后相关的评分指数,这有助于识别“具有挑战性的乳腺癌”病例并预测乳腺癌患者的治疗反应。研究者还指出,尽管这项研究有其局限性,但其方法的普适性意味着它可能适用于其他类型的癌症,为癌症治疗提供了宝贵的见解。


重点关注

Fig. 1 展示了基于机器学习对大肠癌(CRC)、胃癌(GC)和乳腺癌(BC)患者的肠道微生物群特征和聚类分析的结果。

以下是对图各部分的分析:

(A) 流程图概述了肠道微生物群分析的步骤,包括样本收集、DNA提取、测序以及数据分析等关键步骤。

image-20240521075403020

(B-D) 这三个子图强调了在CRC、GC和BC患者中显著不同的细菌属的重要性。"Up"表示在癌症中显著上调的基因,而"Down"表示显著下调的基因。这表明了某些细菌属在癌症发展中的潜在作用,其中一些可能促进癌症发展,而另一些可能抑制。

image-20240521075428519

(E-G) 通过自组织映射(SOM)方法对CRC、GC和BC样本进行了聚类。每种癌症队列被分为三个亚组,分别标记为G1、G2和G3。特定的细菌属,如Fusobacterium和Escherichia Shigella(在CRC患者中),Faecalibacterium和Escherichia Shigella(在GC患者中),以及Prevotella_9和Escherichia Shigella(在BC患者中)是各自癌症亚组的关键标记。这表明了不同癌症类型与特定微生物属之间的关联。

image-20240521075440366

(H) Venn图显示了三种癌症之间显著不同的细菌属的重叠情况。图中显示,三种癌症之间在细菌属层面的重叠并不广泛,几乎有一半的属是每种癌症特有的,这可能与肿瘤特异性有关。

image-20240521075452465

(I) 热图展示了三种癌症中不同亚组的微生物功能的差异性富集情况。BC队列中的微生物功能与CRC和GC队列中的相似,这表明不同癌症之间可能存在一些共同的微生物代谢途径。

image-20240521075505453


Fig. 5 展示了针对“具有挑战性的乳腺癌”(challenging BC)患者的单细胞空间转录组分析的结果。

以下是对图各部分的分析:

(A) UMAP(Uniform Manifold Approximation and Projection)图展示了四种主要肿瘤组织的细胞分布和评分变异,按注释的细胞类型和评分组进行颜色编码。这提供了一个直观的细胞分布视图,并根据评分和细胞类型进行区分。

image-20240521075604552

(B) 进一步的UMAP图和空间特征图展示了每种肿瘤组织中细胞的分布,同样按注释的细胞类型进行颜色编码。这些图表有助于理解不同细胞类型在肿瘤组织中的空间分布。

image-20240521075620098

© 条形图和空间特征图显示了选定组织切片中肿瘤细胞、TNK细胞、CD8+CCL5细胞、CD4+FOXP3细胞和CD8+CXCL13+ITGAE细胞之间的百分比差异。这些数据有助于比较不同类型的细胞在不同肿瘤组织中的相对丰度。

image-20240521075650351

(D) 散点图和空间特征图展示了ARHGAP15肿瘤细胞与CD8+CCL5免疫细胞之间的关系。散点图是基于TCGA队列的数据生成的,揭示了这两种细胞类型之间的相互作用和空间一致性。

image-20240521075716521

(E) 散点图和空间特征图展示了TPK1、FOXP3和ITGAE之间的关系。同样,这些散点图是基于TCGA队列的数据,可能揭示了肿瘤细胞和免疫细胞之间的复杂相互作用。

image-20240521075733834

(F-H) 条形图显示了通过KEGG(Kyoto Encyclopedia of Genes and Genomes)分析确定的与ARHGAP15肿瘤细胞和CD8+CCL5免疫细胞之间(F)、TPK1+肿瘤细胞和CD4+FOXP3免疫细胞之间(G)、以及TPK1+肿瘤细胞和CD8+CXCL13+ITGAE免疫细胞之间(H)的差异相关的通路。这些通路可能在肿瘤发展和免疫反应中起到关键作用。

image-20240521075753073

(I) 示意图展示了将患者衍生的异种移植瘤(YZL-1)植入NOG小鼠的过程,这些小鼠被注射了安慰剂、sonidegib(20 mg/kg)或rapamycin(10 mg/kg),每组5只小鼠。数据以均值±标准差(SD)的形式呈现,并通过学生t检验(***P<0.001)来评估统计显著性。

image-20240521075806250

(J-K) 肿瘤图像和肿瘤体积曲线显示了分别用sonidegib(20 mg/kg)和rapamycin(10 mg/kg)治疗后肿瘤体积的变化。这些数据同样以均值±SD的形式呈现,并通过学生t检验(P<0.001)来确认治疗的效果。

image-20240521075822733


六、ChatGPT4辅助论文撰写,探索人工智能在非小细胞肺癌治疗中的应用

image-20240521075847152

这篇文章是一篇关于人工智能(AI)在非小细胞肺癌(NSCLC)治疗中应用的编辑评论。文章由Shumpei Ishikawa撰写,讨论了AI如何通过预测治疗结果、验证新辅助疗法并提高精确度来增强NSCLC的护理。

文章提到,肿瘤学领域正在经历一个变革时期,AI在病理评估中的整合,尤其是在NSCLC的新辅助疗法背景下。Dacic等人的研究提供了AI在肺癌突变联盟3(LCMC3)研究基础上推进癌症护理的潜力的深刻见解。

免疫检查点抑制剂(ICIs)作为NSCLC的新辅助疗法,已被美国食品药品监督管理局批准,并被发现在晚期肺癌中特别有效。这些疗法,尤其是当ICIs与化疗结合使用时,显示出显著的临床益处。CheckMate 816试验的结果表明,病理完全缓解与ICIs新辅助治疗的无事件生存期延长之间存在相关性。

文章强调了个性化治疗的必要性,但测量ICIs的有效性一直是一个挑战,因为需要较长时间来观察无病生存和总体生存等临床终点。病理反应(PathR)是一个反映治疗后组织学变化的指标,对于评估早期治疗有效性至关重要。PathR包括主要病理反应(MPR)和病理完全反应。

LCMC3研究引入了一种新视角,利用卷积神经网络模型数字化分析切除的肿瘤标本。这种方法不仅符合既定指南,还提供了一种更有效、精确和一致的肿瘤活性评估。AI驱动的方法与传统病理学家的视觉评估高度一致,强调了其准确性。更重要的是,数字化评估的MPR发现与更长的无病生存和总体生存之间存在显著相关性,强化了其作为患者结果可靠预测者的潜力。

文章还讨论了AI在提高PathR评估精确度方面的作用,从而使患者护理决策更加明智。此外,AI以其可扩展性和标准化能力,解决了临床试验和常规实践中手动评估的挑战。AI不仅简化了评估过程,还减少了常常困扰手动评估的变异性。

最后,文章指出,AI在肿瘤学中的更广泛应用,不仅展示了AI在评估PathR方面的有效性,而且为AI在肿瘤学中的更广泛应用树立了先例。随着我们接受这项技术进步,我们正朝着一个癌症治疗不仅有效,而且根据患者个体需求量身定制的未来迈进。

作者还讨论了在肺癌新辅助治疗中,尽管接受了术前免疫疗法,肿瘤仍然进展的问题,并提出了通过活检预先预测免疫疗法的反应,以便及时对不太可能从中受益的患者进行手术的必要性。作者声明在撰写过程中使用了ChatGPT4来改善语言,并承担了出版物内容的全部责任。


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/675014
推荐阅读
相关标签
  

闽ICP备14008679号