当前位置:   article > 正文

IF: 8+ 基于26种机器学习算法的人工智能预测肺腺癌患者预后和免疫治疗反应

IF: 8+ 基于26种机器学习算法的人工智能预测肺腺癌患者预后和免疫治疗反应

ed917c55eac1dea8648d9c68b4793a95.png


这期分享一篇 2024年1月发表于Cell Prolif (IF 8.5)的文章,作者基于26种机器学习算法的人工智能预测肺腺癌患者预后和免疫治疗反应。

0f5b8cfa86fba478bbc19029f04b6cea.png

该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!

摘   要

免疫细胞在影响肺腺癌 (LUAD) 细胞的增殖、进展和转移中起着越来越重要的作用。然而,免疫细胞特异性基因模型的潜力在很大程度上仍然未知。在当前的研究中,通过分析单细胞 RNA 测序(scRNA-seq) 数据和大量 RNA 测序数据,基于总共26种机器学习算法开发了肿瘤浸润免疫细胞 (TIIC) 相关特征。因此,TIIC 特征评分可以通过五个独立的数据集预测 LUAD 患者的生存结果。TIIC 签名分数表现出优 于 LUAD 中先前建立的 168 个 signature 的性能。此外,LUAD 患者问题阵列免疫荧光染色的 TIIC 特征评分显示出预后价值。我们的研究揭示了 TIIC 特征评分与肿瘤免疫和代谢之间的牢固联系。此外,已经发现 TIIC 特征评分可以预测基因组变化,化疗药物敏感性,最重要的是免疫治疗反应。作为一种新发现的生物标志物,TIIC 特征评分有助于选择将从未来临床分层中受益的 LUAD 人群。

生信分析流程

相关数据集选择

转录组数据集:TCGA-LUAD (502 patients)

GSE31210 (226 patients)

GSE37745 (106 patients)

GSE50081 (128 patients)

GSE68465 (442 patients)

单细胞转录组数据集:ENA (43 clinical biopsies)

基因集选择

CFL1、HSP90AA1、PFN1、CCDC85B、HMGB1、PABPC1、RPS15

生信分析方法

根据文章的分析流程提取所有的分析内容,整理出来就13个分析条目,每个条目都包括分析的内容,这些分析构成了整个文章,本文属于机器学习的临床预测分析类文章,下面我们就看看哪些分析可以利用桓峰基因公众号的教程来实现,点击分析条码就会跳转到对应公众号的教程,跟着教程做,您也能发轻松发高分,如下:

单细胞相关分析

1.从肿瘤单细胞RNA-Seq数据中推断拷贝数变化 (inferCNV)

2.单细胞转录组数据可视化及差异分析 (Seurat 4.0)

3.单细胞通讯可视化及通信网络的系统分析(CellChat)

4.受体-配体及其相互作用的细胞通讯数据库 (iTALK)

5.单细胞数据量化代谢的计算方法 (scMetabolism)

  1. 人工智能预测指数(AIDPI)十种机器学习算法:

机器学习分类算法:

  1).Boruta

  2).eXtreme gradient boosting (Xgboost)

  3).least absolute shrinkage and selection operator regularized logistic regression (LassoLR)

  4).support vector machine (SVM)

  5).random forest (RF)

  6).prediction analysis for microarrays (Pamr)

  7).random survival forest (RSF)

  8).least absolute shrinkage and selection operator regularized cox regression (LassoCox)

  9).cox model by likelihood-based boosting (CoxBoost)

机器学习scoring算法

  10).conditional random forests (CForest)

  11).elastic net regression (Enet)

  12).Ridge

  13).gradient boosting with regression trees (BlackBoost)

  14).regression for a parametric survival model (SurvReg)

  15).conditional inference trees (CTree)

  16).CoxPH

  17).ObliqueRSF

  18).StepwiseCox

  19).SurvivalSVM

  20).generalized boosted regression models (GBM)

  21).Ranger

  22).partial least squares regression for cox models and related techniques (PlsRcox)

  23).gradient boosting with component-wise linear models (GlmBoost)

  24).supervised principal components (SuperPC)

  25).akritas conditional non-parametric survival estimator (Akritas)

  26).recursive partitioning and regression trees (Rpart)

7.基因组拷贝数变异分析及可视化 (GISTIC2.0)

8.基因组变异分析神器之 maftools

9.药物敏感性预测

10.单因素Cox比例风险回归分析

11.生存分析之 Kaplan-Meier

12.预测模型一致性指数 (C-index)

13.预测模型之接收者操作特征曲线 (ROC)

研究结果

1. 整体研究的流程图

e86b19cee9d03b4eb4b52e682462f578.jpeg

2. TIIC-RNA在单细胞水平的鉴定

A.鉴定的微环境细胞和LUAD细胞的t-SNE图。

B.鉴定的LUAD细胞和13种免疫细胞的tSNE图。

C.免疫细胞间差异表达基因的Vlnplot。

D.鉴定的免疫细胞和LUAD细胞的t-SNE图。

E.两个TIIC特征组之间差异表达基因的火山图。

F. Venn图显示了通过六种ML算法进行分类识别的交叉基因。

e6775a732baf3cce084656aa260dd75b.jpeg

3. 基于机器学习的风险特征开发

A. 14个交叉基因的单变量Cox回归分析的风险特征的发展。

B.采用CoxBoost算法对10个预后基因进行降维。

C.用Lasso算法对10个预后基因进行降维。

D.随机生存森林算法对10个预后基因进行降维。

E. Venn图显示了通过三种ML算法确定的预后基因。

F. TCGA、GSE31210、GSE37745、GSE50081和GSE68465数据集的TIIC特征评分与OS的Kaplan-Meier生存曲线。

G. TCGA、GSE31210、GSE37745、GSE50081和GSE68465数据集的1年、2年、3年、4年和5年OS的TIIC特征评分随时间变化的ROC曲线。

c8f6ae7f986c66dd168d70b0ec67a5e6.jpeg

4. TIIC特征评分的预后价值

A.两个TIIC特征评分组不同临床因素的Circos图。

B. TCGA、GSE31210、GSE37745、GSE50081、GSE68465数据集中TIIC特征评分与各临床因素的c指数。

C. TCGA、GSE31210、GSE37745、GSE50081和GSE68465数据集中TIIC特征得分和168个LUAD模型的C-index。

be264c97efe85f6c2b004be0d92737fe.jpeg

5. TCGA数据集中TIIC特征分数的生物学特性

A.基于MsigDB的GSVA分析描述了两个TIIC特征评分组的生物学属性。

B. GO和KEGG术语的t-SNE图描绘了两个TIIC signature 评分组中通路活性的差异。

C.基于Metascape的两个TIIC特征评分组差异表达基因富集分析。D. TIIC signature分数的GSEA和KEGG术语

813be646933360e55d62a8d35529087b.jpeg

6. TCGA数据集中TIIC特征评分的免疫特性

A. TIIC特征评分与免疫浸润细胞的相关性。

B. TIIC特征评分与免疫调节剂的相关性。

4c477ac3ee57824a01b0d121bd2514f5.jpeg

7. TIIC特征评分的免疫治疗反应预测

A. IMvigor数据集中TIIC特征评分与OS的Kaplan-Meier生存曲线。

B. IMvigor数据集的TIIC特征评分与免疫治疗反应之间的关联。

C. GSE179351数据集的TIIC特征评分与免疫治疗反应之间的关联。

D. Braun数据集中TIIC特征评分与OS的Kaplan-Meier生存曲线。

E. Braun数据集的TIIC特征评分与免疫治疗反应之间的关联。

F. GSE103668数据集的TIIC特征评分与靶向治疗反应之间的关联。

G. GSE165252数据集的TIIC特征评分与免疫治疗反应之间的关联。

H. Van Allen数据集的TIIC特征评分与免疫治疗反应之间的关联。

K. GSE78220数据集的TIIC特征评分与免疫治疗反应之间的关系。

L. Nathanson数据集中TIIC特征评分与OS的Kaplan-Meier生存曲线。

M. Nathanson数据集的TIIC特征评分与免疫治疗反应之间的关系。

N. GSE35640数据集的TIIC特征评分与免疫治疗反应之间的关联。

O. GSE91061数据集的TIIC特征评分与免疫治疗反应之间的关联。

P. GSE126044数据集的TIIC特征评分与免疫治疗反应之间的关联。

365fb6f1ae11632b900d172f690d2a66.jpeg

8. TCGA数据集中TIIC特征评分的代谢特征

A.基于kegg的GSVA分析了两个TIIC特征评分组中12个代谢类别的代谢途径。

B. TIIC特征评分两组脂质代谢途径的差异。

C. TIIC特征评分与基于文献的代谢通路GSVA分析之间的相关性。

fc8f8ebcac3201beb92998cf979b0ce1.jpeg

9. TCGA数据集中TIIC特征分数的多组学变化特征

A.两个TIIC特征评分组中基于GISTIC 2.0的染色体扩增和缺失。

B.两个TIIC特征评分组的基因组改变景观。

C.两个TIIC特征评分组中基因组改变的比例、获得的基因组比例和丢失的基因组比例。

D.两个TIIC特征评分组Ch7变化的分布。

f525250d0d87117f330c8dcd98c27698.jpeg

10. TIIC特征评分在LUAD组织阵列中的预后价值

A.基于多重IF染色的CFL1、HSP90AA1和PFN1在高TIIC特征评分组的代表性图像。

B.低TIIC特征评分组基于多重IF染色的CFL1、HSP90AA1和PFN1的代表性图像。

C.高TIIC特征评分组CCDC85B、HMGB1、PABPC1、RPS15多重IF染色的代表性图像。

D.低TIIC特征评分组CCDC85B、HMGB1、PABPC1、RPS15多重IF染色的代表性图像。

E.TIIC特征评分与OS的Kaplan-Meier生存曲线。

F.1、2、3、4、5年OS的TIIC特征评分随时间变化的ROC曲线。

G.两个TIIC特征评分组不同临床因素的Circos图。

4713e6d8713f94e68e6899491e65dded.jpeg

Reference

Zhang N,et al. An artificial intelligence network-guided signature for predicting outcome and immunotherapy response in lung adenocarcinoma patients based on 26 machine learning algorithms. Cell Prolif. 2023 Apr;56(4):e13409.

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出机器学习系列生信分析教程,

敬请期待!!

桓峰基因官网正式上线,请大家多多关注,还有很多不足之处,大家多多指正!http://www.kyohogene.com/

桓峰基因和投必得合作,文章润色优惠85折,需要文章润色的老师可以直接到网站输入领取桓峰基因专属优惠券码:KYOHOGENE,然后上传,付款时选择桓峰基因优惠券即可享受85折优惠哦!https://www.topeditsci.com/

26a6ed398b2842e1a4f3c8333a3bb150.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/916073
推荐阅读
相关标签
  

闽ICP备14008679号