当前位置:   article > 正文

IF: 8+ 基于10种机器学习揭示了肺腺癌预后和治疗中不同细胞死亡模式

gse143423

2fece4fb46f820d80bcc7b97155a12e6.png


这期分享一篇 2024年1月发表于 npj Precision Oncology (IF 8+)的文章,作者基于机器学习揭示了肺腺癌预后和治疗中不同细胞死亡模式。

81eaaf5aca7f0c4d33d412815febff19.png

该文章使用桓峰基因公众号里面生信分享教程即可实现,有需要类似思路的老师可以联系我们!

摘要

肺癌细胞的生长、转移和耐药性对肺腺癌(LUAD)的治疗提出了重大挑战。然而,目前缺乏能够准确预测患者预后并指导选择靶向治疗的最佳预测模型。程序性细胞死亡(PCD)途径在各种癌症的发生和进展中起着关键作用,为LUAD患者的预后指标和药物敏感性标志物提供了潜在的可能性。预测模型的开发和验证是通过整合13种PCD模式,综合分析来自TCGA-LUAD和6个GEO数据集的大量RNA、单细胞RNA转录组学和相关临床病理细节进行的。利用机器学习算法,我们确定了LUAD中与PCD相关的10个关键差异表达基因,即CHEK2、KRT18、RRM2、GAPDH、MMP1、CHRNA5、TMPRSS4、ITGB4、CD79A和CTLA4。随后,我们在上述队列中基于这些基因进行了程序性细胞死亡指数(PCDI),并将该指数与相关临床特征相结合,形成了几种预后图。此外,我们观察到PCDI与LUAD的免疫特征之间存在显著相关性,包括免疫细胞浸润和免疫检查点分子的表达。此外,我们发现PCDI评分高的患者可能对免疫治疗和标准辅助化疗方案产生耐药性;然而,他们可能受益于其他fda支持的药物,如多西他赛和达沙替尼。总之,PCDI具有作为预后标志的潜力,可以促进LUAD患者的个性化治疗。

生信分析流程

相关数据集选择

RNA-seq data:TCGA-LUAD,GSE116959,GSE31210, GSE50081, and GSE72094

immunotherapy cohort: GSE126044 and GSE78220

single-cell RNA-seq: GSE162498 and GSE143423

基因集选择

2090 PCD-associated genes

生信分析方法

根据文章的分析流程提取所有的分析内容,整理出来就21个分析条目,每个条目都包括分析的内容,这些分析构成了整个文章,本文属于机器学习的临床预测分析类文章,下面我们就看看哪些分析可以利用桓峰基因公众号的教程来实现,点击分析条码就会跳转到对应公众号的教程,跟着教程做,您也能发轻松发高分,如下:

1.基因差异表达分析(edgeR)

2. LUAD 患者队列中的突变情况

3. PCD相关基因的不同特征(circlize)

单细胞相关分析

4.单细胞转录组可视化(Seurat)

5.单细胞转录组之细胞类型自动注释(SingleR)

6. 单细胞数据中推断拷贝数变化(inferCNV)

7.单细胞转录组之筛选标记基因 (Monocle 3)

8.单细胞转录组之构建细胞轨迹 (Monocle 3)

9.单细胞转录组之差异表达分析 (Monocle 3)

10.肿瘤微环境分析

TIMER2.0

MCP-counter

ESTIMATE

CIBERSORT

11.药物相关性分析

药物-基因关联预测(oncoPredict)

药物敏感性水平(oncoPredict)

12.人工智能预测指数10种机器学习算法:

  Elastic network, Enet.

  least absolute shrinkage and selection operator, LASSO.

  Ridge regression, Ridge.

  Gradientboosting machine, GBM.

  Random forest, RSF.

  Supervised principal components, SuperPC.

  survival support vector machine (survival-SVM)

  partial least squares regression forex (plsRcox)

  stepwise Cox

  CoxBoost

13.无监督聚类法(ConsensusClusterPlus)

14.基因表达GO富集分析

15.基因表达KEGG富集分析

16.单/多因素Cox比例风险回归分析

17.预测模型—列线表(Nomogram)

18.生存分析(Kaplan-Meier)

19.预测模型一致性指数(C-index)

20.预测模型之接收者操作特征曲线(ROC)

21.绘图相关方法

  散点图 (Scatter)

  柱状图 (Barplot)

  箱线图 (Boxplot)

  折线图 (Lineplot)

  直方图 (HistogramPlot)

  小提琴图 (ViolinPlot)

  相关性矩阵图(Correlation Matrix)

研究结果

1. 本研究的图形摘要

3813864059d940effd6f7bc42f8cf494.png

2. LUAD患者PCD-DEG的变化

a PCD-DEGs基因列表包含52个基因。

b LUAD与正常组织间PCD-DEG热图。

c PCD-DEGs相互作用的PPI网络。

d 基于PCD-DEGs的GO富集分析。

e 基于PCD-DEGs的KEGG富集分析。

f, g PCD-DEGs的体细胞突变示意图。

55e507939052b67ea34089c3d544857d.png

3. 通过基于机器学习的整合过程开发并验证了共识PCDI

a 通过十倍交叉验证框架,共选取70种预测模型,进一步计算出每种模型的C指数。

b RSF结果的错误率。

c 基于RSF筛选基因的可变相对重要性。

d-e TCGA-LUAD队列LASSO回归可视化。

f LASSO结果和RSF结果的Venn图。

g Circos图描绘了10个模式基因的位置和表达水平。

h 按PCDI分类的亚组的GSVA。

i TCGA、GSE31210、GSE50081和GSE72094富集生物学功能的Venn图。

j 4种常见的生物学途径。

ca168f974da4e38a964b61f108f6a400.png

4. PCDI与临床指标的相关性

a-e TCGA-LUAD患者PCDI与T期、N期、M期、临床分期、生存状况关系的小提琴图。

f-h GSE31210、GSE50081、GSE72094中PCDI与生存状态关系的小提琴图。

i 当k = 2时,根据PCD-DEGs谱将TCGA-LUAD队列患者分为两个分子簇。

j 两个分子簇TCGA-LUAD队列患者预后的Kaplan-Meier分析。

k 冲积图显示了LUAD患者PCDI组、分子簇、临床状态和生存状态之间的相互关系。

l 10个模型基因与临床因素热图。

dd8209536465ed5fb6c2c2eb7d0b84a3.png

5. 基因标记预测模型的内部训练和外部验证

a PCDI在TCGA、GSE31210、GSE50081和GSE72094中根据生存状态和时间的分布。

b 基于TCGA、GSE31210、GSE50081和GSE72094队列PCDI的主成分分析(PCA)图。

c TCGA、GSE31210、GSE50081和GSE72094队列中低和高pcdi组患者的总生存期。

38428a98546e9fa8263f9ec589ce810c.png

6. nomogram生存模型的建立与评价

a TCGA-LUAD患者临床病理特征和PCDI的单因素分析。

b TCGA-LUAD患者临床病理特征和PCDI的多因素分析。

c 建立预测TCGA-LUAD患者预后的nomogram。

d 校正图显示TCGA-LUAD队列中1年、3年和5年总生存率的概率。

e-f 预测1年和3年总生存的nomogram决策曲线分析(DCA)。

g 基于nomogram score对两个LUAD组进行Kaplan-Meier分析。

h-k TCGA-LUAD、GSE31210、GSE50081和GSE72094的ROC分析。

1f07f8e021c890784ec9aa19fd9f9394.png

7. 基于PCDI信号的肿瘤微环境解剖

a 在两个LUAD单单元数据集中绘制了80059个单元的UMAP图。

b 热图显示了每种细胞类型中最高差异表达基因(Wilcoxon测试)。

c 特征图表示每种细胞类型的典型标记基因表达。

d 10个模式基因在不同细胞类型中的分布和表达。

e 热图图显示了每个上皮簇的CNV信号。

f 每个上皮细胞簇得分的方框图。

g U-MAP图显示上皮细胞的三个亚簇。

h 分化过程轨迹用状态和细胞类型着色。

i CNVscore与CDIscore的相关性。

j 低、中、高恶性亚群的CDIscore比较。

8ecda155cfbe92ae1c535ed792531c6c.png

8. PCDI亚群的分子和免疫谱分析

a 基于TIMER、EPIC、MCP-COUNTER和CIBERSORT算法的免疫细胞、PCDI和模型基因之间关系的气泡图。

b-c TCGA-LUAD高、低pcdi组间Stromalscore和Immunescore比较的小提琴图。

d 基于PCDI的8个免疫检查点基因表达箱线图。

e 免疫检查点基因、PCDI和模式基因之间关系的气泡图。

b5b61d001be852693f470a9f80097c59.png

9. PCDI在免疫治疗中的预测作用

a TCGA-LUAD、GSE31210、GSE50081、GSE72094患者高、低pcdi组TIDE评分的小提琴图比较。

b TCGA-LUAD、GSE31210、GSE50081、GSE72094患者TIDE评分与PCDI值的相关性。

c 生存曲线显示GSE126044低pcdi组预后好于高pcdi组。

d GSE126044中高或低PCDI组抗pd - l1治疗临床反应的患者比例。

e 无响应者与响应者GSE126044之间的PCDI小提琴图。

f 生存曲线显示GSE78220低pcdi组预后好于高pcdi组。

g GSE78220中高、低PCDI组抗pd - l1治疗临床缓解的患者比例。

h GSE78220中PCDI无响应者与响应者的小提琴图。

8dfce8672e36a435356b96ecffb6ac58.png

10. 程序性细胞死亡标记在预测药物敏感性中的作用

a 药物、PCDI和模式基因之间关系的气泡图。

b-i TCGA-LUAD队列中高、低PCDI组非小细胞肺癌治疗药物的IC50比较箱形图以及IC50与PCDI值的相关性。

m TCGA-LUAD模型基因、药物、经典治疗靶点和通路的相关性。

36dec28db583f1738e09e768ce952212.png

11. 临床样本中特征基因的体外实验验证

a-j RT-qPCR验证基因在TCGA-LUAD和癌前组织中的转录。k HPA数据库中TCGA-LUAD与邻近正常组织之间特征基因的蛋白表达。

ba350738f7edb39e7d8a8c35fa9b1d68.png

12. 通过体外实验验证临床样品中的特征基因

a 模型基因与TIDE分数之间关系的气泡图。

b、c临床样品中CHEK2、GAPDH和RRM2的WB分析。

d 临床样本中CHEK2、GAPDH和RRM2的免疫组化分析。

cf51c40cd2c552c874ea2e23c16eb1b0.png

Reference

Wang S, Wang R, Hu D, Zhang C, Cao P, Huang J. Machine learning reveals diverse cell death patterns in lung adenocarcinoma prognosis and therapy. NPJ Precis Oncol.

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出机器学习系列生信分析教程,

敬请期待!!

桓峰基因官网正式上线,请大家多多关注,还有很多不足之处,大家多多指正!http://www.kyohogene.com/

桓峰基因和投必得合作,文章润色优惠85折,需要文章润色的老师可以直接到网站输入领取桓峰基因专属优惠券码:KYOHOGENE,然后上传,付款时选择桓峰基因优惠券即可享受85折优惠哦!https://www.topeditsci.com/

4a9959fd2f9ca192b85eff05b507eef8.png

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/代码探险家/article/detail/916049
推荐阅读
相关标签
  

闽ICP备14008679号