当前位置:   article > 正文

毕业论文复现_稻瘟菌基因与srna靶向预测

稻瘟菌基因与srna靶向预测

一、稻瘟菌-水稻数据处理与多组学网络构建

1.水稻差异表达基因的处理

经过前面的操作,我们一定得到了1368个水稻的差异表达基因,现在希望处理这些基因,得到一些网络关系。

(1)识别水稻蛋白和蛋白质互作的边

我们需要的文件有:
RAP差异表达基因1368个-带t的.csv:1368个水稻的RAP格式的差异表达基因。
步骤:将文件①中的字符t转换为g,得到RAP差异表达基因1368个-带g的.csv,记为文件②,因为只有这样才是符合转换条件的RAP格式转换基因。
在这里插入图片描述
进入网站:https://rapdb.dna.affrc.go.jp/tools/converter,然后复制文件②的一列,粘贴到输入栏,然后点击convert,等待结果返回
在这里插入图片描述结果返回后,将结果全部复制,然后粘贴到excel中
在这里插入图片描述
把第一列删除,再第二列复制,再粘贴为数值(否则是带有网页链接的),再删除所有为None的行(采用筛选方法),最终得到MSU格式水稻差异表达基因.xlsx,记为文件③,如下图
在这里插入图片描述复制这一列数据,进入网站https://cn.string-db.org/
按照下面的操作
在这里插入图片描述图案生成后是这样的
在这里插入图片描述点击Analysis可以看到一共识别出1047个水稻蛋白以及1364条蛋白互作的边。
点击Exports可以选择以某种格式把图片导出来。

(2)对差异表达基因做GO和KEGG富集分析

将文件②,即RAP差异表达基因1368个-带g的.csv的基因复制,进入david数据库(这是一个做富集分析的数据库),先点击start Analysis如图左,再按照图右进行操作
在这里插入图片描述
发现有78个未识别出来,其余的均识别为水稻基因(oryza sativa),然后点击step2下面的function
在这里插入图片描述下面开始做GO(Gene_Ontology)分析,先点击clear all,把所有的选择都清除,然后点击Gene_Ontology
在这里插入图片描述选择这三项,然后点击functional annotation chart
在这里插入图片描述
GO富集分析结果如图,MF表示molecular function分子功能,CC表示cellular component细胞组成,BP表示biological process生物过程。
在这里插入图片描述
点击downfile
在这里插入图片描述
把网页另存为txt
在这里插入图片描述把该txt文件以excel表格形式打开即可
在这里插入图片描述KEGG分析按下图操作即可,后续和上面一样
在这里插入图片描述关于GO和KEGG分析的详细流程,推荐视频:【R】四种风格展示DAVID GO富集分析结果

(3) 稻瘟菌蛋白数据获取

侵染后新出现的稻瘟菌sRNA146种.xlsx(记为文件④),和侵染前后均存在的稻瘟菌sRNA220种.xlsx(记为文件⑤),中的sRNA序列复制下来,粘贴到Tapir网站(预测靶基因的网站):Tapir,设置得分参数4,自由能比例0.7,最终获得差异表达sRNA及其对应的稻瘟菌靶基因1908对。
用脚本提取出所有预测出的靶基因target,输入到STRING数据库中,最终得到1357个蛋白质结点,5373条蛋白互作关系。
在这里插入图片描述

(4)水稻基因-稻瘟菌sRNA网络构建

将366个稻瘟菌差异表达基因和1368个水稻差异表达基因输入到bibiserv网站(预测靶基因的网站):bibiserv,使用RNAhybrid进行靶基因预测,用水稻mRNA的fasta格式数据和稻瘟菌差异表达sRNA的fasta格式数据作为输入,预测出对应关系,并选择最小自由能(mfe,Minimum Free Energy)小于-24.0 kcal/mol的关系,得到130167条数据(数据格式如下图,是一个无权网络图,同质节点间没有边,只异质结点间有边),为文件input.txt(记为文件⑥),作为水稻差异表达基因和稻瘟菌差异表达sRNA间互作关系。
在这里插入图片描述

二、NR-MRMO算法

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号