赞
踩
经过前面的操作,我们一定得到了1368个水稻的差异表达基因,现在希望处理这些基因,得到一些网络关系。
我们需要的文件有:
①RAP差异表达基因1368个-带t的.csv:1368个水稻的RAP格式的差异表达基因。
步骤:将文件①中的字符t转换为g,得到RAP差异表达基因1368个-带g的.csv,记为文件②,因为只有这样才是符合转换条件的RAP格式转换基因。
进入网站:https://rapdb.dna.affrc.go.jp/tools/converter,然后复制文件②的一列,粘贴到输入栏,然后点击convert,等待结果返回
结果返回后,将结果全部复制,然后粘贴到excel中
把第一列删除,再第二列复制,再粘贴为数值(否则是带有网页链接的),再删除所有为None的行(采用筛选方法),最终得到MSU格式水稻差异表达基因.xlsx,记为文件③,如下图
复制这一列数据,进入网站https://cn.string-db.org/
按照下面的操作
图案生成后是这样的
点击Analysis可以看到一共识别出1047个水稻蛋白以及1364条蛋白互作的边。
点击Exports可以选择以某种格式把图片导出来。
将文件②,即RAP差异表达基因1368个-带g的.csv的基因复制,进入david数据库(这是一个做富集分析的数据库),先点击start Analysis如图左,再按照图右进行操作
发现有78个未识别出来,其余的均识别为水稻基因(oryza sativa),然后点击step2下面的function
下面开始做GO(Gene_Ontology)分析,先点击clear all,把所有的选择都清除,然后点击Gene_Ontology
选择这三项,然后点击functional annotation chart
GO富集分析结果如图,MF表示molecular function分子功能,CC表示cellular component细胞组成,BP表示biological process生物过程。
点击downfile
把网页另存为txt
把该txt文件以excel表格形式打开即可
KEGG分析按下图操作即可,后续和上面一样
关于GO和KEGG分析的详细流程,推荐视频:【R】四种风格展示DAVID GO富集分析结果
将侵染后新出现的稻瘟菌sRNA146种.xlsx(记为文件④),和侵染前后均存在的稻瘟菌sRNA220种.xlsx(记为文件⑤),中的sRNA序列复制下来,粘贴到Tapir网站(预测靶基因的网站):Tapir,设置得分参数4,自由能比例0.7,最终获得差异表达sRNA及其对应的稻瘟菌靶基因1908对。
用脚本提取出所有预测出的靶基因target,输入到STRING数据库中,最终得到1357个蛋白质结点,5373条蛋白互作关系。
将366个稻瘟菌差异表达基因和1368个水稻差异表达基因输入到bibiserv网站(预测靶基因的网站):bibiserv,使用RNAhybrid进行靶基因预测,用水稻mRNA的fasta格式数据和稻瘟菌差异表达sRNA的fasta格式数据作为输入,预测出对应关系,并选择最小自由能(mfe,Minimum Free Energy)小于-24.0 kcal/mol的关系,得到130167条数据(数据格式如下图,是一个无权网络图,同质节点间没有边,只异质结点间有边),为文件input.txt(记为文件⑥),作为水稻差异表达基因和稻瘟菌差异表达sRNA间互作关系。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。