赞
踩
在宏基因组学研究中,又或者你准备做大规模的系统进化的相关研究等等,需要分析了数百万个序列的reads,以确定来自环境的微生物样品的功能或分类学含量,找出对应reads同源的物种。这里重要的步骤是确定存在哪些基因,通常通过将翻译的DNA序列与蛋白质序列的参考数据库比对,例如NCBI非冗余(NCBI-nr)蛋白质数据库。长期以来,BLASTX因其高灵敏度而被认为是此标准的黄金标准工具。但是,BLASTX对于处理大批量的数据来说还是太慢了(就算你将你的蛋白质切成很小份并行分析,也需要一段长时间的运行,并且会耗费大量的计算机资源)。
今天的推文给大家介绍一下钻石(DIAMOND),目前的引用量已经超过1000,一款非常适合在处理大数据量的蛋白质或者核苷酸序列分析中替换BLASTX/BLASTP。据分析,当针对NCBI-nr数据库进行显着比对,预期值低于10 -3时,DIAMOND比BLAST比对大约快20,000倍于,并具两个工具有相似的灵敏度水平。
DIAMOND是一种高通量比对程序,可将DNA测序reads文件与蛋白质参考序列文件(如NCBI-nr)进行比较。它以C ++实现,旨在在多核服务器上快速运行。
该程序明确地设计为,利用具有大内存容量和许多内核的现代计算机体系结构。那么为什么它那么快呢&#
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。