当前位置:   article > 正文

bowtie和samtools在tophat中的使用

bowtie和samtools

Bowtie介绍

1 Bowtie和一般的比对工具不一样,他适用于短reads比对到大的基因组上,尽管它也支持小的参考序列像amplicons和长达1024readsBowtie采用基因组索引和reads的数据集作为输入文件并输出比对的列表。Bowtie设计思路是,1)短序列在基因组上至少有一处最适匹配, 2)大部分的短序列的质量是比较高,3)短序列在基因组上最适匹配的位置最好只有一处。这些标准基本上和RNA-seq, ChIP-seq以及其它一些正在兴起的测序技术或者再测序技术的要求一致。

2 Bowtie有两种比对策略:

-n (默认使用-n

该参数要求比对时碱基错配数不超过N,这里N的取值范围是0-3,并且这个错配数是指种子序列上允许的碱基错配数。

在全部错配位置的phred 质量值的和可能会超过参数e。对于没有质量值的fasta文件,质量值默认是40.

-v

比对不允许超过V个错配,V的取值范围是0-3.此时忽略质量值。

Strara

-n比对模式下,stratum是定义种子区域的错配数,结合-l参数使用。在-v比对模式下,stratum定义在所有记录中的错配数,结合-m参数使用。

结果参数 –k –a –m –M –best –strara

3 Bowtie使用方法

3.1 Usage:

  bowtie [options]* <ebwt> {-1 <m1> -2 <m2> | --12 <r> | <s>} [<hit>]

 

  <m1>    Comma-separated list of files containing upstream mates (or the

          sequences themselves, if -c is set) paired with mates in <m2>

  <m2>    Comma-separated list of files containing downstream mates (or the

          sequences themselves if -c is set) paired with mates in <m1>

  <r>     Comma-separated list of files containing Crossbow-style reads.  Can be

          a mixture of paired and unpaired.  Specify "-" for stdin.

  <s>     Comma-separated list of files containing unpaired reads, or the

          sequences themselves, if -c is set.  Specify "-" for stdin.

  <hit>   File to write hits to (default: stdout)

3.2 输入参数:

Input:

  -q                 query input files are FA

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号