传统安装 下载 http://bowtie-bio.sourceforge.net/bowtie2/index.shtml 在Linux系统下将上述的链接下载到本地 sudo wget https ://jaist.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.3.4.1/bowtie2-2.3.4.1-linux-x86_64.zip 解压 unzip bowtie2在当前目录中首先查找指定的索引,然后在BOWTIE2_INDEXES环境变量中指定的目录中查找。 该选项仅在bowtie与pthreads库链接时才可用(即,如果BOWTIE_PTHREADS=0未在构建时指定)。 –local 在这种模式下,Bowtie 2不要求整个读取从一端到另一端对齐。 索引文件 bowtie2-build mm10.fa mm10 运行bowtie2 获取 SAM 文件 bowtie2 -p 6 -3 5 --local -x mm10 -1 example_1.fastq
bowtie2 以前都是和samtools组合,如下: bowtie2 -x $index -U $id | samtools sort -@ 4 -o $sample.bam - 运行速度很慢,现在有高效工具啦 samblaster主页) -r --removeDups 去掉重复(-e --excludeDups类似) --addMateTags 添加MC and MQ tags -M 与bwa mem -M 类似 命令组合 bowtie2
然后仿写了bowtie,对我的编程技术提高非常有帮助。 目录如下: 自己动手写bowtie第一讲:BWT算法详解并建立索引 自己动手写bowtie第二讲:优化索引 自己动手写bowtie第三讲:序列查询。 自己动手写bowtie第4讲:笨方法字符串搜索 Bowtie算法第五讲-index2tally Bowtie算法第六讲-tally法对bwt索引进行搜索 首先,什么是BWT,可以参考博客 http:// 这是一个比较复杂的过程,我也是看了bowtie的作者的ppt才慢慢弄懂的,感觉自己也不可能三言两语就说清楚,一般都是辅助图片,动画,再经过多方交流才能慢慢理解。 首先,bowtie的作用就是在一个大字符串里面搜索一个小字符串!
第一步是使用 bowtie 对 hg19 进行比对: mkdir bowtie mkdir ChIP_peaks export BOWTIE_INDEXES=/home/Annotation/Homo_sapiens bowtie/Rad21.sam -o bowtie/Rad21.bam samtools view -S -h -b bowtie/IgG.sam -o bowtie/IgG.bam samtools sort bowtie/Rad21.bam -o bowtie/Rad21.sort.bam samtools sort bowtie/IgG.bam -o bowtie/IgG.sort.bam samtools rmdup bowtie/Rad21.sort.bam bowtie/Rad21.sort.noDup.bam samtools rmdup bowtie/IgG.sort.bam bowtie/IgG.sort.noDup.bam rm bowtie/*.sam rm bowtie/Rad21.bam rm bowtie/IgG.bam rm bowtie/*.sort.bam
/biosoft/bowtie2/bowtie2-2.2.9/bowtie2-align-l . /biosoft/bowtie2/bowtie2-2.2.9/bowtie2-align-l-debug . /biosoft/bowtie2/bowtie2-2.2.9/bowtie2-align-s . /biosoft/bowtie2/bowtie2-2.2.9/bowtie2-align-s-debug . /biosoft/bowtie2/bowtie2-2.2.9-linux-x86_64.zip 3 按文件类型 文件类型 find + 文件目录 + -type + d/f/b/c/s/p/l $
Bowtie2 比对 CUT&Tag 插入文库的构造,采用 Tn5 适配器和带有条形码的 PCR 引物,具体如下所示: 常规操作是在一个 HiSeq 2500 测序通道中,对最多 90 个混合样本进行单索引 {projPath}/alignment/bedgraph ## Build the bowtie2 reference genome index if needed: ## bowtie2-build path/to/hg38/fasta/hg38.fa /path/to/bowtie2Index/hg38 bowtie2 --end-to-end --very-sensitive --no-mixed .sam &> ${projPath}/alignment/sam/bowtie2_summary/${histName}_bowtie2.txt 双端读数使用 Bowtie2 工具进行比对,参数设置为 比对总结 Bowtie2 的比对结果概要会存储在 {projPath}/alignment/sam/bowtie2_summary/{histName}_bowtie2.txt 文件中,您可以看到类似的结果
reference genome index if needed: ## bowtie2-build path/to/hg38/fasta/hg38.fa /path/to/bowtie2Index/ hg38 echo "$histName Bowtie2 hg38" echo Job started at `date` bowtie2 --end-to-end --very-sensitive .sam &> ${projPath}/alignment/sam/bowtie2_summary/${histName}_bowtie2.txt echo "$histName bowtie2 end " ## Bowtie2 Ecoli echo "$histName Bowtie2 Ecoli" echo Job started at `date` bowtie2 --local --very-sensitive _spikeIn.sam &> $projPath/alignment/sam/bowtie2_summary/${histName}_bowtie2_spikeIn.txt seqDepthDouble
然后用fastqc看数据质量 ls *fastq|xargs fastqc -t 10 用Bowtie2将fastqc结果比对到mm10基因组上去 bowtie2 -p 6 -3 5 - /bowtie/mm10 -U .. index/bowtie/mm10 -U .. /bowtie/mm10 -U .. /index/bowtie/mm10 -U ..
软件把测序得到的fastq文件比对到mm10参考基因组上面 ~/biosoft/bowtie/bowtie2-2.2.9/bowtie2 -p 6 -3 5 --local -x ~/reference /index/bowtie/mm10 -U SRR620204.fastq| samtools sort -O bam -o ring1B.bam~/biosoft/bowtie/bowtie2-2.2.9 -o cbx7.bam~/biosoft/bowtie/bowtie2-2.2.9/bowtie2 -p 6 -3 5 --local -x ~/reference/index/bowtie/mm10 -U SRR620206.fastq| samtools sort -O bam -o suz12.bam~/biosoft/bowtie/bowtie2-2.2.9/bowtie2 -p 6 -3 5 /bowtie/bowtie2-2.2.9/bowtie2 -p 6 -3 5 --local -x ~/reference/index/bowtie/mm10 -U SRR620208.fastq|
解压与使用 https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip我是通过 filezilla 下载了bowtie(一个短序列比对工具),并将它存放在了biosofts/bowtie2目录下。 /root/biosofts/bowtie2/bowtie2-2.2.9/bowtie2 # 我的路径 # 如果不把bowtie2 文件添加到PATH中,则需要通过相对路径或绝对路径调用软件 阅读帮助文件 bowtie2 --help ## 帮助文件,且我已经设定了bowtie 的alias。 bowtie2 --version ## 查看版本。 bowtie2 是一个用于短序列比对的工具。 NOTE: Bowtie 1 and Bowtie 2 indexes are not compatible.
// ##参考基因组的构建主要选用的是bowtie2软件进行构建 nohup bowtie2-build --threads 8 TAIR10.fa TAIR10_index > TAIR10_bowtie2 .sam &> ${i}_bowtie2.txt }& done ##比对到大肠杆菌的基因组上 for i in D_rep1 D_rep2 D_rep3 D_rep4 IgG_rep1;do { _spikeIn.sam &> ${i}_bowtie2_spikeIn.txt ##进行比对 seqDepthDouble=`samtools view -F 0x04 ${i}_bowtie2_ -i ${i}_bowtie2.mapped.bam -bedpe > ${i}_bowtie2.bed ## Keep the read pairs that are on the same chromosome ${i}_bowtie2.clean.bed | sort -k1,1 -k2,2n -k3,3n > ${i}_bowtie2.fragments.bed }& done chmod 775 zhuanhuan.sh
那个时候举例使用的是bowtie2软件比对miRNA的reads到miRBase里面的miRNA序列文件,以及hg38参考基因组,两个策略。 Ballgown在差异分析方面比cuffdiff更高的特异性及准确性,且时间消耗不到cuffdiff的千分之一 Bowtie2+eXpress做质量控制优于tophat2+cufflinks和bowtie2 bowtie比对第1篇文章 好奇怪,一直有人坚守bowtie,而不是bowtie2,我猜测是不是因为这个bowtie有一个特殊的功能,是bowtie2所不具备的。 bowtie比对miRNA bowtie比对第2篇文章 Expanding the repertoire of miRNAs and miRNA-offset RNAs expressed in multiple bowtie比对第2篇文章 bowtie比对第3篇文章 hsa-miR-9-3p and hsa-miR-9-5p as Post-Transcriptional Modulators of DNA Topoisomerase
本文细讨论了bowtie如何分配质量分数,并举例说明。 .sam >$projPath/alignment/bam/${histName}_bowtie2.mapped.bam ## Convert into bed file format bedtools bamtobed -i $projPath/alignment/bam/${histName}_bowtie2.mapped.bam -bedpe >$projPath/alignment/bed/$ than 1000bp. awk '$1==$4 && $6-$2 < 1000 {print $0}' $projPath/alignment/bed/${histName}_bowtie2.bed >$projPath/alignment/bed/${histName}_bowtie2.clean.bed ## Only extract the fragment related columns
Bowtie 比对 Bowtie2是一种快速准确的对齐工具,它使用基于 Burrows-Wheeler 变换方法的 FM 索引对基因组进行索引,以保持对齐过程的内存要求较低。 Bowtie2支持间隙、局部和双端对齐模式,最适合至少 50 bp 的读取(较短的读取长度应使用 Bowtie1)。默认情况下, Bowtie2将执行全局端到端读取对齐,这最适合质量修剪的读取。 _genomic 比对 我们先对单个原始 fastq 文件进行处理 $ mkdir results/bowtie2 $ bowtie2 -p 4 -q --local \ -x reference_data # Run bowtie2 cat ${ID} | parallel \ bowtie2 -p 6 -q --local -x ${genome} -U {}.fastq -S $ Nanog-rep2-macs2.log $ macs2 callpeak -t bowtie2/H1hesc_Pou5f1_Rep1_aln.bam -c bowtie2/H1hesc_Input_Rep1
bowtie和hisat的软件安装,数据库参考文件,索引构建等等准备工作这里就不赘述了。 首先使用bowtie1比对全部的fasta序列探针 下面是一个例子,我首先去下载制作了 GPL15314_seq2fa.fasta 文件,然后使用bowtie1比对,参数选择的解释也在下面: bowtie1 =/trainee/jmzeng/tools/bowtie-1.1.2/bowtie # http://bowtie-bio.sourceforge.net/manual.shtml # In -v =/trainee/jmzeng/tools/bowtie2-2.3.5.1/bowtie fasta=/trainee/jmzeng/Probe_seqfasta/lncRNA/human/GPL15314 我们的这个探针序列是60个碱基,使用bowtie1比对失败,就是因为它没办法把这个探针序列的60个碱基拆分成为两个部分,分开比对在参考基因组的不同区域。 ?
使用的工具包括bowtie2、samtools和deepTools。bowtie2的索引文件位于“../data/indx/bowtie2_whole_genome/”文件夹中,前缀为“hg38”。 Tools to use: bowtie2, samtools, and deepTools. The index for bowtie2 is in the folder “.. /data/indx/bowtie2_whole_genome/” with “hg38” as the prefix. Use 24 CPU for the alignment. " # Align reads to reference genome using bowtie2 bowtie2 -p $CPUS -x $INDEX -U $FASTQ1 | samtools sort -@ $CPUS -o ENCFF000AVS_1m.bam bowtie2 -p $CPUS -x $INDEX -U $FASTQ2 | samtools sort -@ $CPUS -o ENCFF000AVS
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip unzip bowtie2-2.2.9-linux-x86_64.zip ? mkdir bowtie2_data 第一步,准备参考基因组 bin/prepare-refseqs.pl --fasta bowtie2-2.2.9/example/reference/lambda_virus.fa /bowtie2-2.2.9/bowtie2 -x ./bowtie2-2.2.9/example/index/lambda_virus -U . data=bowtie2_data ? 这个网页粗看起来就这样了,但是细节很坑的,需要花费时间还是挺长的,如果想真正做到定制化。
tair10.sam 2>bwa.log 二、split比对 针对人基因组RNA-Seq,read跨越外显子,此时要使用支持切除read的软件,例如tophat2,升级的hisat2.而bowtie2 #bowtie2与hisat2比较 ln -s /share/home/xiehs/07.aligment/data/chrX.fa . bowtie2-build chrX.fa chrX bowtie2 .sam 2> bowtie2.log hisat2-build chrX.fa chrX hisat2 -p 12 --dta -x chrX -1 /share/home/xiehs/07.aligment fastq.gz -2 /share/home/xiehs/07.aligment/data/ERR188044_chrX_2.fastq.gz -S hisat2.sam 2> hisat2.log bowtie2 .sam 680M hisat2.sam 737M hisat2支持split比对,可以看到文件大小比bowtie2的结果更多了。
安装下面软件,并添加至环境路径 Bowtie2 2.2.1+ (tested with 2.2.1) Bowtie 0.12.7+ (tested with 0.12.7) perl python 2.7.3 下载bowtie索引文件 a. 创建索引文件夹 创建以下两个文件夹,分别用于存放bowtie和bowtie2索引文件。 下载bowtie索引文件并解压到相应文件夹 Human (hg19), Mouse (mm10), Rat (rn5) and Drosophila (dm3)有可用的junction索引文件下载。 需要将bowtie1索引文件解压至以下文件夹: cd /path/to/circularRNApipeline_*/denovo_scripts/index tar zxvf genomeId_BT1index.tar.gz 将bowtie2索引文件解压至以下文件夹: cd /path/to/circularRNApipeline_*/index tar zxvf genomeId_BT2index.tar.gz gtf文件需要下载并解压缩至以下文件夹
宏基因组reads筛选:去除宿主序列 测序数据的组装:常用软件工具 更新中…… 短序列有参比对常用的软件有BWA、Bowtie、BBMap等。下面以Bowtie 2为例。 Bowtie 2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)是一个快速的、节约内存的序列比对工具,用于将测序的reads比对到长的参考序列 human_genome 运行结束后,生成6个文件,如下所示: Bowtie已经为很多常见物种预先构建了index(见官网主页Pre-built indexes栏),不想自己构建可以在其FTP中下载 bowtie2进行比对的用法如下所示: bowtie2 [options] -x <bt2-idx> { -1 <m1> -2 <m2> | -U <r>} [-S <hit>] <文件>: -x <bt2 -idx> 参考基因组(reference genome)通过bowtie2-build指令构建的Index文件 -1 <m1> 双末端测序中第一个fastq文件,可以写多个文库但是必须用逗号隔开,但文件