根据官网的指示:alexdobin/STAR
下载并解压STAR:
wget https://github.com/alexdobin/STAR/archive/2.7.8a.tar.gz
tar -xzf 2.7.8a.tar.gz
cd STAR-2.7.8a
编译:
cd STAR/source
make STAR
安装目录加入环境变量:
export PATH=/data/users/minmingw/tools/STAR-2.7.8a/bin/Linux_x86_64:$PATH
下载参考基因组和对应的注释文件:
我是在ensembl下载的hg38 :Ensembl genome browser 103
左边第二个下载fasta(选择dna.primary_assembly),右边第三个下载GTF (选择GRCh38103.gtf.gz)。
建index:
STAR --runThreadN 6 \ #设置线程
--runMode genomeGenerate \
--genomeDir /data/users/minmingw/Alignment/index \ #index输出路径
--genomeFastaFiles /data/users/minmingw/Alignment/hg38/Homo_sapiens.GRCh38.dna.primary_assembly.fa \ #参考基因组Fasta文件路径
--sjdbGTFfile /data/users/minmingw/Alignment/hg38/Homo_sapiens.GRCh38.103.gtf 、 #参考基因组注释GTF文件路径
--sjdbOverhang 100 #reads长度最大值减一,默认100,我已知我的reads最大长度101
需要一段时间,建index就完成啦。
接下来就是比对,两个双端测序fastq文件为一组
STAR --runThreadN 20
--genomeDir /data/users/minmingw/Alignment/index \#index路径
--readFilesIn SRR11050957_1.fastq SRR11050957_2.fastq \#R1和R2路径
--outSAMtype BAM SortedByCoordinate \ #生成排序后的bam文件 可以进行后续RNA velocity
--outFileNamePrefix ./SRR11050957 #输出文件夹前缀
有一个很tricky的地方就是。。虽然STAR提供了--readFilesCommand gunzip -c 供fastq.gz压缩格式的file比对。。但是这样跑出来的bam不能通过后续的samtools sort 。。。所以还是解压吧。。真的不知道为什么 bam文件的final log都是一样的。。。。
如果是single cell seq..需要用STARsolo....
参考文档:alexdobin/STAR
我的是ICELL8平台 测序,所用的命令如下。。
STAR --genomeDir /data/users/minmingw/Alignment/index --readFilesIn SRR11050949_2.fastq SRR11050949_1.fastq --soloCBwhitelist None --runThreadN 8 --soloType CB_UMI_Simple --soloCBstart 1 --soloCBlen 11 --soloUMIstart 12 --soloUMIlen 10 --soloBarcodeReadLength 26 --outSAMattributes NH HI nM AS CR UR CB UB GX GN sS sQ sM --outSAMtype BAM SortedByCoordinate --soloCellFilter EmptyDrops_CR --outFileNamePrefix SRR11050949
多个Lane: 注意fastq之间的空格
STAR --genomeDir /data/users/minmingw/Alignment/index --readFilesIn Chip91497_lane1_2.fastq,Chip91497_lane2_2.fastq,Chip91497_lane3_2.fastq Chip91497_lane1_1.fastq,Chip91497_lane2_1.fastq,Chip91497_lane3_1.fastq --soloCBwhitelist None --runThreadN 8 --soloType CB_UMI_Simple --soloCBstart 1 --soloCBlen 11 --soloUMIstart 12 --soloUMIlen 10 --soloBarcodeReadLength 26 --outSAMattributes NH HI nM AS CR UR CB UB GX GN sS sQ sM --outSAMtype BAM SortedByCoordinate --soloCellFilter EmptyDrops_CR --outFileNamePrefix Chip91497
武汉格发信息技术有限公司,格发许可优化管理系统可以帮你评估贵公司软件许可的真实需求,再低成本合规性管理软件许可,帮助贵司提高软件投资回报率,为软件采购、使用提供科学决策依据。支持的软件有: CAD,CAE,PDM,PLM,Catia,Ugnx, AutoCAD, Pro/E, Solidworks ,Hyperworks, Protel,CAXA,OpenWorks LandMark,MATLAB,Enovia,Winchill,TeamCenter,MathCAD,Ansys, Abaqus,ls-dyna, Fluent, MSC,Bentley,License,UG,ug,catia,Dassault Systèmes,AutoDesk,Altair,autocad,PTC,SolidWorks,Ansys,Siemens PLM Software,Paradigm,Mathworks,Borland,AVEVA,ESRI,hP,Solibri,Progman,Leica,Cadence,IBM,SIMULIA,Citrix,Sybase,Schlumberger,MSC Products...