2023年12月7日发(作者:)

对VCF文件统计作图

1:安装vcftools,并运行:

export PERL5LIB=/share/work/biosoft/vcftools/vcftools_v0.1.14/share/perl5/:$PERL5LIB

2:从vcf文件中提取单个样本的vcf文件

cat raw_|/share/work/biosoft/perl/perl-5.22.1/bin/perl /share/work/biosoft/vcftools/vcftools_v0.1.14/bin/vcf-subset -c A02 >

3:

注意以上软件的读取需要输入vcf的压缩格式,压缩软件需要htslib软件中bgzip

bgzip -c "" > ""

4:建立vcf的index,也是用到htslib软件中的tabix

/share/work/biosoft/samtools/htslib/tabix

5:统计VCF文件,使用bcftools:

/share/work/biosoft/bcftools/bcftools-v1.3/bin/bcftools stats -d 0,10,1>A01_

在运行上条命令的时候请添加-s-参数。

6:画图

/share/work/biosoft/bcftools/bcftools-v1.3/bin/plot-vcfstats A01_ -p A01_plots/

建议修改输出图形的大小,讲代码中的(figsize=(2*$$opts 修改为(figsize=(2.3*$$opts

7:从vcf文件按照样本进行分离,你首先知道样本名称:

export PERL5LIB=/share/work/biosoft/vcftools/vcftools_v0.1.14/share/perl5/:$PERL5LIB &&

/share/work/biosoft/vcftools/vcftools_v0.1.14/bin/vcf-subset -c Cabbage1 /share/work/fanyc/pr

oject/Brassica_oleracea/ >