bcftools操作vcf檔案

bigcindy發表於2020-10-28

根據染色體提取vcf中的資訊:

bcftools view -r chr20,chr21,chr22 NA12878.vcf.gz -o NA12878.vcf.chr20_22.gz -O z

解釋:

  • 提取金標準變異NA12878.vcf.gz中20、21和22染色體的變異,儲存到NA12878.vcf.chr20_22.gz檔案中
  • -O z:表示使用壓縮形式儲存檔案

 

提取之後的檔案作為其它軟體輸入時經常需要索引,可按如下建立索引:

bcftools index -t NA12878.vcf.chr20_22.gz

解釋:

  • -t:產生TBI格式的索引(如果沒有-t選項,預設會產生csi的索引)
  • 命令結束後會產生NA12878.vcf.chr20_22.gz.tbi的索引檔案