2023年12月7日发(作者:)

vcf样本基因型提取--PyVCF处理

需要提取vcf文件的样本基因型,原始文件:

代码:

import vcf

vcf_reader = (filename=r"I:/1000GenomeProject/vcftools_filter/chr22_")

genomeType=[]

for record in vcf_reader:

#

样本个数

# print(record._sample_indexes)

#

样本基因型

#

FORMAT

信息作为键,后面对应的信息做为值,构建成的字典(

CallData

对象),以及

sample

名称,这两个值组成一个

Call

对象,共同构成

samples

的一

个元素。这样就把

sample

和基因型信息给关联起来,按下标访问每一个

Call

对象。

samples

类型为

list

# print(s)

print("--------------------------------------------------------")

for sample in s:

#

获取基因型

0|0

(sample['GT'])