2024年2月26日发(作者:)
附录3分子生态学统计软件介绍
分子生态学是研究生命系统与环境系统相互作用的分子基础与分子机理的崭新的分子生物学与生态学的交叉学科,是从基因、蛋白质、酶等生物分子活动规律来阐释生态规律进化、生态过程、适应和演变历程(Burke et al,1992; Bachmann et al,1994)。这些研究通常会产生大量而复杂的分子数据,选择合适的统计方法对正确的解释科学现象是非常重要的。以下就介绍几类常用的分子生态学软件。
3.1 遗传多样性与遗传结构分析软件
遗传多样性是生物多样性的基础,丰富的遗传多样性可以提供很多宝贵的遗传资源。因此为了对天然群体的遗传多样性研究,分子生态学专家开发出了一系列的评估软件,用于计算和检测生物群体基因变异的度量和遗传指标,其中用得比较广泛的有POPGENE、STRUCTURES、GENEPOP、GenAlEx 6、NTSYSpc、FSTAT等。
POPGENE是由Francis Yeh等人开发的用共显性和显性标记来研究群体内和群体间的遗传多样性。这个软件操作较简单,功能也比较全,主要包括计算广泛的遗传学数据如等位基因频率、遗传多样性、遗传距离、G-statistics、F-statistics等以及复杂的遗传学数据基因流、中性检测、连锁不平衡、多位点结构等。新版本的POPGENE还可用来分析数量遗传变异以及提供更高质量的系统聚类图。
POPGENE下载地址:
/~fyeh/
FSTAT 软件包是Jérôme Goudet开发的用于计算共显性标记的遗传多样性和遗传分化参数。主要功能如下:检测样本和总体水平上的基因频率,观察和期望基因型,等位基因数,基因丰富度;检测整体水平上以及每个样本或位点是否处于哈温平衡; Nei's (1987)的遗传多样性和遗传分化的估计值和 Weir & Cockerham (1984)每个等位基因,每个位点以及总体上的Capf (Fit), theta (F)和smallf (F)的估计值;检测R- statistics (Slatkin, 1995),5 将原始数stis据转化成Genepop的格式等。
FSTAT下载地址:
/popgen/softwares/
ARLEQUIN软件是由Excoffier等开发出来的群体遗传学软件,能提供大量的基础方法和统计学检测。由于Arlequin有大量的选项,所以认真阅读说明来使用。Arlequin的主要功能有以下几个方面。在群体内,包括计算多态位点、群体内遗传多样性、单倍体频率、连锁不平衡、哈温平衡、Tajima’s中性检测、Fu's F中性检测、Ewens-Watterson中性检测等。在群体S间,包括寻找共显的单倍型、分子方差分析、成对的群体间遗传距离、基因型的指派分析等。
ARLEQUIN下载地址:
/software/arlequin3/
GENEPOP软件包是由Michel Raymond 和Francois Rousset 开发出来的,主要功能与FSTAT相近。在数据处理上,可以将数据直接提交网上计算,也可下载软件计算。主要也有7个功能:1检测于哈温平衡,提供种群内各位点的平衡状态及种群整体的平衡状态的检验;2 连锁不平衡的分析;3 遗传分化和基因流的计算;4 基因型矩阵,基因频率,观察和期望基因型;5 计算F-statistics和Rho-statistics,以及根据地理距离进行Mantel检测;6 转化成FSTAT,BIOSYS,LINKDOS,ARLEQUIN的格式;7 用极大似然估计检测基因频率,将单倍体的信息二倍体化;
直接在线计算地址:
/
GENEPOP 4.0下载地址:
/~rousset/.
GENALEX软件是Peakall和Smouse研究出的一种在 Microsoft Excel程序中运行的跨操作系统平台的居群遗传分析软件包,它可以对共显性数据、单倍体数据和二元数据进行分析。GENALEX还提供了一系列基于频率的分析。例如GENALEX可进行F统计检验、Nei’s遗传距离和地理距离的同一性检验以及偏性分布的检验。基于距离的计算如 AMOVA分析、相关性PCA分析、Mantel检验等。该软件包还提供了 20多种不同的图表总结数据已经辅助检测。除此之外,序列信息和基因型数据可以方便地在相关软件中转化格式(李欣,2008)。
GenAlEx 6.2下载地址:
/BoZo/GenAlEx/ genalex_download_6_
STRUCTURES 软件包实现了通过基因型信息来推断群体遗传结构。这种方法是由Pritchard,Stephens和Donnelly(2000)以Falush,Stephens和Pritchard (2003,2007)开发和修订的。他们利用一个假想的模型:有K个群体(K不一定知道),个体被随机的指派到群体中,如果某些个体的基因型显示出他们是混合的情况下,它们甚至加入了两个或两个的群体中。这种方法可以应用解释现有的群体结构 识别独特的遗传群体,将个体指派到群体中,鉴定迁移者和混合的个体。该软件主要有家系模型和等位基因模型。其中家系模型包括:1 不混合模型;2混合模型;3连锁模型(考虑位点的连锁信息的混合模型);4先前信息模型(可以让使用者指派一些或所有的个体到提前定义好的群体中)。
STRUCTURES 2.2下载地址:
/software/ structure2_
NTSYS-pc 软件可以用来从多元数据中寻找其规律和结构,是形态学和遗传学分类的常用软件。可以用来进行多变量数据、数据转换、相似及非相似分析、群集分析、数字性分类系统、也可以应用于族群分析、委任分析、多尺寸缩放、树状资料分析、cophenetic数值数组、调和分析、主要成份分析、双中心化、特征函数向量、傅立叶变换、合并方差-协方差、遗传距离系数、相似/不相似、转化等。NTSYS能将AFLP、RAPD和ISSR等显性标记分析的群体,以单个个体的形式聚类出来。这样可以很直观的看出群体间的关系和混合程度。但对于以共显性标记如SSR,由于数据处理方面的问题(NTSYS要求以1,0矩阵的形式输入),应用得较少。这款软件需要购买使用。
NTSYSpc 2.2下载地址:
/cat/ntsyspc/
SPAGeDi (Spatial Pattern Analysis of Genetic Diversity)是由Olivier HARDY和Xavier
VEKEMANS开发的主要利用基因型来分析个体或群体的空间遗传结构的一个软件包。它可以通过成对的比较来计算出多种数据来描述个体或群体间的相关和分化程度,同时也分析这些数值与地理距离之间的关系如空间自相关分析和线性回归分析(这些回归分析的斜率可以用来间接的评估基因分散的参数如邻去尺寸等)。在没有地理信息的条件下,SPAGeDi也可用来计算总的遗传分化和两两比对的矩阵。
SPAGeDi 1.2下载地址:
/sciences/ecoevol/
BOTTLENECK是由Cornuet和Luikart (1996)开发出的用于检测能够检测种群在过去的2Ne-4Ne(Ne为有效种群大小)世代内经历的有效种群的急剧下降(Piry et al., 1999)。在经历了瓶颈的种群中,有效种群大小较小,多态位点上的等位基因数和杂合度(He,从等位基因频率计算而来)也会相应地减少,但等位基因数的降低比杂合度要快,从而使得杂合度比突变-漂变平衡下根据等位基因数计算来的期望杂合度大(He>Heq),即杂合度过量(Piry et al.,1999)。Bottleneck有三种模型 Infinite allele model(IAM),Stepwise mutation model (SMM) ,Two- phased model of mutation(TPM)。严格地讲,只有在符合 IAM模型的位点上,才能检测出杂合度过量,对于遵循严格的 SMM 模型的位点,不会观察到杂合度的过量。 然而, 极少位点会严格地符合 SMM 模型, 一旦位点稍微从SMM模型偏向 IAM模型,就会由于遗传瓶颈产生杂合度过量。TPM 是介于 SMM 和 IAM 之间的一个模型,是一种更适合微卫星标记的模式(Piry et al.,1999)。为了检测一个种群中杂合度过量的位点数是否显著,BOTTLENECK提供了三种方法:Sign test、Standardized differences test、Wilcoxon sign-rank
test。第一种方法的统计功效较低,第二种方法需要至少20 个多态位点,而第三种的统计功效相对较高,同时在 4 个以上多态位点的情况下即可以使用。
Bottleneck 1.2.02下载地址:
/URLB/bottleneck/
3.2分子系统学以及序列分析软件
分子系统学是通过检测生物大分子包含的遗传信息,定量描述、分析这些信息在分类、系统发育和进化上的意义,从而在分子水平上解释系统发育及进化规律的一门学科(徐宏发和王静波,2001)。分析分子系统学数据的软件很多,常用的分子系统学软件包括PHYLIP,MEGA,PAUP等。
PHYLIP (PHYLogeny Inference Package)是一个推断系统发育或进化树的软件包,由西雅图华盛顿大学的Joseph Felsenstein 编写。PHYLIP其是多个软件的压缩包,功能极其强大,主要包括五个方面的功能软件:1 DNA和蛋白质序列数据的分析软件;2 序列数据转变成距离数据后,对距离数据分析的软件;3 对基因频率和连续的元素分析的软件;4把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件;4按照DOLLO简约性算法对序列进行分析的软件;5绘制和修改进化树的软件PHYLIP是最广泛的系统发育软件包,但对文件格式都有严格的规定,所有的计算过程也许要一步接一步的进行。因此PHYLIP软件的操作过程比较复杂。
PHYLIP 3.68下载地址:
/
MEGA (the Molecular Evolutionary Genetics Analysis)是由Kumar开发出的分子系统学软件它主要集中于进化分析获得的综合的DNA和蛋白质序列信息,构建系统发育树、推测物种间的进化距离等。主要功能有以下几个方面:
1 序列比对的构建。该软件能够识别MEGA, NEXUS, FASTA和其它格式的序列,并且能够手工编辑序列和直接对选中序列在网上BLAST;
2 可以采用多种方法估算遗传距离,如. Tamura-Nei distance 和最大相似法等;
3 选择的检测。其中包括Fisher's Exact Test,Tajima's Test of Neutrality,Large sample Z-test;多种方法建立系统树。如Neighbor-Joining,Minimum Evolution method,UPGMA,Maximum
Parsimony,并且对建好的树进行的Bootstrap检测和Confidence Probability检测;
5 该软件还可将序列输出成PAUP3,PHYLIP的格式。
MEGA 4下载地址:
/
PAUP(phylogenetic analysis using parsimony)是David L. Swofford等人开发设计的一款用于构建进化树(系统发育树)及进行相关检验的软件,包含了众多分子进化模型和方法。PAUP用最大简约法做系统发生分析时既能对DNA序列做邻近归并法(neighbor joining,NJ)、最大简约法(maximumparsimony,MP)和最大相似法(maximum likelihood,ML)分析,又能对蛋白质序列做NJ和MP分析。(Swofford,1998)PAUP分析得到的进化树默认的浏览软件是TreeView,但由于TreeView所提供的编辑功能很弱,笔者建议使用MEGA软件执行上述运算命令后保存得到phylip类型的进化树可在MEGA中直接打开。这款软件需要购买使用。
PAUP下载地址:
http:///
TreeView下载地址:
http:///rod/


发布评论