2024年5月25日发(作者:)
PAML: 最大似然法分析系统发育
Phylogenetic Analysis by Maximum Likelyhood
版本:4.3(2009年9月)
Ziheng Yang
马向辉翻译
1、概述
PAML (for Phylogenetic Analysis by Maximum Likelihood) 是一个用最大似然法
分析蛋白质或DNA序列系统发育的一个程序包。
1.1 PAML 文件:
除了这个手册以外,以下资源也需要注意:
PAML网站:/software/。在这个网站上有
PAML的下载以及编译程序;
PAML FAQ页面:/software/;
PAML讨论群:/phpBB2/,在这里你可以提出你的问题,或
者提出你发现的漏洞。
1.2 PAML 可以做些什么?
PAML 的最新版本包含一下几个程序模块:baseml, basemlg, codeml, evolver,
pamp, yn00, mcmctree, 以及 chi2。其中最常用的模块的介绍可以参考杨子恒教授2007
年发表的文章。模块运行中用到的计算、统计方法在杨子恒教授的书中有详细的介绍。模
块的主要作用包括:计算以及检测系统发育树(baseml 和 codeml); 计算复杂的碱基
替代或者氨基酸替代模型中的参数,如不同位点间不同速率的模型或多个基因或者位点的
综合分析模型(baseml和codeml); 用似然比例检测比较几个模型(baseml,codeml
以及chi2); 用全局分子钟或者局部分子钟估算分歧时间(baseml和codeml); 用最大
似然法重建祖先氨基酸、核苷酸序列以及密码子模型(baseml和codeml); 用蒙特卡洛
模拟生成氨基酸、密码子或者核酸序列(evolver); 估算同义替代、非同义替代的速率,
检测DNA的蛋白编码区的正选择(yn00和codeml); 综合贝叶斯法以及化石校正估算
物种分歧时间(mcmctree)。
PAML的优势在于它整合了各种复杂的替代模型。在baseml和codeml中建树的算
法相对简单,所以较少的物种(如<10个)可以用这两个软件分析,对于大量物种的建树
分析,最好还是用其他的程序去分析树结构,例如phylip、paup或者myBayes。当然,
你可以用其他的软件构树,然后作为用户树用baseml或codeml验证。
baseml 和 codeml:baseml程序用于最大似然法分析核苷酸序列; codeml程序则
是由两个旧程序组合而成:codonml和aaml。其中前者是基于Goldman和Yang在1994
年提出的编码蛋白质的核酸序列的密码子替代模型,而后者主要用于氨基酸序列的替代模
型。现在,这两种序列可以在中通过seqtype定义,其中1表示密码子序列,
2表示氨基酸序列。在这个手册里面,我将使用codonml和aaml来分别表示codeml中
的seqtype=1和seqtype=2。这三个程序(baseml,codonml和aaml用相同的最大似
发布评论