2024年5月25日发(作者:)

PAML: 最大似然法分析系统发育

Phylogenetic Analysis by Maximum Likelyhood

版本:4.3(2009年9月)

Ziheng Yang

马向辉翻译

1、概述

PAML (for Phylogenetic Analysis by Maximum Likelihood) 是一个用最大似然法

分析蛋白质或DNA序列系统发育的一个程序包。

1.1 PAML 文件:

除了这个手册以外,以下资源也需要注意:

PAML网站:/software/。在这个网站上有

PAML的下载以及编译程序;

PAML FAQ页面:/software/;

PAML讨论群:/phpBB2/,在这里你可以提出你的问题,或

者提出你发现的漏洞。

1.2 PAML 可以做些什么?

PAML 的最新版本包含一下几个程序模块:baseml, basemlg, codeml, evolver,

pamp, yn00, mcmctree, 以及 chi2。其中最常用的模块的介绍可以参考杨子恒教授2007

年发表的文章。模块运行中用到的计算、统计方法在杨子恒教授的书中有详细的介绍。模

块的主要作用包括:计算以及检测系统发育树(baseml 和 codeml); 计算复杂的碱基

替代或者氨基酸替代模型中的参数,如不同位点间不同速率的模型或多个基因或者位点的

综合分析模型(baseml和codeml); 用似然比例检测比较几个模型(baseml,codeml

以及chi2); 用全局分子钟或者局部分子钟估算分歧时间(baseml和codeml); 用最大

似然法重建祖先氨基酸、核苷酸序列以及密码子模型(baseml和codeml); 用蒙特卡洛

模拟生成氨基酸、密码子或者核酸序列(evolver); 估算同义替代、非同义替代的速率,

检测DNA的蛋白编码区的正选择(yn00和codeml); 综合贝叶斯法以及化石校正估算

物种分歧时间(mcmctree)。

PAML的优势在于它整合了各种复杂的替代模型。在baseml和codeml中建树的算

法相对简单,所以较少的物种(如<10个)可以用这两个软件分析,对于大量物种的建树

分析,最好还是用其他的程序去分析树结构,例如phylip、paup或者myBayes。当然,

你可以用其他的软件构树,然后作为用户树用baseml或codeml验证。

baseml 和 codeml:baseml程序用于最大似然法分析核苷酸序列; codeml程序则

是由两个旧程序组合而成:codonml和aaml。其中前者是基于Goldman和Yang在1994

年提出的编码蛋白质的核酸序列的密码子替代模型,而后者主要用于氨基酸序列的替代模

型。现在,这两种序列可以在中通过seqtype定义,其中1表示密码子序列,

2表示氨基酸序列。在这个手册里面,我将使用codonml和aaml来分别表示codeml中

的seqtype=1和seqtype=2。这三个程序(baseml,codonml和aaml用相同的最大似