2024年4月26日发(作者:)

R语言之系统进化树的美化

展开全文

百度百科对进化树的定义是:在生物学中,用来表示物种之间的进化关系。生物分类

学家和进化论者根据各类生物间的亲缘关系的远近,把各类生物安置在有分枝的树状的图

表上,简明地表示生物的进化历程和亲缘关系。在进化树上每个叶子结点代表一个物种,

如果每一条边都被赋予一个适当的权值,那么两个叶子结点之间的最短距离就可以表示相

应的两个物种之间的差异程度。同时有很多算法应运而生主要包括:贝叶斯法

(Bayesian),最大似然法(Maximum likelihood,ML),最大简约法(Maximum

parsimony,MP),邻接法(Neighbor-Joining,NJ),最小进化法(Minimum

Evolution,ME),类平均法(UPGMA)。与此同时相对应的软件也出现,下图总结来

源于网络:

我们今天就不一一介绍树状图的形成,如果实在没操作过那可以参考下面的创建进化

树数据的实例:

• mafft --auto > ggtree_##序列的比对./FastTree

ggtree_ >ggtree_ ###最大似然法进化树构建

接下来就是我们今天的主题如何对获得进化树数据进行美化。需要用到R语言的包

ggtree。

包的安装我们就是不赘述了,请参考bioconductor安装方式。

首先我们看数据的导入。所用到的函数是。

主要的参数:

file和text参数是相互补充的数据。如果设置了file就不用管text,如果传入自己的

文本数据那就会忽略file。

Skip参数主要是在读入数据时需要忽略的前多少行。同时去掉后面多少字符的则是

,它会忽略此处设置的单个字符串以后的数据。

主要是面对多个进化树时,可以设置为true,并且利用进行

选择对应的树。