2024年4月26日发(作者:)
R语言之系统进化树的美化
展开全文
百度百科对进化树的定义是:在生物学中,用来表示物种之间的进化关系。生物分类
学家和进化论者根据各类生物间的亲缘关系的远近,把各类生物安置在有分枝的树状的图
表上,简明地表示生物的进化历程和亲缘关系。在进化树上每个叶子结点代表一个物种,
如果每一条边都被赋予一个适当的权值,那么两个叶子结点之间的最短距离就可以表示相
应的两个物种之间的差异程度。同时有很多算法应运而生主要包括:贝叶斯法
(Bayesian),最大似然法(Maximum likelihood,ML),最大简约法(Maximum
parsimony,MP),邻接法(Neighbor-Joining,NJ),最小进化法(Minimum
Evolution,ME),类平均法(UPGMA)。与此同时相对应的软件也出现,下图总结来
源于网络:
我们今天就不一一介绍树状图的形成,如果实在没操作过那可以参考下面的创建进化
树数据的实例:
• mafft --auto > ggtree_##序列的比对./FastTree
ggtree_ >ggtree_ ###最大似然法进化树构建
接下来就是我们今天的主题如何对获得进化树数据进行美化。需要用到R语言的包
ggtree。
包的安装我们就是不赘述了,请参考bioconductor安装方式。
首先我们看数据的导入。所用到的函数是。
主要的参数:
file和text参数是相互补充的数据。如果设置了file就不用管text,如果传入自己的
文本数据那就会忽略file。
Skip参数主要是在读入数据时需要忽略的前多少行。同时去掉后面多少字符的则是
,它会忽略此处设置的单个字符串以后的数据。
主要是面对多个进化树时,可以设置为true,并且利用进行
选择对应的树。
发布评论