2024年4月27日发(作者:)

口蹄疫病毒全基因组序列特征分析

杨鹏华;倪凤娥

【摘 要】对口蹄疫病毒全基因组序列特征的分析有助于了解口蹄疫病毒复制、翻

译等生命活动的相关机制.利用DNAStar和DNAMAN软件,对249株口蹄疫病毒

全基因组序列进行了比对分析.结果表明,口蹄疫病毒ORF的长度为5 982~7 020

bp,平均长度为6 975 bp,编码1 994~2 340个氨基酸.各基因的核酸序列同源性

均在74%以上,最高达到94.29%.在5'- UTR存在大量保守位点,并发现3个长的

保守序列.3'- UTR区存在4段保守序列,可以形成2个发卡结构.研究结果为进一步

研究口蹄疫病毒基因组序列结构与病毒生存机制的关系提供了重要的生物信息,为

病毒防制提供了理论依据.%There was no much information about the life

circle of foot and mouth disease virus (FMDV) , such as replication,

translation as well as assembly of virus. Analysis of the FMDV genome may

provide a chance to discover the mystery to some extent. Presently,the

genomes of 249 FMDV isolates were aligned by the biological

software,DNAStar and DNAMAN. The lengths of the open reading frame

(ORF) in all isolates were between 5982 to 7020bp, which code 1994 to 2

340 amino acids. The homology of all genes of FMDV was above 74% and

up to 94. 29%. Three long conserved sequences and four conserved motifs

were obtained in the 5 -UTRs and 3'-UTRs of FMDV, respectively. The

result provided a new basis for understanding the relationship between

the genome sequence and life mechanism of FMDV.

【期刊名称】《河南农业科学》

【年(卷),期】2011(040)011

【总页数】5页(P140-144)

【关键词】口蹄疫病毒;序列比对;基因组

【作 者】杨鹏华;倪凤娥

【作者单位】长江大学生命科学学院长江中游湿地农业教育部工程研究中心,湖北

荆州434025;长江大学生命科学学院长江中游湿地农业教育部工程研究中心,湖北

荆州434025

【正文语种】中 文

【中图分类】S852.65+9.6

口蹄疫是一种由口蹄疫病毒引起的急性、热性和高度接触性人畜共患传染病,主要

感染各种偶蹄动物。口蹄疫病毒是正链单股RNA病毒,属于小RNA病毒科口蹄

疫病毒属,共有7个血清型[1]。基因组包括2个非翻译区(UTR)和1个开放

阅读框(ORF)。5′-UTR包括S片段(S fragment)、多聚C(PolyC)、假

结节(PKs)和内部核糖体进入位点(IRES),3′-端包括3′-UTR 和多聚腺苷酸

尾(PolyA)[2]。ORF编码1个大的多聚蛋白,翻译为1个前体蛋白,最后水

解为12种成熟蛋白,分别 为 L、1A(Vp4)、1B(Vp2)、1C(Vp3)、1D

(Vp1)、2A、2B、2C、3A、3B(Vpg)、3C(Pro)和3D(Pol)[3]。虽

然对口蹄疫病毒的基因组已经有很多报道,但是依然有很多区域的功能还不完全清

楚[4]。例如,5′-UTR中的S片段为什么是所有小RNA病毒科中最长的,它

具体参与RNA复制的机制也不清楚[5-6]。而且人们对2B和3A的具体作用

还不了解[7]。虽然对口蹄疫病毒的复制过程进行了大量研究,但是仍然不清楚

病毒确切的复制机制[8-9]。分析全基因组序列特征可以帮助人们了解口蹄疫

病毒复制、翻译等生命活动的相关机制。鉴此,对现有的249株口蹄疫病毒基因

组进行了序列比对和特征分析,以期对口蹄疫病毒基因组序列与病毒复制、翻译和

组装释放机制之间的关系有一个新的认识。

1 材料和方法

1.1 口蹄疫病毒基因组序列

口蹄疫病毒基因组序列收集自GenBank数据库中的已发表序列,共249个全基

因组序列,具体见表1。其中血清A型56个,亚洲1型40个,C型20个,O

型112个,SAT1型10个,SAT2型6个,SAT3型5个。

表1 参考的口蹄疫病毒株基本情况A 56 AY593751-AY593794,AY593801-

AY593803,EF117837,HM854021-HM854025,HQ632773,NC_

011450,X74812 Asia140 AY304994,AY317098,AY390432,AY593795-

AY593800,AY687333-AY687334,DQ533483,DQ989303-DQ989323,

EF149009,EF149010,EF614458,FJ906802,GU931682,HQ632774,NC

_004915 C 20 AF274010,AM409325,AY593804-AY593810,DQ409183

-DQ409191,FJ824812,NC_002554 O 112 AB079061,AF026168,

AF308157,AF377945,AF506822,AF511039,AH012984,AH012985,

AJ320488,AJ539136-AJ539141,AJ633821,AY333431,AY359854,

AY593811- AY593837,AY686687,DQ404158- DQ404180,DQ478936,

DQ478937,EF175732,EF552688-EF552697,EF614457,EU214601,

FJ175661-FJ175666,FJ542365-FJ542372,GU38482,GU384683,

HM008917,HM229661,HQ009509,HQ412603,HQ632768-HQ632772,

NC_004004,X00871 SAT110 AY593838-AY593846,NC_011451 SAT2

6 AF540910,AJ251473,AY5913847-AY593849,NC_003992 SAT3 5

AY593850-AY593853,NC_011452

1.2 口蹄疫病毒基因组序列比较

利用DNAStar软件对所有口蹄疫病毒全基因组序列进行比对,并拆分基因组为5′

-UTR序列、单个结构基因、非结构基因及3′-UTR序列。用DNAMAN软件对

每一个基因进行比对,分析保守位点。

2 结果与分析

2.1 口蹄疫病毒全基因组同源性分析

用DNAMAN软件对249个口蹄疫病毒全基因组序列进行同源性分析,结果表明,

各基因的核酸序列同源性均在74%以上,最高达到94.29%,具体见表2。其中5′

-UTR和3′-UTR的核酸序列同源性分别是78.48%和82.76%。结构蛋白基因

(1A、1B、1C和1D)的核酸序列和氨基酸序列同源性分别为81.58%和

87.06%,非结构蛋白基因(除结构蛋白之外的其他蛋白)的核酸序列和氨基酸序

列同源性分别为91.89%和95.55%。完整ORF的核酸序列和氨基酸序列同源性分

别为87.88%和92.53%。

2.2 口蹄疫病毒5UTR区特征分析

对口蹄疫病毒基因组5′-UTR区进行比对,结果表明,此区同源性比较低,存在

大量的突变位点,其中同源性最低的区域在Poly(C)区,这一区域的C的数量

变化很大,在图1中表示为一个大的凹陷(图1)。另外,5′-UTR的3′端序列

的保守性高于其5′端序列,并且发现大量非常保守的基序,这些基序主要集中在

IRES区,与口蹄疫病毒的复制和翻译密切相关。用BioEdit软件对5′-UTR的3′

端序列进行一致性序列分析,结果发现了3个长的保守性非常高的序列,分别为1、

2和3(图1)。其中保守序列1位于PKs和IRES之间,保守序列2和3位于

IRES内部,与蛋白质的翻译相关。

表2 口蹄疫病毒基因组序列同源性分析基因 同源性/%核酸 氨基酸5′-UTR

78.483 ′-UTR 82.76 L 85.66 88.611 A 89.75 98.501 B 81.62 87.871 C 80.93

85.271 D 74.01 76.592 A 92.03 97.302 B 93.21 96.882 C 93.78 97.893 A

91.08 93.653 B 92.29 95.063 C 92.81 97.463 D 94.29 97.58 ORF 87.88 92.53

2.3 口蹄疫病毒ORF区特征分析

口蹄疫病毒ORF区的长度在5982 ~7020 bp,平均长度为6975 bp,编码

1994 ~2340 个氨基酸。通过分析发现,大部分病毒的ORF在6960 bp以上,

但是有6株病毒的ORF比较短,最短的只有5982 bp,为DQ409184。进一步

研究表明,这6株病毒缺失了大量基因序列,分别是L、1BC和1CD(图2)。

口蹄疫病毒ORF区主要编码12种蛋白,包括4种结构蛋白和8种非结构蛋白,

非结构蛋白的保守性明显大于结构蛋白。保守性较高的区域集中在3个部分,分

别是1A和1B的5′序列、2ABC和3A的5′端序列、3BCD(图2Ⅰ,Ⅱ,Ⅲ)。

图1 口蹄疫病毒5′UTR区序列分析

图2 口蹄疫病毒ORF区蛋白序列分析

2.4 口蹄疫病毒3′UTR区特征分析

口蹄疫病毒3′-UTR有约90个核苷酸,同源性为82.76%,含有一些保守性非常

强的序列,这些序列可以分为4部分,分别为Ⅰ、Ⅱ、Ⅲ和Ⅳ(图3)。其中Ⅰ和

Ⅱ区域能形成反向互补的茎,Ⅲ和Ⅳ能形成反向互补的茎,在Ⅰ和Ⅱ之间,Ⅲ和Ⅳ

之间的序列形成环。这些保守序列与口蹄疫病毒的复制密切相关。

3 讨论

图3 口蹄疫病毒3′UTR区序列分析

口蹄疫病毒基因组全长8083 ~8287 bp,与文献报道基本一致[10]。但是本研

究中发现,个别毒株的基因组序列发生了大规模丢失现象,最高的缺失了约1000

bp,这样大量的核苷酸序列的减少并没有影响病毒在细胞上的复制。因为缺失只

发生在了结构蛋白和L区,并没有影响有关复制的相关基因,并且随着病毒代数

的增加,缺失的基因通过遗传重组又得到了修复[11]。氨基酸序列同源性最高

的是1A序列,同源性为98.50%,同源性最低的是1D,只有76.59%。核酸序列

同源性最高的是3D,最低的是1D。这可能是由于1A和3D蛋白主要参与病毒粒

子的组装和复制,而病毒粒子的组装和复制是在宿主细胞的细胞质中发生的,对病

毒的增殖至关重要,所以氨基酸序列的高度保守性保证了功能的完整性[12]。

而1D基因是最主要的抗原分子,是病毒入侵宿主细胞、刺激宿主免疫反应的主要

因子,为了逃避宿主的免疫反应,1D基因经常发生变异[13]。非结构蛋白的保

守性高于结构蛋白,因为非结构蛋白主要参与病毒的复制、前体蛋白的加工、病毒

粒子的组装与释放,这些过程任何一步发生异常都将导致病毒的消亡,所以非结构

蛋白的保守性较大[2]。

各蛋白中同源性较低的是L和3A蛋白,L蛋白N端和3A蛋白C端氨基酸序列的

高变异率是导致它们同源性较低的原因[14]。L基因2个AUG之间序列的高度

变异可能也导致了病毒更倾向于从第2个AUG位点起始翻译[15-16]。而3A

蛋白与病毒的毒力和感染宿主范围有关[10]。同源性低的序列主要在结构蛋白

1BCD区,因为这3个基因编码的蛋白构成衣壳蛋白,是口蹄疫病毒与宿主细胞直

接接触的部分,所以面临着巨大的选择压力,这导致了这3个基因的变异程度非

常高[17]。其他的非结构蛋白和1A共同组成了相对稳定的区域,保守性相对较

高[18]。

5′-UTR 5′端保守性非常高,在所选择的序列中除了O/YM/YN/2000株(序

列号 HQ412603)外全都是UUGAAA,5′端的UU对口蹄疫病毒复制起始至关重

要,Vpg蛋白也是通过酪蛋白的羟基与5′端的UU相连接[5,19]。经过分析,

发现了几个保守性非常高的序列,有121CCUG、156GCUGG、224CCGCC、

253UGGGC、333UACUUGU、285UUUCA,其中285UUUCA序列与5′端

UUGAAA互补形成S片段长茎的根部,对维持S片段的稳定性非常重要。紧临

285UUUCA序列就是Poly(C),Poly(C)中C的数量在各毒株中变化较大,

从50bp至250bp不等,而且在培养或增殖过程中还可以延长,可能与感染力或

毒力有关,但是有研究表明,只有2个C的毒株也具有感染性[20]。PKs中最

后一个PK的保守性最高,保守序列为AGUAAAA。分析发现,在PKs和Cre之

间的一段较长序列相对保守,可能与维持PKs和Cre 2个茎结构的稳定有关。5′

-UTR区最保守的序列大多集中在IRES区,如Cre位点(AAACA)、PTBP结

合位点(UCUUUC)、GNRA、CRAAA、C-rich位点(ACCC)、eIF4G 结合

位点(GCUAA)、A bulge(AAAAA)、eIF4B结合位点(ACCGGAG)等。另

外,还发现了大量新的保守性较高的序列,在这些序列中大部分组成了IRES区,

可能参与蛋白质翻译调控,但具体功能未知,有待进一步研究。

3′-UTR区由2个茎环结构构成,第1个茎比较短,环比较大,第2个茎比较长,

环比较小[21]。在这一区域同样存在保守序列,如UCCCCA、UGNGG、

GGAGUGAAAA、UUNUC。前2个序列和后2个序列分别是反向互补序列,能

形成2个茎结构,可能与病毒的复制相关[22]。

通过对249株口蹄疫病毒的基因组进行序列比对,并分析它的基因组结构特征,

发现在大量的保守序列中,存在一些新的功能未知的高度保守序列,这些序列在病

毒生命活动中是否起到了某些关键性的作用,也许是防制病毒的潜在的靶位点。本

研究结果为利用针对高度保守序列设计的小干扰RNA(siRNA)来研究抗口蹄疫

病毒奠定了基础,对口蹄疫病毒疫苗的研制、抗病毒药物的研发以及抗病转基因动

物的研究提供了重要的生物信息。

参考文献:

[1]刘新生,王永录.口蹄疫病毒株AF/72结构蛋白VP1克隆及其T细胞表位

预测[J].华北农学报,2010,35(5):25-32.

[2]Mason P W,Grubman M J,Baxt lar basis of pathogenesis

of FMDV[J].Virus Res,2003,91:9-32.

[3]Domingo E,Baranowski E,Escarmis C,et -andmouth

disease virus[J].Comp Immunol Microbiol Infect Dis,2002,25:297-

308.

[4]张显,王永录,张永光,等.口蹄疫病毒结构蛋白VP1上B细胞表位的筛选

鉴定[J].华北农学报,2009,34(5):81-85.

[5]Lyons T,Murray K E,Roberts A W,et irus 5′-terminal

cloverleaf RNA is required in cis for VPg uridylylation and the initiation of

negative-strand RNA synthesis[J].J Virol,2001,75:10696-10708.

[6]Barton D J,O′Donnell B J,Flanegan J B.5′cloverleaf in poliovirus

RNA is a cis-acting replication element required for negative-strand

synthesis[J].EMBO J,2001,20:1439-1448.

[7]Mason P W,Pacheco J M,Zhao Q Z,et isons of the

complete genomes of Asian,African and European isolates of a recent

foot-and-mouth disease virus type O pandemic strain(PanAsia)[J].J

Gen Virol,2003,84:1583-1593.

[8]Murray K E,Steil B P,Roberts A W,et ation of poliovirus

RNA with complete internal ribosome entry site deletions[J].J Virol,

2004,78:1393-1402.

[9]Steil B P,Barton D -active RNA elements(CREs)and

picornavirus RNA replication[J].Virus Res,2009,139:240-252.

[10]Carrillo C,Tulman E R,Delhon G,et ative genomics of

foot-and-mouth disease virus[J].J Virol,2005,79:6487-6504.

[11]Garcia-Arriaza J,Ojosnegros S,Davila M,et cs of

mutation and recombination in a replicating population of complementing,

defective viral genomes[J].J Mol Biol,2006,360:558-572.

[12]George M,Venkataramanan R,Pattnaik B,et ce analysis

of the RNA polymerase gene of footand-mouth disease virus serotype

Asia1[J].Virus Genes,2001,22:21-26.

[13]Berryman S,Clark S,Monaghan P,et events in integrin

alphavbeta6-mediated cell entry of footand-mouth disease virus[J].J

Virol,2005,79:8519-8534.

[14]Thomas A A,Rijnbrand R,Voorma H ition of the

initiation codon for protein synthesis in footand-mouth disease virus RNA

[J].J Gen Virol,1996,77:265-272.

[15]Belsham G initiation sites of protein synthesis on foot-and-

mouth disease virus RNA are selected following internal entry and

scanning of ribosomes in υi-υo[J].EMBO J,1992,11:1105-1110.

[16]Cao X,Bergmann I E,Fullkrug R,et onal analysis of the

two alternative translation initiation sites of foot-and-mouth disease

virus[J].J Virol,1995,69:560-563.

[17]Domingo E,Escarmis C,Baranowski E,et ion of foot-

and-mouth disease virus[J].Virus Res,2003,91:47-63.

[18]Lewis-Rogers N,McClellan D A,Crandall K evolution of

foot-and-mouth disease virus:impacts of recombination and selection

[J].Infect Genet Evol,2008,8:786-798.

[19]Liu Y,Franco D,Paul A V,et ne 3of poliovirus terminal

peptide VPg(3B)has an essential function in RNA replication in the

context of its precursor protein,3AB[J].J Virol,2007,81:5669-5684.

[20]Rieder E,Bunch T,Brown F,et cally engineered foot-

and-mouth disease viruses with poly(C)tracts of two nucleotides are

virulent in mice[J].J Virol,1993,67:5139-5145.

[21]Saiz M,Gomez S,Martinez-Salas E,et on or substitution

of the aphthovirus 3′NCR abrogates infectivity and virus replication[J].J

Gen Virol,2001,82:93-101.

[22]Sharma N,O′Donnell B J,Flanegan J B.3′-Terminal sequence in

poliovirus negative-strand templates is the primary cis-acting element

required for VPgpUpU-primed positive-strand initiation[J].J Virol,

2005,79:3565-3577.

[23]Rodriguez Pulido M,Sobrino F,Borrego ated foot-and-

mouth disease virus RNA carrying a deletion in the 3′noncoding region can

elicit immunity in swine[J].J Virol,2009,83:3475-3485.