2024年6月11日发(作者:)

如何在genbank中查找一基因的序列

GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有

公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注 释

的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发生学划分,另

外一些则按照生成这 些序列数据的技术方法划分。目前GenBank中所有的记录

均来自于最初作者向DNA序 列数据库的直接提交。这些作者将序列数据作为论

文的一部分来发表,或将数据直接公开。GenBank由位于马里兰州Bethesda的

美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库

(DDBJ)以及欧洲生物信 息研究院的欧洲分子生物学实验室核苷酸数据库

(EMBL)一起,都是国际核苷酸序列数据库合作的成员。所有这三个中心都可

以独 立地接受数据提交,而三个中心之间则逐日交换信息,并制作相同的充分

详细的数据库向公众开放(虽然格式上有细微的差别,并且所使用的信息系统也

略有不同)。

GenBank数据库格式的详细说明

/Sitemap/

1

、在GeneBank中查找基因序列只要输入accession号就可以了,如果你没有

accession号,可以把你手头的编号用source等信息源转换成accession号。

2、关于在GeneBank中查找序列我有几点体会:

最直接、最简单的方法是手头有基因的accession号;

如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉

丁全名),基因名称尽可能详细,避免搜出一些不相关的信息;

搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属

于NCBI工作人员重新整理过的Refseq的序列,这样会比较可靠;.

其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物

最好有起始密码子和终止密码子;

3、如何在genbank查找某个细菌的基因序列?

输入这个细菌的名字直接查,一般就会找到,而且一般第一个会是全基因组序列。

进入ncbi的首页,database选nucleotide,输入你的关键词,如果库里收录里

就会找到。

4、如何查找基因序列?——在Genbank中寻找目的基因的实例

(1) 根据文献

如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在

Genbank中的ID号,那就好办了,直接打开 ,在

Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框

中,点“GO”,就可以找到他了。

举例说明,例如:在2003年JBC的文章(Conditional Knock-out of Integrin-linked

Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出

现了“calreticulin (GenBank accession number gi 16151096)”,那么把

“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包

括基因序列等相关信息)。

在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586就可以

看到基因的相关信息了...(呵呵,是不是有点太......easy了)

这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,

里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多

说了。

(2)点击 AY047586后出现的界面如下:

如果只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样

就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。

这就是FASTA格式的序列:

如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名

称是人的VEGF基因,那么怎么在Genbank中找到它呢?

打开/

在search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称

“VEGF”,点击GO

搜索结果出来了总共689条,哪一条是我想要的基因呢?

点击箭头所指的Limits

Limits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能

大大精简查询结果。我们接着来,在Limits这个界面,先选择查询的限定范围。

我们要找什么基因来着?想起来了,是人的VEGF基因,那就开始选择:先选

Gene name(基因名称);然后再选择Limit by Taxonomy(生物分类限定)中的

Homo sapiens(人类),然后再点击“GO”,只有一个结果这就是我们要找的基因

了。

直接点击基因名称“VEGFA”就可以看到有关基因的信息了。

需要指出的是,在Genbank中,基因有很多别名(Aliases),和Genbank中记

录的名称有可能不一致。比如在这里,VEGFA是Genbank中记录的基因名称,

而它还有很多别名,比如MGC70609, VEGF(这就是我们要找的基因名称 ),

VEGF-A, VPF;