2024年6月11日发(作者:)
如何在genbank中查找一基因的序列
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有
公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注 释
的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发生学划分,另
外一些则按照生成这 些序列数据的技术方法划分。目前GenBank中所有的记录
均来自于最初作者向DNA序 列数据库的直接提交。这些作者将序列数据作为论
文的一部分来发表,或将数据直接公开。GenBank由位于马里兰州Bethesda的
美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库
(DDBJ)以及欧洲生物信 息研究院的欧洲分子生物学实验室核苷酸数据库
(EMBL)一起,都是国际核苷酸序列数据库合作的成员。所有这三个中心都可
以独 立地接受数据提交,而三个中心之间则逐日交换信息,并制作相同的充分
详细的数据库向公众开放(虽然格式上有细微的差别,并且所使用的信息系统也
略有不同)。
GenBank数据库格式的详细说明
/Sitemap/
1
、在GeneBank中查找基因序列只要输入accession号就可以了,如果你没有
accession号,可以把你手头的编号用source等信息源转换成accession号。
2、关于在GeneBank中查找序列我有几点体会:
最直接、最简单的方法是手头有基因的accession号;
如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉
丁全名),基因名称尽可能详细,避免搜出一些不相关的信息;
搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属
于NCBI工作人员重新整理过的Refseq的序列,这样会比较可靠;.
其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物
最好有起始密码子和终止密码子;
3、如何在genbank查找某个细菌的基因序列?
输入这个细菌的名字直接查,一般就会找到,而且一般第一个会是全基因组序列。
进入ncbi的首页,database选nucleotide,输入你的关键词,如果库里收录里
就会找到。
4、如何查找基因序列?——在Genbank中寻找目的基因的实例
(1) 根据文献
如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在
Genbank中的ID号,那就好办了,直接打开 ,在
Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框
中,点“GO”,就可以找到他了。
举例说明,例如:在2003年JBC的文章(Conditional Knock-out of Integrin-linked
Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出
现了“calreticulin (GenBank accession number gi 16151096)”,那么把
“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包
括基因序列等相关信息)。
在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586就可以
看到基因的相关信息了...(呵呵,是不是有点太......easy了)
这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,
里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多
说了。
(2)点击 AY047586后出现的界面如下:
如果只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样
就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。
这就是FASTA格式的序列:
如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名
称是人的VEGF基因,那么怎么在Genbank中找到它呢?
打开/
在search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称
“VEGF”,点击GO
搜索结果出来了总共689条,哪一条是我想要的基因呢?
点击箭头所指的Limits
Limits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能
大大精简查询结果。我们接着来,在Limits这个界面,先选择查询的限定范围。
我们要找什么基因来着?想起来了,是人的VEGF基因,那就开始选择:先选
Gene name(基因名称);然后再选择Limit by Taxonomy(生物分类限定)中的
Homo sapiens(人类),然后再点击“GO”,只有一个结果这就是我们要找的基因
了。
直接点击基因名称“VEGFA”就可以看到有关基因的信息了。
需要指出的是,在Genbank中,基因有很多别名(Aliases),和Genbank中记
录的名称有可能不一致。比如在这里,VEGFA是Genbank中记录的基因名称,
而它还有很多别名,比如MGC70609, VEGF(这就是我们要找的基因名称 ),
VEGF-A, VPF;


发布评论