2024年4月27日发(作者:)
DNAstar
中文使用说明书
目录
DNAStar的安装与升级„„„„„„„„„„„„„„„„„„.„.6
EditSeq的使用方法„„„„„„„„„„„„„„„„„„„„„.7
打开已有序列
寻找开放读框
DNA序列翻译
遗传密码选择使用
遗传密码修改
序列的反向互补及反向转换
BLAST检索
序列信息查看
序列校读
序列的保存与输出
GeneQuest的使用方法„„„„„„„„„„„„„„„„„„„„12
打开已有分析文件
GeneQuest的DNA分析方法
用分析方法操作
方法参数改变
结果展示优化
Feature注释
BLAST检索
Entrez Database检索
GeneQuest的其他特点
保存分析文件
1
MapDraw的使用方法„„„„„„„„„„„„„„„„„„„„„18
新酶切图制作
过泸器类型
应用频率过泸器
应用手动过泸器
使用过泸器一览表
使用Must Cut Here/Don’t Cut Here调色板工具
酶信息显示
环形展示
ORF图
显示择选
保存,退出
MegAlign的使用方法„„„„„„„„„„„„„„„„„„„„.23
创建队列文件
序列设置
Pairwise Alignment
使用 Dot Plot Method
多序列比较
Phylogenetic Tree查看
查看队列报告
Decorations/Consensi
MegAlign文件保存
PrimerSelect的使用方法„„„„„„„„„.„.„„„„„„„.28
创建PrimerSelect文件
定义引物特点
查找引物对
浏览其他的引物信息
按特征对引物分类
引物长度改变
在引物中引入突变
设计新引物
使用寡核苷酸订购表格
保存PrimerSelect文件
Protean的使用方法„„„„„„„„„„„„„„„„..„„„„34
创建蛋白质分析文件
Protean’s蛋白质分析方法
应用分析方法
方法参数改变
优化结果显示
使用蛋白酶消化与SDS PAGE
Feature注释
BLAST检索
二级结构模拟
展示滴定曲线
2
保存分析文件
SeqManII的使用方法„„„„„„„„„„„„„„„„.„„„„39
输入序列片段
Pre-Assembly Options操作
检查修整的数据
序列装配
查看范围和构建结果
去除矛盾碱基和缺口
手动修改序列末端
文件保存与序列输出
3
EditSeq的使用方法
EditSeq是能够迅速、正确地输入,并且修改DNA或蛋白质序列工具。每个
EditSeq文件都可以分为三个可编辑的部分,上边的一部分为序列文件,中间的
一部分里是评论,底部是序列的注释。
EditSeq能读取大部分的序列格式——包括FASTA,GenBank,ABI、GCG和
ASCII格式。你可以使用菜单命令或拖拽方式输入序列文件。另外, 序列也许
通过使用键盘输入,或者从其他地方复制、粘贴得到。经Entrez或BLAST检索
得到的序列可以直接从因特网或企业内部互联网服务器下载。
序列被打开后,EditSeq能使用标准或者指定的遗传密码进行翻译,或者反
翻译,寻找开放读框,还可以进行阅读校对。另外, EditSeq能以GenBank,FASTA
和GCG格式输出序列。
如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,
传真:(608)258-7439,电子信件:support@,或者经
.
打开已有序列
我们从用苹果计算机打开“TETHIS21MA”和用Windows打开“”开
始。
假设序列的末尾有载体序列污染。我们在用EditSeq打开序列的同时,用Set
Ends命令去除5’和3’污染序列。
从文件菜单(FILE MENU),选择Open。
打开文件夹“Demo Sequences”单击选定序列“TETHIS21”。
单击位于对话框右下角的Set Ends按钮。Set Ends被打开(如右)。
在5’框和3’框中键入50和850,点击OK。
单击Open打开序列。
当EditSeq窗口打开时,序列长度显示在右上角。
通过“setting ends,”现在你只有最初序列中的
801 bp的片段。Set Ends选择在全部Lasergene
应用程序中都可以使用。
4
寻找开放读框
在这入门的一部分中,我们将确定序列
中最大的ORF,并翻译它。
从SEARCH MENU找到ORF,点击打
开会出现右边的对话框。
单击Find Next寻找第一个ORF的
位置。
继续点击Find Next直到你把ORF的位置选定在位置183-455。ORF的坐标
会出现在EditSeq窗口的顶端附近。
DNA序列翻译
这一节中我们介绍如何翻译我们的ORF,不过任何
序列中的读框内部分都可以用下面的方法进行翻
译。如果你的选择是在三联码的读框内,三联码指
示棒显示为实心黑线(如左图)。如果你的选择是
不在三联码的读框内,左边的箭头和右面的箭头显
示向左或向右移动
一个bp,以使所选
序列成为三的倍
数。
选定ORF,从GOODIES MENU菜单中选择翻译
(Translate)。
翻译的蛋白质序列出现在一个新的未命名窗
口中(如右图)。它是使用标准的遗传密码翻
译的。
使用其它遗传密码
根据你的序列的来源,你可以选择使用非标准的遗传密码进行翻译等操作。在这
节中,我们将标准的遗传密码转换成Ciliate Macronuclear密码 。
5
从GOODIES MENU菜单选择Genetic Codes打开,子菜单显示如下。
单击“Ciliate Macronuclear”就实现了遗传密码的转换,EditSeq现在使
用的就是Ciliate Macronuclear的遗传密码。
同样可以将遗传密码转换为其它类型。
遗传密码的编辑
这一节中我们修改Ciliate Macronuclear的遗传密码。
从GOODIES MENU菜单选择Edit Selected Code。这将打开右面的窗口,窗
口显示遗传密码是怎样翻译DNA和RNA序列的。
如以DNA形式展示密码,点击DNA按钮。
编辑时,单击任何要编辑的密码,从其目前的位置拖到新氨基酸对应的位置
则可。
如使用不同的启始密码子,单击Set Starts按钮。第二的遗传密码窗就会
被打开,可以进行起始密码子选择。
单击任何氨基酸(或者codon位置),该密码子就会变成绿色,而且旁边出
现一个箭头,它就被设定为起始密码子了。如要去除,只需单击它即可。如
不保存,则单击取消;如要保存,单击保存为。
序列的反向互补及反向转换
下面的步骤可以用于反向测定的序列的正确输入。
选定序列。
从GOODIES MENU菜单,选反向互补序列(Reverse Complement),或者把序
列颠倒过来(Reverse Sequence)命令,则被选定的序列就被翻转互补或翻
转过来了。
BLAST检索
下面我们将在NCBI的BLAST服务器上对TETHIS21序列进行相似性比较。注意为
了进行BLAST查找必须保证因特网的连接。如果你没有连接因特网,跳过这部分,
继续下一部分。
选定序,或者从EDIT菜单中选择Select All。
从网络检索菜单(NET SEARCH
6
MENU),选择BLAST查找。BLAST对话框就会出现。
程序默认为blastn,数据库默认是nr,参数转换请参照帮助。
单击OK开始查找。
寻找结果显示为两部分(如下)。上边的部分是按可能性的顺序显示检索到
的序列的名字,下面的部分显示上面部分选定序列与提交序列(上边序列)
比较的具体结果。有关
“score”和
“expectation”的详细的
信息在NCBI’s网点——
/BLAST.——可以找
到。一般来说,更主要的
score和更低的
expectation提示较好的
相似性。
BLAST结果窗最上边的3钮被用来打开,或者保存检索到的序列,或者让你
了解更多的有关信息。
下面我们从用“Create Document”钮来
打开评分最高的5序列开始:
单击Create Document。一个小的对
话框出现。
在左上角有一个下拉菜单显示默认(default)。单击下拉菜单,选顶端(Top)。
并在右面的文本框中写入5。
单击OK,EditSeq自动查对多余序列。如果EditSeq提示至少2序列是同一
个,请点击OK。EditSeq将从因特网数据库下在单一的序列,并分别打开一
个单独的EditSeq窗口。
下面我们用“Batch Save”钮将3-10序列保存为EditSeq文件:
选定从顶端起第3个序列。单击Batch Save。小的灰色的对话框出现。
单击下拉菜单,选Next。并在右面的文本框中写入8。
点击Set Location,显示文件夹对话框。
选定你要保存序列的位置。单击OK回到灰色的对话框。
单击OK保存序列,文件扩展为“.seq”。在下载过程期间,EditSeq自动查
对重复的序列。如果EditSeq提示至少2序列是同一个,请点击OK。
除非你收到错误信息,否则可以认为你的序列已经成功下载。
最后我们可以使用
“Launch Browser”钮查
看序列的详细信息
选定序列。
选择Launch
Browser。
你的网络浏览器将
7
打开右面的窗口。
序列信息查看
现在我们要使用EditSeq菜单指令查看有关打开的TETHIS21序列的信息。
选定序列的一部分。如果你倒是希望全选序列,从EDIT MENU菜单,选择
Select All。
从GOODIES MENU菜单,选DNA
Statistics。就会出现右面的窗口,
显示序列信息。
序列校读
在我们学习保存和输出序列之前,下熟悉
一下EditSeq的校读功能
这功能能帮助你校正测序胶中的错读。
选定序列。
单击校对发音图标(序列窗口底部张
开的嘴),或者从SPEECH MENU,选Proof-Read Sequence。
电子的音声就会开始朗读所选的序列。(注:如果你听不见任何声音,检查
你的计算机的喇叭是否已经打开。)
要改变音声read-back的速度,从SPEECH MENU菜单,选择Faster or Slower。
要停止校读,点击图标(手),或者从SPEECH MENU菜单,选择Proof-Read
Sequence。
序列的保存与输出
首先创建一个用于保存的序列。从文件菜单,选New中的New DNA,或者New
Protein。
将序列写入出现的窗口。
如果你输入非法字符,计算机会发出警告。
然后,我们将序列保存为EditSeq文件:
从文件菜单,选Save。
选定保存位置。
给序列命名。
单击保存则可。
以GenBank或GCG格式保存序列:
从文件菜单,选Export。
选定保存位置。
为sequence(s)选格式。
给sequence(s)命名。
单击保存则可。
以FASTA格式保存序列:
从文件菜单,选Export(1个序列),或者Export All As One(多个序列)。
当使用Export All As One的时候,如果DNA和蛋白质文件同时存在,激活窗
口的序列类型与你保存的类型是一致的。EditSeq仅仅将写入的序列保存为
FASTA格式。
8
选定保存位置。
选FASTA格式。
给sequence(s)命名。
单击保存则可。
9
GeneQuest的使用方法
GeneQuest可以帮助你发现和注释DNA序列中的基因,并帮助您操作生物学
所关心的DNA的其他feature:包括ORFS、拼接点连接,转录因子结合为点、重复
序列、限制性内且酶酶切位点等。通过应用“methods”到序列,序列的feature
可以以图形的形式展示出来。你可以在序列上注释任何你发现的feature。和其
它的Lasergene应用程序一样,GeneQuest也提供整合的BLAST和Entrez寻找功能。
GeneQuest能直接打开DNASTAR,ABI和GenBank文件。其他格式的序列文件
也可以使用EditSeq改为DNASTAR格式。如果你知道Genbank序列的登录号或名称,
你可以直接打开序列。另外,你还可以在Entrez数据库进行序列查找和输入。
如果在使用这软件中需要帮助,可以和DNASTAR联络。电话:(608)258-7420,
传真:(608)258-7439,电子信件:support@,或者经
.
打开已有分析文件
在这一节中,我们将对已有的GeneQuest文件(也叫做GeneQuest分析)“Nematode
R01H10.”进行操作。
从文件菜单,选择Open打开一个和右边相似的窗口。
在苹果计算机上,从Show菜单中选择GeneQuestDocument文件。在Windows上,
从文件类型菜单(Files of Type)的中选择GeneQuest Documents。
用文件管理系统打开名为“Demo Sequences.”的文件夹。双击Nematode
R01H10,就可以打开下面的窗口。
GeneQuest的DNA分析方法
10
打开GeneQuest文件后,下一步是选择应用方法。应用方法后,结果的图形显示
可以帮助你了解序列上感兴趣的features。打开序列后,你会发现只有几种方法
应用后的结果展示在窗口内。在下一部分中,我们将学习如何把其它方法用于我
们序列的分析。
Title——给文件取名。
Ruler——在文件中加入标尺。
Sequence——显示文件中的序列。
Patterns-Matrix——方法的运算参数。
Patterns-Signal——转录因子结合位点数据库。
Patterns-Type-In Patterns——使用键盘输入运算所需的Pattern参数。
Repeats-Inverted Repeats——寻找反向重复序列。
Repeats-Dyad Repeats——寻找Dyad重复和palindromes。
Repeats-Direct Repeats——寻找正向重复序列。
Gene Finding - DNA Finder————在打开的DNA序列中寻找指定DNA序列。
分别显示正义连和反义连的寻找结果。
Gene Finding - Protein Finder——在打开的蛋白质序列中寻找指定DNA序
列的翻译序列。显示结果为全部6个读框。
Enzymes-Restriction Map——用DNASTAR酶目录中的酶分析打开的序列,并
以图形方式展示。
Coding Prediction - Borodovsky——用Borodovsky’s Markov方法来识别
潜在的基因编码区,并以图形方式展示。
Coding Prediction - Starts Stops ORFs——根据指定的ORFs的最小长度,
寻找可能的开放读框,可以选择是否需要起始密码子。读框的启始和中止点
分别展示。
Coding Prediction—Local Compositional Complexity——根据Shannon信
息学原理寻找有基因编码提示信息的区域。
Base Contents-Base Distribution——序列上4种碱基、A+T和G+C的频率、
分布,以及AT和gc分布区域。
Bent DNA - Bending Index——DNA折叠预测。
用分析方法操作
调用新的GeneQuest方法的步骤是:从More Methods中选择方法,加入方法帘
(method curtain),待方法运行完毕后,选择性的拖取结果放入分析界面(assay
surface)即可(见右图)。在本节中,我们使用Bent DNA - Bending Index方
法进行分析。
从ANALYSIS
MENU选择Show
Available
Methods可以打
开方法帘,也可
以通过拖动分
析界面左上角
的小环的打开
方法帘。方法帘
中包括已经用
11
于分析的全部方法。
你将注意到方法帘没有Bent DNA - Bending Index method。在方法帘的顶
端,点击More Methods打开一个下拉菜单,其中尤可以用于分析的所有方法,
点击Bent DNA - Bending Index method,该方法就进入了方法帘。
若查看方法帘中的方法是否已经被应用,点击其右边的三角形。如果图标前
有数字表明该方法已经使用,数字表示应用的次数。因为我们还没有应用
Bent DNA - Bending Index,所以点击三角形,会发现图标前没有数字。
点击白颜色的位置去除对图标的选择。
单击选定“Bend Region,”,将其拖到分析界面,释放鼠标。序列中可能会
折叠的区域就会以小盒子的形式显示出来。
方法参数改变
下面我们改变方法的参数,然后将分析结果与参数改
变前的结果进行比较。
重复前面的操作,在方法帘中加入一个新的Bent
DNA - Bending Index,并把它拖如分析界面。现在你应该有2个完全一样的
折叠区分析结果。
双击方法帘中任何一个结果,将打开一个参数对话框。
改变弧长度参数为30,单击OK。分析界面上就会出现根据此参数计算得到的
结果。
(注:如果你再次拖入新的方法时,参数的改变会自动应用到新的方法上)。
结果展示优化
组合或移动展示的结果:单击位于GeneQuest窗口左侧的调色板工具中的的
选择器(手图标),在分析界面中可以随意拖动任何展示的结果到任何位置。
改变方法格式:单击目的选择器(手图标),可以选择分析界面上的任何方
法。从OPTIONS MENU菜单选择Line Color,打开彩色选择子菜单。选定颜色
后,方法题目和结果显示都将变成那个颜色。另外,你可以用类似的指令进
行操作:Line Weight、 Fill Color and Fill Pattern。
去除方法:单击选择方法帘中显示的方法,用退位或删除键去除应用的方法
即可。
注意任何你除掉的方法都是能从Methods menu菜单再一次被使用。
注释Features
当你用Genbank输入序列时,序列中标注的Features会自动转换为图形命令显示
在方法帘中。这些Features 可以象任何别的方法那样拖到分析界面上显示。
GeneQuest也允许你为你的DNA序列制作新Features:
单击位于GeneQuest窗口的左侧的调色板工具(箭图标)。
然后点击选定2641-4257的
Informative Region。
点击调色板工具(铅笔图标),
或者从SITES & FEATURES MENU
选择New Featur,打开一个
12
Feature Editor对话框(如右图)
你打开Feature Editor时,首先进入Location设定。点击“Info region”
进入Title box,点击“Segment A”进入Segment Name box,接着,在对话
框的底部选择标题和区段名字的位置。
点击Description按钮进入新的Feature Editor窗口。如果你愿意,可以在
note中对Feature做标注,在key种选择Feature的种类。
点击Style按钮进入最后的Feature Editor窗口,选择字型,大小和颜色,
以及你喜欢图型用于新建的feature。
点击OK关闭Feature Editor窗口。一个图形化展示的“Info region”就会
出现在分析窗口的底部。
下面我们把新建的feature与另外一个feature整合起来。
单击调色板工具(箭图标)。选定你刚做好的feature,单击工具调色板工
具上的(链图标)。
然后点击名为“R01H10.4——CDS.”的feature,再点击连接(链图标)。
这样你的“Info region”featur将继续作为没有联系的方法而存在,但是,
它的拷贝将作为R01H10.4featur的一部分出现。
BLAST检索
GeneQuest为你的序列在因特网或企业内部互联网数据库上进行相似性检索提供
2不同的方法。BLAST Selection指令允许你使用序列的任何一部分进行检索。
BLAST ORF需要你首先选择序列的ORF,然后他就可以自动翻译,在蛋白质数据库
中进行检索。在这一节中,我们用BLAST在NCBI上检索与Nematode R01H10相似的
序列。
注意必须保证您的计算机与因特网相连。否则,跳过这一部分。
单击范围选择器调色板工具(箭图标)。
如同在右边被显示的那样,单击任何“R01H10.5”的feature。注意此时选
定的仅仅是外显子部分(exons),内含子部分被自动去除。
从网络检索菜单,选BLAST Selection。会出现左面的BLAST对话框。
不做参数改变,这样,程序是
blastn,数据库是nr。
单击同意开始查找。
寻找结果显示为两部分(如下)。上
边的部分是按可能性的顺序显示检
索到的序列的名字,下面的部分显示
上面部分选定序列与提交序列(上边序列)比较的具体结果。有关"score"和
"expectation"的详细的信息在NCBI's网点
--/BLAST.--可以找到。一般来说,更主要的score
和更低的expectation提示较好的相似性。BLAST结果窗最上边的4钮被用来打开,
或者保存检索到的序列,或者
让你了解更多的有关信息。
“Put In Document”按钮相
当于Gene Finding - DNA
Finder,在打开序列中寻找检
索到的序列。(如果我们使用
13
blastp或blastx,则相当于Gene Finding-Protein Finder)
在BLAST结果窗口中选择一个检索结果。
单击Put In Document。保存对话窗将打开。
选定保存位置,并命名。单击保存。
你选的序列将象应用方法那样以短的垂直的竖线自动出现在分析界面的底
部。垂直的竖线显示BLAST结果的位置。
可以选择Zoom in/OUT来放大或缩小视野。直到你能清楚地查看序列。
其他按钮与EditSeq中介绍的功能相同。
Entrez Database检索
GeneQuest允许你在因特网或企业内部互联网的Entez数据库上进行检索。检索到
的结果可以输入GeneQuest(或者EditSeq),或者保存为序列文件。在这一节中,
我们将检索与狨视觉色素(visual pigment in marmosets)序列有关的序列,
然后学习GeneQuest或EditSeq是如何打开其中的一个序列的。
从网络检索菜单(NET SEARCH MENU),选择新正文查找(New Text Search)
来打开Entrez Query窗口(如右)。
在文本框中敲入
“visual
pigment.”。
从默认为“All
Fields”的下拉菜单
中选择“Text
Word.”。
用鼠标从右面再拖
入一个检索框(New
Term)。
在文本框中敲入“Callithrix”,从“New Fields”菜单中选“Organism”。
单击查找。查找结果出现于Entrez Results窗口(如下)。
双击任何Entrez Results窗口里的序列,就可以查看其详细信息。
如果你想在GeneQuest或EditSeq里打开其中的一个序列:
从Entrez Results窗,单击你想打开的序列。
从网络检索菜单,选择用GeneQuest或者EditSeq打开(Open with
GeneQuest/Open with EditSeq)。
选定文件保存的位置,并给文件取名。单击同意(视窗),或者保存(苹果
计算机)。
如果你选择以GeneQuest打开文件,GeneQuest将打开文件并且将其默认的方法自
动应用到序列上。如果你做选择以EditSeq打开文件,Entrez序列将在主窗口中
显示。
14
GeneQuest的其他特点
以RNA折叠形式查看序列的一部分:
选定目的序列,在ANALYSIS MENURNA菜单中选择Fold as RNA命令。
序列酶切,模仿agarose凝胶电泳判定大小:
打开方法帘(method curtain)。
从More Methods中选择Enzymes - Restriction Map 加入方法帘。
单击图标左边的蓝色三角形,打开内切酶一览表。注意方法帘仅仅显示那些
最少切割一次DNA序列的酶。刚打开酶一览表时,所有的酶都被选中了,在
空白处单击一下去除选定。
选定特定的酶,拖入分析界面,即可以看
见该酶的酶切位点在序列上的位置。
从SITES & FEATURES MENU菜单选泽
Agarose Gel Simulation。
新窗口即显示酶切片段在
electrophoretic的分离情况(如图)。
保存分析文件
从文件菜单,选保存。
选定文件的保存位置。给文件命名。
单击保存。
你所应用和展示的所有信息都会被保存。
15
MapDraw的使用方法
根据实验设计,分析和实验结果的展示需要的不同,MapDraw可以制作6种类
的酶切图。从简单的线性图到有注释的环形图,在展示限制性酶切位点的同时,
还可以同时展示序列的feature,六个读框及其翻译结果。MapDraw也以自动展示
从GenBank输入序列的features。
你可以按照位置、酶切频率等来排列你的酶切位点。另外, 你可以用手工
选任何酶切位点的结合。酶切位点过泸器(filters)也可以使用Boolean
operators联合使用。
MapDraw工具能使你规划酶切位点和克隆实验,产生详细,充分地结果概括。
和全部Lasergene应用程序一样,MapDraw也提供整合的BLAST查找功能。
新酶切图制作
我们以组氨酸DNA序列“TETHIS21MA”(苹果计算机)和“”(视
窗)为例。首先我们寻找能够切割组氨酸DNA序列的酶切位点。
从文件菜单选择New打开右边的对话框。
打开“Demo Sequences.”文件夹。
双击打开TETHIS21(见下)。
16
过滤器类型
过泸器(filter)是你定义的可以使用的酶切位点的集合。在你自定义过泸器之
前,所有酶切位点都会用于序列分析。你可以用和/或来组合过泸器。
MapDraw内置的过泸器如下:
Overhang过泸器是根据一套你定义的Overhang准则归类的酶切位点。这些准
则包括3’和5’端突出,与别的酶切位点互补以及兼并的末端突出。克隆试
验中,可以使用这个过滤器寻找互补末端。
频率(Frequency)过泸器是指根据出现于指定的范围序列上的频率归类的
酶切位点。我们将在本节的下一部分中使用这个过泸器型。
种类和复杂性过泸器(Class & Complexity)是根据酶切位点种类归类的酶
切位点。这些种类包括:I型(随机)把II型(明确),或者I型+II型。这
过泸器也可以根据位点复杂性、价钱和来源进行归类。
手动选择过泸器(Manual Pick)允许你按需要选定酶切位点。在随后的一
部分中,我们学习使用手动选择过泸器的方法。
Must Cut Here/Don’t Cut Here调色板工具也是一种过滤器,随后进行阐
述。
频率过泸器应用
首先让我们用频率过泸器来删除任何可以两次切割我们序列的酶。
从ENZYME MENU,选New Filter,然后Frequency打开参数对话框。
在Min和Max对应的框中输入数字1和2,其他的参数不变。这个设定将我们序
列中切割多于两次的位点自动删除。
在过泸器名字框中,输入“Two-cuts-max.”。
单击Apply将过泸器用于序列分析——然后OK退出参数对话框。你将注意到
在图上酶切位点的数目现在大大地减少了。
应用手动过泸器
虽然减少了大约3分之2的位点,但是还有100以上的酶存在。我们还可以设定一
些更严紧的命令进行限制。看一看我们的酶是否能整齐地用来切割TETHIS21序列
的编码区。
从MAP MENU选Linear Minimapp。打开的窗口显示每个限制酶切割位点的位
置。
滚动窗口,直到你看到大的向右的箭头,上写“histone”。“Histone”是
在最初的Genbank入口被注释的序列特点。当我们打开它的时候,这个特点
和序列一起输入。
单击选定它。
在屏幕的左上
单击种类调色
板工具(Sort),
接着选择Sort
by Cuts Close
to Selection。
酶切位点即刻
分类,这样,距
17
特点最近而且超出选定范围的酶切位点将会排在最上面。
滚动到窗口的最顶端。你将注意到,在histone基因的左和右有2酶切位点:
Acs I和Apo I。两个酶切位点对我们来说都是理想的。
现在我们将制作仅仅包括Apo I酶切位点的Manual Pick filter。
从ENZYME MENU,选New Filter——然后Manual
Pick。打开酶切位点过泸器编辑器。
把Apo I从右边的窗口拖进左边的窗口。给过泸
器取名。在这我们把过泸器叫做“Apo I.”。
点击Apply——然后OK,就保存并应用“Apo I.”
过泸器了。
注意到现在线性的minimap仅仅由Apo I酶切位点
和histone特点构成。
使用过泸器一览表
现在我们已经应用了2个过泸器:一个叫做“Two-cuts-max”的频率过泸器和叫
做“Apo I.”的手动过滤器,MapDraw会自动把两个过泸器的结果用“AND,”联
合起来应用,这样,展示的结果需要满足两个标准:切割一或两次,用Apo I切
割。我们手动过滤器包括频率过泸器的单一切点的内容,所以他自动的覆盖了频
率过泸器的结果。下述过泸器一览表允许我们随意编辑、组合各个过泸器。
从Map Document,单击过泸
器调色板工具(在窗左上的
漏斗图标)打开过泸器一览
表(如下)。当前应用的所
有过泸器都出现于窗口的
左边。
为了除掉Apo I过滤器,点
击选中它,从左窗口拖到右
边的窗口,单击应用即可。现在由于只有Two-cuts-max过泸器被应用,所以
序列上的酶切位点数目立即增加了。
把Apo I过滤器拖回,放在And旁,单击Apply再次应用Apo I过滤器,序列上
的酶切位点数目又立即减少了。(如果把Apo I过滤器拖回,放在Or旁,单
击Apply再次应用Apo I过滤器,序列上的酶切位点数目不会改变,因为Apo I
过滤器是Two-cuts-max过泸器的一部分)。
按上面的方法把两个过滤器都去除。
使用Must Cut Here / Don’t Cut Here调色板工具
Must Cut Here / Don’t Cut Here工具是另一种酶切位点过滤限制方法。我们
将用这个方法再次重复上面的操作。
从MAP MENU,选Site & Sequence。
向下滚动,直到你看在大的向右指的箭头,上写“histone”。
单击选中。点击Don’t Cut Here调色板工具(红色园圈起的剪刀样图标),去
除所有切割选定区的酶切位点。(点击Must Cut Here工具——剪刀样图标——
序列上将展示所有切割选定区的酶切位点。)
这样,仅仅剩下那些不切割选定区的位点。
18
显示酶信息
内切酶编辑器(Enzyme Editor)使你能够查看内切酶的各种相关信息,包括其
名字,识别序列,isoschisomers,种类,价格,销售公司和有效性等详细的信
息。你对这些信息可以进行添加或删除操作。
打开酶编辑窗(如左),双击任意一个酶的
名字。
箭头显示酶识别序列和切割位点。
你可以按照“GeneQuest”上的方法在序列
上添加新Feature,并作注释。
环形展示
你可以以环形图展示环形或线性序列,但是,
如果序列是线性的,MapDraw会提示你。如果你
想在环形序列上进行酶切位点限制,那末,我们前面提到的Don’t Cut Here
filter完全可以做到这一点。
通过点击过滤器调色板工具检查当前是否只有Don’t Cut Here过泸器应用。
如果已经应用,则Don’t Cut Here过泸器应该在过泸器一览表的左边的窗
口里,而其他的过滤器在右边。
如果这不是这样,请进行调整。
从MAP MENU,选择Circular
Illustration,打开左边的窗
口。(如果此时有太多的酶切
位点,你可以加入其他的过泸
器)。
通过OPTIONS MENU的Drawing
Size调整图画的大小。2条红线
相会的角是你可以做的最小图
画的范围。在窗口内点击任何
位置,图形大小将显示为那末
大。
单击同意。
ORF图
从MAP MENU,选ORF Map打开右边显示的六读框的开放读框窗口。默认的终
止和开始
codons可以使
用指定的遗传
密码。方法见
EditSeq。
从OPTIONS
MENU中选择ORF
Criteria可以
设定参数。你能
19
调整最小的ORF长度,定义上游启动子和距上游启动子的距离,选定后单击
同意即可。
放大ORF以查看翻译的序列。方法是点击调色板工具中Zoom In
(有+的图标),接着,单击分析界面。重复这些2步直到你能看翻译。
显示选择
MapDraw’s OPTIONS MENU提供各种指令允许你做下面的事情:
选择1个或3个字母的编码。
显示不同的读框组合(Reading Frames 或 Line Layout)。
编辑用于翻译的遗传密码(Genetic Codes and Edit Selected Code)。酶
显示可以选择垂直或者水平展示。
线性化环形序列(Linearize Sequence)。
显示不确定位点。
保存退出
从编辑菜单(EDIT MENU),选保存地图(Save Map)。
选择保存位置,命名。
单击保存(苹果计算机)或同意(视窗)。
从文件菜单(FILE MEN),选择放弃(苹果计算机)或者退出(视窗),电
脑提示保存或放弃;选择保存,则你操作的所有结果都会保存起来,否则结
果会全部丢失。
20
MegAlign的使用方法
MegAlign提供6列队(aligment)方法,进行DNA和蛋白质序列的配对和多序列
比较(multiple aligment)。多序列比较(multiple aligment)可以在MegAlign 的
worktable进行查看和编辑。可以根据队列(aligment)的结果制作进化树
(Phylogenetic trees),并且,有关序列距离的数据和残基替代可以容易地作
成表格。一般多序列比较(multiple aligment)的结果展示于队列(aligment)窗
口,相似性和差异用彩色的直方图展示。和全部Lasergene的应用程序一样,
MegAlign也提供整合的BLAST查找功能。
创建队列文件
MegAlign提供两种基本的队列方法:配对比较和多序列比较。配对比较可以比较
任何2个选定的序列的相似性,而多序列比较对在Worktable中所有序列进行比
较。在我们入门的第一个部分中,我们将介绍使用2不同的种类的配对比较方法。
我们将从创建一个MegAlign文件,
输入两个histone序列开始。
从文件菜单,选Enter
Sequences打开Enter
Sequences对话框。
从你DNASTAR文件夹中的“Demo
MegAlign,”文件夹,双击打开
“Histone Sequences.”文件
夹,左上两个序列是我们选用
的序列。
单击TETHIS21,点击Add钮。单击TETHIS22,点击Add钮。现在2序列将出现
于右面的窗口。
单击Done把序列输入Worktable。
从OPTIONS MENU,使用Size 命令增加Worktable的字形大小直到可以看清楚。
序列设置
21
下面我们练习subranging输入的histone序列。设置序列的末端在我们这个例子
中并不重要,但是当两个序列匹的全序列匹配不太好,或是蛋白质和DNA的混合
序列时就变得非常重要了。后者要求每个DNA序列都必须是给出正确的翻译读框。
序列设置可以通过给定末端位置手动操作设置,也可以通过特定标注的feature
进行。这里,我们将使用histone H2B-1的CDS进行操作。
点击选中(TETHIS21)。
从OPTIONS MENU,选Set
Sequence Limits,接着,从
Feature Table打开右面的序
列末端设置窗口。
顶端的histone H2B-1-- CDS
feature已经选定。下面显示
的是选定序列的特点名字和
范围。
单击Change the Rest用相同
的feature设置第二histone序列。你将自动回到Worktable,这时,设置后
的序列就出现了。
配对比较(Pairwise Alignment)
MegAlign提供各种配对比较方法。我们序列是DNA,我们可以用的方法是
Wilbur-Lipman,Martinez-Needleman-Wunsch和Dotplot。在这入门中,我们在
使用Wilbur-Lipman的方法。
同时选中两个序列。
从ALIGN MENU中的One
Pair选择Wilbur-Lipman
方法。
使用默认参数进行比较,
点击OK。
MegAlign计算队列,然后在另一个窗口显示比较结果。
窗标题展示相似指数(所右匹配残基的百分比),缺口数目,全的缺口长度和一
致序列长度。我们可以改变标志颜色来区别匹配和不匹配的序列。
单击队列调色板工具(有“x”方框图标),打开下面的队列颜色编辑读化
框。
单击深蓝色的方框,接着点击Match Color右面的黑色
方框,他就变蓝了。所有和一直序列一样的碱基都立即
变成深蓝色。如此重复可以改变不匹配的序列的颜色。
另外,还可以通过选定或不选彩色选择方框下面的方框
查看队列窗口中队列的变化。如你单击Vertical Bars,
则匹配序列间的碱基
变成了垂直的棒。
使用点划分方法(Dot
Plot Method)
点划分方法是先把要比较的序列叠加起
来,然后计算匹配不当的数目。
22
同时选定两个序列。
从ALIGN MENU中的One Pairl里选择Dot Plot打开右面的窗口。
单击OK用默认的参数进行比较。MegAlign计算结果会在另一个窗口显示出
来。
每个匹配都与特定的一组残基有特定的相似性(两个都设计在参数对话框中),
Dot Plot窗口中展示为蓝色。从左侧末端开始的红色斜线,表示两个序列比较的
位置。
双击任意一条蓝色的线会打开左面的窗口,其中显示所选定的序列的比较结
果。
多序列比较
为了在MegAlign中进行多序列比较,
我们选择一个含有十四个相关的钙
调蛋白序列的文件进行操作。使用这
个大的数据库我们可以制作进化树,
了解MegAlign的其他特性。
首先,我们要创建一个包括14
calmodulin序列的新文件:
从文件菜单,选Open打开DNASTAR文件夹的“Demo MegAlign”的文件夹。
双击打开“Calmodulin Alignment”。
从OPTIONS MENU,使用Size命令增加字体大小到看得清楚为止。
现在我们需要选MegAlign’s的两个多序列比较方法中的一个进行操作:Clustal
或者Jotun Hein。如果已知序列有一定的同源性,我们推荐使用Jotun Hein,并
且,如果有关序列相关性的背景未知,可以选择Clustal。我们使用的序列已知
全部是calmodulins,所以,我们使用Jotun Hein方法。
在我们实行队列之前,我们应该选择一个权重
表。MegAlign’s残基权重表用于对多序列比
较进行评分,这样那些虽然残基不匹配,但残
基化学性质相似的序列的评分要比化学性质
不相似的序列的评分要高。我们的序列是蛋白
质,并且我们将使用Jotun Hein方法,所以
“Structural”表是最好的选择。
从ALIGN MENU选择Set Residue Weight
Table打开左面的窗口。
从上面的下拉菜单选择Structural。单击同意。
现在我们可以比较我们的calmodulin序列了。
从ALIGN MENU选择Jotun Hein Method。
队列进程窗显示比较完成的百分比。
当队列完毕,Worktable会显示队列的结果。
通过VIEW MENU中的Sequence Distanc
查看序列的差别和相似性(如左)。
通过VIEW MENU中的Residue
Substitutions查看残基的替代数目(如
右)。
23
为了继续,关上Residue Substitutions and Sequence Distances窗口。
Phylogenetic Tree查看
通过VIEW MENU中的Phylogenetic
Tree打开下面的窗口。默认为Balanced Branches调色板(从顶端第3)。在
phenogram中,距离长度近似。
为了用cladogram查看结果,单击Unbalanced Branches调色板工具(从顶端
第4)。在cladogram中,枝长度(branch length)是与祖先的节差异的评
估。
为了继续这入门,关上Phylogenetic Tree窗口。
查看队列报告
队列报告以序列显示比较的结果。
通过VIEW MENU中的队列报告命
令(Alignment Report)打开
报告窗口。
MegAlign允许你改变队列报告
的外观。从OPTIONS MENU中选
择Alignment Report Contents
打开右面的窗口,选定第3-7和
第9个方框,其它不变。
单击同意,更新报告。
创建Decorations和Consensi
另外,我们可以通过加入“decorations”和“consensi.”来优化展示的效果。
Decorations包括加框、加阴影和隐藏。在这节中,我们将给那些与一致序列不
一致的氨基酸加阴影。
从OPTIONS MENU选择New Decoration来打开在左边显示的对话框。
在题目框中,输入类似
“Shade disagreements
with consensus.”的名字。
下一个排包括3下拉的菜
单。选择第一个下拉菜单中
的“Shade“,中间菜单的“residues differing from”。第3个菜单不变,
默认为Consensus。选择第一个下拉菜单中的“Shade“后,会激活其下面的
另外两个下拉式菜单。
从上边的菜单选择颜色,从下面的菜单选择阴影的样式。
24
距离单位框不变,为“0.”。
单击同意,现在队列报告中所有与一致序列不一样的残基全都被加上了阴影
(如下)。
Consensi是一致序列的另外一种图形展示方法,可以用来标志ambiguous残基。
另外,序列中一致和不一致的残疾可以用直方图在队列报告中展示。当在某个位
置上,任何一个序列的残基与其他序列不一样时,一致序列就会以星号表示。并
且用直方图的长短显示其中一致残基的多少。
从OPTIONS MENU,选择New Consensus
打开右边的对话框。
在题目框中,输入诸如“All
sequences matching potato.”的名
字。
下面有4个下拉菜单。在第一个菜单
选择Potato Calmodulin。其他的菜
单不变:When all match; the
template residue 和 show
the template residue。
在右边框“otherwise show,”
中输入星号(*)。
选定“Strength.”框。
单击同意,就把新的一致性设
定应用于打开的队列报告了。
最终的报告如左图显示。彩色
直方图可以显示新的一致序列
的强度。
保存MegAlign文件
从文件菜单,选保存。
确定文件夹的保存位置。
在文件名框(视窗)或名字框(苹果计算机)中给序列命名。
单击保存(苹果计算机)或同意(视窗)。
对队列和队列报告的变化都被保存了。
25
PrimerSelect的使用方法
PrimerSelect能够帮助你设计PCR,测序和交杂实验所使用的引物和探针。输入
你的DNA,RNA或反向翻译的蛋白质模板序列后,PrimerSelect就可以在pentamer
窗口计算序列的融解温度,自由能和末端自由能。您可以通过控制包括引物浓度、
盐分和.G计算温度等参数来限定计算结果。
在模板处理后,PrimerSelect按照用户定义的参数确定引物的位置,并给
引物评分,然后筛选出模板序列上的最佳引物序列。引物“workbenches”允许
你修改你的引物,检查参数编辑对翻译读框,二级结构,错误的引物位置和限制
性酶切位点的影响。如果你选择并优化了你的引物,PrimerSelect可以让你建
立有关模板,引物,扩增的文件。和全部Lasergene的应用程序一样,
PrimerSelect也提供整合的BLAST查找功能。
创建PrimerSelect文件
我们将以克隆载体pBR322为
模板DNA序列。在这一节中,
我们选择引物,用来扩增位于
2013-2169位的H-strand Y
effector。首先我们从打开模
板序列开始。
从文件菜单选择New创建
一个PrimerSelect文件。
从文件菜单,选择输入序
列(Enter Sequence)。
打开下面的对话框。
从“Demo Sequences”选中(视窗口)的文件,或者PBR322(苹
果计算机),单击Add添加序列到右面的窗口。然后点击Done打开序列。
26
定义引物特点和位置
下面我们开始确定引物的类型。
从条件菜单(CONDITIONS MENU),选择Primer Characteristics打开左面
的对话框。这对话框可以用来设定各种参数诸如:引物长度、最大的3’
pentamer稳定性和可接受的重叠。
注意默认的引物长度为17-24 bp,
并且1或2 bp的二聚体和发卡样
重叠示可以接受的。
不改变默认设定和单击Cancel退
出。
从条件菜单,选择Primer
Locations打开右边对话框。这个
对话框允许我们根据给的序列的
长度来限制引物的位置。
从下拉菜单的Restrict
Locations中选择Upper and Lower
Primer Ranges。当在全序列中设计
编码区的PCR引物时,这是最好的选
择。
在Upper Primer Locations右面的
方框中输入1700和1950。在Lower
Primer Locations右面的方框中输
入2250和2500。
单击同意,会出现左面的窗口。成
对的绿色和红色的三角形分别标
记所设定的正向和反向引物的范
27
围。
寻找引物对
现在我们已经指定什么种类的引物对是可接受的,剩下的工作就是让
PrimerSelect为我们寻找理想的引物对。
从LOCATE MENU选择PCR Primer Pairs。打开一个二分窗口,
上面窗口中显示计算机寻找到的28对理想引物对,引物对
按照评分值依次排列。因为调色板工具中的Alternate Pairs
被默认激活 (在窗口左面工具中),所以底部窗口显示的
是上面窗口选定的引物对的替代引物对一览表。
通过拖动在窗口的右侧上的小环拉开建议窗口,可以查看PrimerSelect对
选定引物的建议。
注意现在的“Best choice.”是PrimerSelect根据在最初的条件中设定的参数
计算得到的。看下面的窗口,PrimerSelect列出了“Best choice”引物对的25
替代选择。这些替代的引物对扩增的区域和上面选定的引物一样,所不同的是他
们的序列有些不一样。
选择调色板工具中的Alternate Products(左侧工具底部),下面窗口显示
引物的位置和可能错配的位置,以及相应的产物长度。左面的那个单一的粗
黑棒提示用我们“Best choice”引物进行反应,会有大量产物被扩增出来。
如果没有多个5’或者3’引物箭头也提示这一对引物没有错配点。
单击上面窗口里引物对,观察下
面窗口里的产品棒变得越来越
细表示预期的扩增物也越来越
少。
注意有8个引物对有错误的配对点,
用粉红色或淡绿色箭头指示出来。第
28
13对和第22对正向引物有错配点(右边显示),就会用第二条产品棒的表示错
误的产品大小。
查看引物的其他信息
PrimerSelect能预测引物形成self-dimers, pair-dimers and hairpins的可
能性。
单击选定“Best choice”引物。
从报告菜单(REPORT MENU),选Amplification Summary,打开左面的窗口。
显示用所选个引物做PCR扩增反应的报告。
选择Composition Summary,打开
左面的窗口,描述扩增区和引物对
的碱基组成。
从报告菜单,选择Self Dimers,
Pair Dimers和/或Hairpins打开
新窗口显示每种二级结构的预测
结果。Self-Dimer形成窗口如右。
按照引物特点分类
PrimerSelect在自动将引物按照从好到坏的顺序分类以前,已经计算了引物的
各个特点。Located Primers & Probes窗口是我们能够根据引物的不同特点,
如引物位置、长度、溶解点或自由能等,来对引物进行分类。这里让我们用溶解
点来分类引物。
从报告菜单,选择Located Primers & Probes打开左面的窗口。窗口显示
符合我们标准的引物的一览表。在没有特别指定的情况下,引物按照位置排
列。
从LOCATE MENU选择Sort Primers打开下边对话框。
保留对正向和反向引物的选定,去除对By Position的选定。选定By Tm
Nearest方框,输入65。
单击同意,现在两个窗口里的引物按照
融解温度离65oC最近的程度依次排列。
改变引物长度
PrimerSelect’s工作台允许你在引物中引
入限制性酶切位点,突变,改变使用的密码
子,核查引物二级结构,查找错配点。在这
29
一节中,我们将用正向引物工作台来扩展我们的引物长度。
双击选定正向“Best choice”引物。
从编辑菜单,选择Work on Upper Primer打开下面的窗口。
确认Dimer,Hairpin和Priming Sites调色板工具(窗口左侧从顶端起的
4-6)已经激活。
让我们仔细查看一下工作台。在窗口下边的第3排可以看见引物序列。序列两端
的三角形“handles”允许你缩短或者延长序列。在窗口的左上角的标题告诉我
们引物的长度是23核苷酸,溶解温度为65.5度;而底部窗口的绿色棒显示引物
在序列上的大概位置。下面的信息告诉我们没有大于2 bp的二聚体形成,并且
引物只能形成一个并不理想的发卡样结构。拖动窗口左边的滚动条之间的黑框调
整上下窗口的比例。
拖动引物左上黑三角形直到长度延伸到33核苷酸。
现在引物的长度已经显示在窗口的标题中。引物的溶解温度也增加到78.6度,
将难以进行PCR。看下面的窗口有二聚体和发卡形成,并标记(坏!)。由于长
引物容易形成稳定的二聚体和发卡样结构,所以我们设计的引物经常较短。
再一次拖三角直到引物最初的23核苷酸。窗口又和我们开始打开它的时候
一样了。
引物中引入突变
PrimerSelect工作台可以很容易的在引物中引入突变。我们“Best choice”的
正向引物序列只编码一个苯丙氨酸。在这一节中,我们把读框1的苯丙氨酸通过
改变读框中的密码子转换成苏氨酸。转换完成后我们将可以观察到我们变化的效
果。
点击引物下面,读框1中绿色的苯丙氨酸,会
出现一个小盒子(如右)。盒子中显示全部4
种可能的苯丙氨酸密码子和词“Other.”标记
的GCC是这个苯丙氨酸残基的密码子。
选择Other会自动跳出一个子菜单,其中显示
所有的氨基酸及其代号,在“T-Threonine.”
上点击一下,模板序列上的碱基组成没有改
变,但是引物序列和其编码的氨基酸
(Thr-Ala)发生了改变。
Thr显示为红色,表明它是从最初的引物序列上突
变得到的。查看屏幕底部的左角,可以看到引物形
成了一个稳定的二聚体。我们可以通过给我们的
Thr残基做沉寂突变来删除这个不受欢迎的二聚
体。我们试着把苏氨酸的密码子改变为ACC。这个
密码子与苯丙氨酸密码子(GCC)只有一个核苷酸
不同。
单击红的Thr残基,从菜单中选ACC代替现在的ACT。
下面的窗口显示从G到A的单一的核苷酸变化去除了二聚体。另外,正向引物的
融解点已经从65.5减少了到53.7。也许正向引物新的溶解温度可以与反向引物
匹配,但是我们可以找到与之更相匹配的反向引物。
在工作台的右上的白色文框输入突变引物的名字。
30
点击窗口左侧顶端的OK钮,保存突变的引物。
从LOCATE MENU中选择PCR Primer Pairs更新窗口。新的引物对会加入窗
口中,突变的正向引物用淡绿色的箭头表示。
打开建议帘。没有警告的第一个突变引物对是从顶端起的第11个。这一引
物对被评定为“OK”,如果我们必须使用突变引物的话,虽然用它扩增的产
品数量不多,但是它却是我们最好的选择。
设计新引物
当你初次打开PrimerSelect的时候,引物目录是空的。如果你愿意,你可以用
这个目录来储备任何在PrimerSelect中设计或者被修改的引物。LOCATE MENU
中的Only Cataloged Primers指令可以让你在已经储存地引物中选择合适的引
物供使用。在这一节中,我们学习如何设计引物并将他们输入目录表的方法。
从LOG MENU选择Primer Catalog打开引物目录表。注意到我们突变的正向
引物已经在目录表中。引物左面的检测标志表明引物处于激活状态,V形臂
章(>>)(视窗)或子弹(苹果计算机)显示它已经通过了最初二级结构检
测。
按回车键创建一个新的引物区。输入“Test Primer”。
按Tab键。
输入“GIANTCATSNABMANYWARYRATS”。
按Tab键。
输入“Contains 46% ambiguous
bases”。
按回车键结束。引物目录表应该如右
图。
如果我们的引物已经通过了最初二级结构检测,则引物左侧出现V形臂章或枪
弹。现在没有V形臂章或枪弹,说明我们引物测试失败。让我们核查为什么:
从报告菜单,选Primer Self Dimer,可以看出该引物可以形成12对稳定的
二聚体。
从报告菜单,选Primer Hairpins,可以看出该引物也可以形成5个稳定的
发卡。
如同我们预测的那样,我们序列里的模糊碱基的百分比过高会使得它那以用来进
行PCR反应。
使用寡核苷酸订购表
PrimerSelect提供两种寡核苷酸
订购表:Generic 和 IDT
(Integrated Data Technologies,
Inc.)。
点击选定正向“Best choice”
引物。
从LOG MENU选择Oligo
Request Form中的IDT打开IDT
寡核苷酸订购表(如右)。我
们反向和正向引物序列自动输
31
入表格。如果我们想定购引物,我们只需填表打印,然后传真或用电子信件
邮给页底部的地址即可。
从文件菜单,在返回附近到坐落的引物一对窗口口做选择。
PrimerSelect文件保存
从文件菜单,选保存。
选定文件的保存位置,命名。
单击保存(苹果计算机)或同意(视窗)。任何对引物,或者引物目录表的
操作都将和文件一起被保存。
32
Protean的使用方法
Protean可以使用多种方法分析、预测蛋白质结构,并以图形化的方式展示出来。
预测蛋白质结构。各类方法按照科学概念进行分类。几个方法可以同时存在于一
个概念群中,如用于分析疏水性概念的方法就有好几种,不过有的概念只有一种
方法可供选择,如柔韧性。你可以按照任何顺序在Protean文件上展示各种方法
计算的结果。另外,Protean可以输入来自蛋白质数据库中标注序列特点,而且
允许你注释新特点。和其他Lasergene应用程序一
样,Protean也提供整合的BLAST查找功能。
创建蛋白质分析文件
这一节,我们将为人的钙调蛋白序列创建一个新
Protean分析文件。
从文件菜单选择New打开右面的对话框,然后
打开名为“Demo Sequences.”的文件夹。
双击“Human Calmodulin” (或 “Human
”),这样就打开下面的分析文
件窗口:
Protean’s蛋白质分析方法
打开序列后就是选择应用方法。方法结果的图形显示可以帮助你选择感兴趣序列
的特点。对于我们打开的序列,你会发现只有下面方法中的几个被展示出来了,
下列方法都可以使用:
Title——给文件取名。
Ruler——给文件加标尺。
33
分析方法应用
应用新Protean方法的步骤是:把所用方法从More Methods菜单移入方法帘,
然后拖入分析窗口,基本上与前面介绍的GeneQuest方法相同。在这一节中,我
们将练习使用Deleage & Roux分析方法预测蛋白质结构。
从分析菜单(ANALYSIS MENU)选择Show Available,或拖动分析窗口左上
的小环打开方法帘。方法帘中包括了
全部已用于分析你的序列的方法。
你会发现Deleage & Roux方法并不在
其中。从方法帘的顶端,点击More
Methods打开下面的子菜单,里面有所
有可以使用的方法。从Secondary
Structure的子菜单中单击Deleage &
Roux,这样Deleage & Roux就进入方
法帘。
单击方法左边的三角形打开方法如右,如果有
数字挨着图标,说明该方法已经被用于分析,
34
Sequence——显示序列。
Protease Map——识别序列上的蛋白酶酶切位点,并且显示酶切图谱。
Patterns-Prosite数据库——在Prosite数据库中检索你的序列。
Patterns-Ariadne文件——在序列上寻找用户指定的Patterns。
电荷密度——电荷——预测电荷在特定的序列范围上的分布。
二级结构——Coiled Coil——预测跨膜区的阿尔法螺旋。
二级结构——Garnier-Robson——计算特定氨基酸残基在特定结构内部的
可能性。
二级结构——Deleage-Roux——蛋白质的二级结构类型预测。
二级结构——Chou-Fasman——通过序列氨基酸残基的晶体结构来预测蛋白
质二级结构。
Hydropathy-Goldman-Engleman-Steitz-预测可以跨过细胞膜的非极性阿
尔法螺旋。
Hydropathy-Kyte-Doolittle——根据序列的氨基酸组成预测蛋白质的疏
水区和亲水区。
Hydropathy-Hopp-Woods-通过计算蛋白质序列上的最大局部亲水性寻找
蛋白质的抗原决定簇。
Antigenicity-Sette MHC Motifs——预测短肽上与老鼠MHC II d型蛋白
质相互作用的抗原位点。
Antigenicity-AMPHI-根据序列预测免疫优势辅助性T淋巴细胞抗原位点。
Antigenicity-Rothbard-Taylor-预测含有特定基序(motif)的潜在T淋
巴细胞抗原决定簇。
Antigenicity-Jameson-Wolf-通过联合现有的蛋白质结构预测方法预测
潜在的蛋白质抗原决定簇。
Amphiphilicity-Eisenberg-预测Eisenberg Moment。
表面可能性——Emini——预测特定区域位于蛋白质的表面的可能性。
柔韧性-Karplus-Schulz-预测蛋白质骨架区的柔韧性。
否则没有被用于序列分析,数字的多少代表方法正在被使用的次数。由于我
们还没有把Deleage & Roux用于序列分析,所以其左侧没有数字。
点击方法左边的空白区域去除对方法的选择。然后单击“Alpha, Regions,”,
并将它拖入分析窗口。预测的蛋白质阿尔法螺旋区域即展示在分析窗口中。
改变方法参数
下面我们改变Deleage & Roux方法的参数,然后看一看参数改变前后这个方法
预测的结果有什末不同。
重复上述操作将另一个Deleage & Roux方法应用于分析窗口,并将两个
Deleage & Roux放在一起。可以看出现在有两个完全相同的预测结果。
双击其中一个会打开一个参数对话框,选择A + B,单击同意。此时在分析
窗口上,相应的区域由于计算参数的改变立即发生相应变化。
现在你可以比较两个参数计算结果的差别。(注:此时,如果你把最初的方法再
用于分析窗口,则改变的参数自动应用于新加入的方法。)
优化结果显示(与GeneQuest相似,这里省略)
使用蛋白酶消化与SDS PAGE电泳
Protean可以识别蛋白序列上的蛋白酶酶切位点,并将酶切片段的电泳结果以图
形展示出来。
从More Methods菜单中将
Protease-Protease Map方法
移动到方法帘。
单击挨着方法名字的蓝色三
角形查看蛋白酶一览表。点
击方法左边的空白区域去除
对蛋白酶的选择。
选择“Chymotrypsin”和
“CNBr.”,将它们拖入分析
窗口。
两种蛋白酶的识别位点显示如
右。现在至少一种蛋白酶被应用,
我们可以模拟凝胶分离。
单击调色板工具中的范围选
择器(Range Selector)(箭图标)去除对应用的蛋白酶方法的选择。
从SITES & FEATURES 菜单,选择SDS PAGE
Gel Simulation。酶切片段的分离结果会自
动显示出来(如右)。在每个上面凝胶柱对
应蛋白酶的名字和分子量。
当光标在凝胶上面移动时,你可以随时查看
到相应位置的蛋白质分子量。移动光标到任
何片段上。窗口最上边的标题显示片段的范
围,大小,分子量,等电点和HPLC滞留时
35
间。
为了继续一节,关上SDS PAGE Gel Simulation窗口。
Features注释(与GeneQuest中讲解的相似,这里从略)
进行BLAST检索
Protean允许你通过因特网或企业内部互联网进行序列数据库检索。
在这一节中,我们将在NCBI的BLAST服务器上检索与人的钙调蛋白序列相似的
序列。注意电脑必须与因特网相连接,否则,跳过这一的部分,继续下一部分。
单击调色板工具中的范围选择器(箭图标),在序列上选择你想进行检索的
部分。由于我们的序列比较短,所以我们选择全序列进行比较。
从EDIT MENU选择Select All。
从网络检索菜单,选择BLAST
查找。BLAST对话框出现(如
左),默认的数据库是nr。
单击同意开始查找。
BLAST结果显示为一个二分窗口(如
下,结构、内容与相关操作参见
GeneQuest的BLAST结果)。
现在我们选择三个BLAST序列,在Protean中打开他们。
在BLAST结果窗中选择一个结果。
单击Create Document,保存对话
框窗打开(如左)。从保存的下拉
菜单选择Next(默认为Selected)。
在“Sequences.”的左边文本框输
入数字“3”。
单击同意,打开三个新的选定序列
的Protean的分析文件。
现在关上BLAST结果窗。
二级结构模拟
36
Protean能够展示诸如螺旋轮,螺旋网和beta片层等基本元件的二级结构。另
外, 它能以线性的space-fill样模型或者化学公式样模型展示蛋白质序列。在
这一节中,我们做一个阿尔法区域的螺旋轮二级结构。二级结构Garnier-Robson
方法已经应用于我们序列,阿尔法螺旋也已展示出来。选定其中的一个阿尔法区
域后,我们就能以螺旋轮展示其二级结构。
单击调色板工具中的范围选择器(箭图标)。
点击Protean文件最上边的Garnier-Robson分析结果中的一个阿尔法区域。
从分析菜单,选择Model Structures中的Helical Wheel,就会出现左边的
二级结构预测图。
为继续这一节,关上螺旋轮窗口。
展示滴定曲线
下面,我们将查看全蛋白质序列的滴定曲线。
单击Protean’s调色板工具右
边的白色空间。这使得选择回到起始位置,如果没有选中的序列,在绘制滴
定曲线时,Protean就会默认是对全序列进行计算。
从分析菜单,选择Titration Curve。
打开序列的滴定曲线窗口(如上)。Protean会在等电点处加一个蓝色的
“crosshairs”,以显示pH和所带电荷。
保存分析的文件(略)。
37
SeqMan II的使用方法
SeqMan II不仅仅能够将成千上万个序列装配成contigs,而且在装配前,
可以修整质量差的序列以及从你的序列中清除污染数据,还提供完善的编辑和输
出功能。SeqMan II可以使用DNASTAR独特的跟踪(trace)品质评价策略,通
过对自动测序仪产生的跟踪数据进行评价,自动生成最精确的一致序列。
装配过程从序列输入开始,输入的序列可以是自动测序仪输出的、也可以是
文本格式或DNASTAR序列格式。另外, 你可以从因特网的Entrez或BLAST服务
器输入序列。使用Preassembly options中的命令可以进行包括修整质量差的数
据,除掉特定的载体或污染序列等操作。你甚至可以在装配过程中选择最后加入
重复序列。
Contigs装配完毕后,Strategy View可以用图形化的方式展示contig的范
围和质量,并提示你什么地方需要补充序列。在需要的情况下,你可以加入更多
的序列,或其他的SeqMan II文件对现有的结果进行再装配。Alignment View 允
许你编辑,修整连续的一致序列,找回以前修整过的数据,调整队列(alignments)
结果。另外, 你可以查看每一个或所有序列的质量评分。SeqMan II为你提供
自动或手动工具,帮助你选择是否加入多个contigs。和其他Lasergene应用程
序一样,SeqMan II也提供整合的BLAST查找功能。
输入序列片段
我们将从打开“Demo Seqman”文件夹中的14样品序列开始。每个序列都是
自动测序仪(PE Applied Biosystems, Inc.)输出的文件格式(*.trace)。
从文件菜单,选择New打开Unassembled Sequences窗口和一个空的未命名
Project Summary窗口。Project
Summary窗口在你装配序列之前始
终是空的。
从Sequences菜单选择Add打开
Enter Sequences对话框(如右)。
打开“Demo Seqman.”文件夹会出
现14个序列。这些就是我们将要
装配的序列。
把片段序列通过把Add All按钮移到右边的窗口。现在14序列名字应该出
现于右边的窗口中。单击Done按钮。
Unassembled Sequences窗口现在会出现这14个序列。
38
通过拖拽其窗口右下角展开窗口,直到你能同时看全部样品名字。
Pre-Assembly Options操作
在装配前面,你可以考虑进行两三个装配前的选择。你可以从你的片段中除掉载
体和污染序列,优装配顺序,设定片段末端和标记重复序列。在这一节中,我们
将从样品中自动除掉Janus载体序列并修整序列末端。
选定全部14个序列。
在窗口右上的下拉菜单中选择“Janus”
作为SeqMan I要寻找的载体。
点击窗口上边的Trim Ends按钮打开右
边的对话框。你将注意到在没有特别指
定的情况下,SeqMan II将用适中的严
谨度进行末端修整。不改变设定退出对
话框。
单击窗口右上的Options按钮。打开下
面的对话框,显示全部装配前的选择一
览表。默认设定显示扫描载体,实行序
列末端修整,使用最适当的序列装配顺
序。
单击Scan All。报告窗口将出现,
但是现在可以放到一旁。在扫描
后,你将注意到Unassembled
Sequences窗口的2中心专栏发
生了变化。现在载体栏显示:载
体名字前都有一个检测通过的标
志,说明Janus载体在全部14
序列中都已经检测到了。limits
栏展示新的序列末端,说明载体
序列已经去除,末端修整已经完
成。
查看修整的数据
现在我们可以查看在扫描完成的末
端修整和载体序列去除的细节报告。
从PROJECT MENU,选Trim Report
打开左边的窗口,窗口中显示:
末端修整的参数、每个序列的名
字,平均质量,被修整的数量以
及修整前和修整的序列长度。
在你查看完报告之后,关上它。
要查看SeqMan的修整结果,让我们查看休整后序列的跟踪数据。
从Unassembled Sequences窗口,双击打开8号样本,打开右面的
chromatogram窗口。
从5’末端起变淡的部分将不
会用于序列装配。注意大部分
39
序列修整部分优化后的质量。之所以从这里去除,是因为这些变淡的序列是
Janus载体序列。
垂直的黑的棒出现于修整和未修整的序列之间。你可以根据需要拖动黑棒调整用
于装配的序列末端。
下面,让我们查看一下序列的5’末端:
单击一致序列的任何地方。
从编辑菜单,选择Go To Position。
在位置文本框输入“500”。
单击同意。
注意到最好的质量落到这区域上,SeqMan II认为507位以外的序列质量低于中
等水平。
检查完跟踪数据后,关上那个窗口。
序列装配
现在我们准备调用序列装配程序。
单击Unassembled Sequences窗口左上的装配按钮。
Unassembled Sequences窗口立即消失,报告窗口显示装配的进度。装配完整之
后,出现左边的窗口,窗口上边为装配
好的一致序列,窗口下边为所有连续的
序列。在我们例子中,SeqMan II将14
个序列装配成为单一的contig。
查看覆盖面和构建结果
现在我们已经将所有的片段装配成一
个序列,下面我们用Strategy View查
看一下其中的矛盾碱基的数量和序列
的覆盖程度。这个窗口图形化的显示了
每个片段在contig中位置
和方向。
单击Project window中
的contig。
从CONTIG菜单,选择
Strategy View打开右
边的窗口。注意标尺下
面的那条带,显示学的
覆盖程度。
条带的颜色和厚度代表覆盖
序列的数量。你会看到在大
致200-900之间有绿色的较
厚条带。这表示两条链都被测序,且高于最小覆盖面临界值的区域。(覆盖面临
界值可以通过PROJECT MENU-Parameters-Strategy Viewing来改变)。中间的
蓝线表示只有一条链被测序的区域。。出现于contig两边的细红线表示这个区
域只测过一次序。
选定窗口左上的Conflicts box可以查看片段序列间的一致程度方型图。方
40
型图大部分为黑色表示只有很少或没有矛盾碱基。蓝色条带表示矛盾碱基约
为10-20%的区域。
点击窗口左侧调色板工具中的Zoom In(放大镜图标“+“)。
双击135位碱基调入该区域的Alignment View。样品9中的矛盾碱基用红色
表示出来。
关上Alignment窗口。
去除矛盾碱基和缺口
我们样品序列能够整齐地组装成单一的contig是因为SeqMan II除掉了质量差
的和载体数据。在一些情况下,为了获得满意的一致序列,必须去除矛盾碱基和
缺口。我们将尝试在Alignment View 中编辑我们的序列。
从CONTIG菜单,选Alignment View ,打开Alignment View 窗口,上边为
一致序列,下边为连续的序列。
从编辑菜单,选Find Conflict,然后点击Find Next。光标将迅速跳到102
位。单击底部的Find Next按钮(>>),光标跳到306位。样品7在这这个
位置右一个“T”,而全部其他的样品都是缺口。我们可以通过查看样品7
的跟踪数据去除这个矛盾碱基。
选定样品7的302~310区域。
单击样品7名字左边的灰色
的三角形,则显示出其跟踪数
据,出现右面的Alignment
View窗口。
点击Zoom In查看
chromatogram细节。
跟踪数据表明样品7里的“T”与
其左边的“A”一样可能是人工造
成。
从一致序列可以看出SeqMan II’
s的trace品质评价标准自动忽略了这些可疑的碱基。因此没有必要手工删除这
些碱基。不过从学习的目的出发,我们将用缺口替换“T”,并从一致序列中除
掉缺口栏。
选定“T”,输入缺口(连字符)替换它。
单击一致序列的任何地方,接着从编辑菜单,选Remove Consensus Gaps,
306位的所有缺口都不见了。或者你也可以选定一致序列里的缺口,按退格
键(视窗口)或删除键(苹果计算机)即可。
手动修改序列末端
在装配我们的dcontig之前,SeqManII可以根据trace数据的质量和Janus载
体序列自动的进行末端修整。虽然有足够的数据可以用来把序列装配成单一的
contig,但是也会存在这样的情况,即当我们找回修整过的数据时,SeqMan II
可以在单一的contig中加入多个contigs。在这一节中,我们将学习从已经打
开着的Alignment View 用手工找回修整过的末端的方法。
41
为了区分修整过和没有修整过的数据,我们给修整过的数据加一个有颜色的背
景。
从PROJECT MENU,选参
数中的Editing & Color
打开左边的对话框。
确认Use Weight Color
已经被选用,然后单击
同意。你用手工找回修
整去掉的数据时,你会
发现这些找回的序列有
明亮的黄色的背景出
现。
如果修整完毕,则
Alignment View 中在序列的左边会有一个黑色的垂直棒,右边有一个小的黑三
角形。这一节,你可以选14个序列的某一个。
要找回修整去掉的序列末端,只需把垂直棒向序列的两端拖动即可,可以看
见以前修整去掉的序列有明亮的黄色背景。当你找回了修整去掉的载体序列
时,你会发现即使修整去掉的序列的峰型仍然很好,但是其中也已经有很多
碱基(红色显示)与您的一致序列不一样了。在你的文件中不应该留有这样
的数据。也许对组装contigs有用的数据是那些由于序列的峰型质量较差而
被修整去掉的那些序列。
拖动竖线将序列恢复到原来修复的位置。
文件保存与序列输出
保存SeqMan II文件:
从文件菜单,选保存。
选择文件保存的位置,
命名。
单击保存,则以上所有
操作的结果都保存进
文件中了。
只保存一致序列:
选定Project Summary
window, the Alignment View或the Strategy View中一个或多个contigs。
从CONTIG菜单,选Save Consensus中的Single File打开右边的对话框。
选择文件保存的位置,命名,确定
保存类型(你可以选择DNASTAR,
GenBank或FastA格式中的任何一
个)。
选定All and Add Features,不选
Include Gaps。这样就将完整的一
致序列,以及contig构建的相关
信息全都保存了,同时去除了一致
序列中的所有缺口。
42
单击保存,保存序列。
输出编辑后的片段序列:
在Project window中选定你要输出的序列。
从CONTIG菜单,选输出序列。
这个命令与保存一致序列的命令一样,允许你以三种格式保存你的序列。
43
发布评论