2023年11月30日发(作者:)

Skyline iRT 保留时间预测

长久以来,肽段保留时间的预测一直是靶向蛋白质组学感兴趣的研究内容。早在 0.2 版时,

Skyline 就整合了基于未修饰的肽段序列计算疏水性的SSRCal算法作为一种预测肽保留时间的方

1

法,在靶向方法优化教程中有详细的描述。到了 0.5 版,Skyline就开始支持目前最先进的“预

定采集”技术。靶向方法优化教程中对这种技术进行了介绍: 首先在正常色谱条件下,对关注

的全部目标肽段进行非预定采集质谱检测,只要该平台的色谱条件未发生变化,这些肽段的色谱

保留时间信息就可以被用于预定后续重复实验中目标肽段的保留时间。

基于非预定质谱采集获取肽段保留时间有一项缺点,即可能需要进行多次质谱实验,当色谱条件

发生任何变化都需要重新开始一次质谱的非预定采集实验,无论这样的色谱条件变化是来源于不

同实验室之间的方法共享还是实验室内部不同仪器,又或者是实验过程中同一台仪器上仅仅是色

谱分离柱的替换。例如,在MacCoss 实验室的一次实验中,为了完成在一次实验中对780个离子

对进行预定采集的45次重复测定,总共进行了5 次未预定采集。在NCI-CPTAC 验证研究小组最近

进行的一次实验中,为了完成在一次实验中对750个离子对进行预定采集的150-200次重复进样

检测,总共进行了6 次未预定分析。这项研究跨11个实验室,采用了 14 种仪器,并且一些实验

室还采用了不同的色谱柱条件来完成进样检测。显然,如果一项技术能够利用已经测定的肽保留

时间,跨实验室、仪器平台和不同的色谱分离梯度使用,将极大地简化靶向实验。这样,只需要

进行一次靶标肽段的校正实验,就可以在后续所有的实验分析中使用肽段的色谱保留时间信息。

更准确保留时间的预测也能够用于峰识别验证。例如,在一般的实验中,假设色谱保留时间预测

2倍标准差(2σ)距离平均值是5 分钟,如果能够精确到 1 分钟,将会筛选出更多可信的候选

峰。

iRT 标准由我们在Biognosys (/)的合作者 提出,在Skyline 1.2 版就已经支

2

持,该标准可实现高精度以及具有很好可移植性的肽段色谱保留时间预测。在本教程中,您会学

习到如何将30分钟色谱梯度上测定得到的色谱保留时间存储为iRT值,然后用这些iRT值来为90

分钟色谱梯度的实验分析设计靶向方法。您还将了解更小的iRT预测误差会提高峰鉴定的可靠性。

此外,您还将学会如何把数据依赖型采集 (DDA) 实验图谱库中的肽段保留时间转化为 iRT 值。这

样,可以直接利用探索性实验分析中的肽段保留时间信息,来设计排靶向实验。当然,这仅仅需

要一次校正进样实验。

入门指南

为了开始本教程,请首先下载以下 ZIP 文件:

/tutorials/

将其中的文件解压到您的电脑上的某个文件夹,如:

C:UsersbrendanxDocuments

1

这将创建一个新的文件夹:

C:UsersbrendanxDocumentsiRT

该文件夹包含了本教程所需要的全部文件。在Windows Explorer中双击此文件夹中的“iRT-C18

文件,或通过单击 Skyline “文件菜单中的打开,均可打开该文件。

校准 iRT 计算器

虽然在本教程中,您将仅仅使用 Biognosys定义的 iRT-C18标准以及标准肽段混合物

(/products/),但iRT本身是一个通用概念,可以用于任意易于检

测并且覆盖您所使用的色谱分离梯度的标准肽段混合物。在对已打开的文档做出任何修改之前,

单击文件菜单中的另存为 iRT 文件夹中保存一个新的副本,命名为“iRT-C18

此时,为了开始本教程,我们假定您已经在自己的仪器上完成了一批合适的标准肽段检测。执行

以下操作,准备校准新的 iRT 计算器:

文件菜单上,选择导入并单击结果

单击导入结果对话框中的确定按钮。

选择iRT 文件夹中列出的、您为本教程创建的前两个.raw 文件。

o A_D110907_SiRT_HELA_11_nsMRM_150selected_1_

o A_D110907_SiRT_HELA_11_nsMRM_150selected_2_

单击打开按钮。

Skyline 要求删除公共前缀时,单击删除按钮。

视图菜单中,选择排列图并单击平铺”(Ctrl-T)

视图菜单中,选择保留时间并单击肽段比较”(Ctrl-F8)

此时 Skyline 将显示如下保留时间视图:

2

上图呈现了30 分钟梯度条件下,每条肽段平均洗脱时间的顶层视图。执行以下操作继续查看数据:

视图菜单上,选择保留时间并单击重复测定比较

单击保留时间视图标题栏,将保留时间视图拖至 Skyline 窗口的边缘,直到鼠标光标位

于图标内侧,右侧边缘附近,如图所示:

选择文档中的首个肽段 LGGNEQVTR

此时,Skyline 将显示如下:

3

使用向下箭头键分别查看 Biognosys 标准肽段混合物中的 11 个肽段,确保色谱图积分边界的确定

正确无误,并且两次重复检测均在相似的保留时间出现色谱峰。其实,自动积分非常适用于这些

肽,您无需执行任何手动修改。本教程仅包括两次重复检测,如果您是自己实际校准新的 iRT

算器,则可能需要使用更多的重复实验以改善对肽段平均保留时间的估计。在利用搜库结果校准

保留时间计算器时,Skyline将使用每个肽段多次检测的平均值。使用平均值估计保留时间,其精

度与测量次数的平方根呈正比。

验证校准数据质量后,执行以下步骤,以创建新的 iRT 计算器并对其进行校准:

设置菜单上,单击肽段设置

单击预测标签。

单击保留时间计算器)按钮,并单击弹出菜单中的添加

编辑 iRT 计算器表单中的名称字段中,输入“iRT-C18”

单击创建按钮。

创建 iRT 数据库表单中,导航至您为本教程创建的 iRT 文件夹(如有需要)。

文件名字段中,输入“iRT-C18”

单击保存按钮。

单击编辑 iRT 计算器表单中的校准按钮。

单击校准 iRT 计算器表单中的使用结果按钮。

选中肽 GAGSSEPVTGLDAK 所在行中的固定点复选框。

此时,校准 iRT 计算器表单将显示如下:

4

单击确定按钮。

注意:这仅仅是 Biognosys 定义 iRT-C18 标尺的方法。在您定义自己的标尺时,可以将固定点保留

为第一个和最后一个洗脱肽段,也可以使用您所选择的任意其他肽段。也就是说,固定点和标尺

的选择具有一定的随意性。因此,您可以定义与任意时间都无关的保留时间标尺,然后将其余iRT

值的映射映射到该标尺上。

此时,编辑 iRT 计算器表单显示如下:

5

整个过程就是这样。此时,您已经利用实验数据校准了新的iRT 计算器。实际上,在本案例中,

想必Biognosys 团队已经使用了 2 次以上重复测定,来校准其标准肽段混合物。因此,在本教程中,

您可以简单地利用Biognosys提供的标准校准结果来替代这次的校准。为了更好地了解两者之间

的接近程度,请执行以下步骤,:

单击标准肽表格。

按下 Ctrl-A 选择所有行。

按下 Ctrl-C 复制选定单元格中的文本。

Windows Explorer 中,导航至您为本教程创建的 iRT 文件夹。

双击 iRT 文件夹中的“iRT ”文件。

选择电子表格中的单元格 C2

按下 Ctrl-V 粘贴复制的单元格。

6

按下 Ctrl 键并释放,然后按下 M 键以匹配目标格式。

此时,电子表格显示如下:

正如您所看到的那样,新计算出的 iRT 值相当接近定义值,但您应使用定义中提供的值,以得到

最佳结果。为此,请执行下列步骤:

选择 Excel 中的 A2 B12 单元格。

按下 Ctrl-C 复制这些单元格。

切换回编辑 iRT 计算器表单。

按下 Ctrl-V 粘贴定义值。

您将看肽段的色谱保留时间变成了定义值。

单击编辑 iRT 计算器表单中的确定按钮。

单击肽段设置表单中的确定按钮。

要查看肽段色谱保留时间定义值和实验测定值之间的相关性,进行下列步骤:

双击保留时间视图的标题栏,将其解锁。

视图菜单中,选择保留时间并单击线性回归”(Shift-F8)

7

Skyline 将显示如下图:

在图形的左上角,可见 Pearson 相关系数为 0.9991。如果您在 x 轴下方未看到 iRT-C18,则需要执

行下列操作:

右键单击保留时间图形,选择计算器并单击“iRT-C18”

如果您要分别查看两个已导入重复实验分析的回归图,请执行下列操作:

右键单击保留时间图形,选择重复检测并单击单一

此时,如果单击两个重复检测的色谱图形,将看到截距值从1_30min-5-3515.15变为 2_30min-

5-35 15.04。差异非常微小,但对更复杂数据集执行这类检查是十分必要的。

为新的靶向肽段添加 iRT

您现在已经拥有完全校准的iRT-C18计算器,但如果不用来计算除了标准肽段以外的其它

肽段的iRT值,它对您用处不大。在这里,您将从SRM实验得到的结果中,把首个目标标肽添加

至计算器。开始处理新肽段之前,保存当前文件,然后执行下列步骤,以创建计算新目标肽段iRT

值的数据文档:

文件菜单,单击打开

双击您创建的 iRT 文件夹中的“iRT ”文件。

8

按下 END 键选择位于肽视图底部的插入元素。

文件菜单,选择导入并单击文档

双击“iRT-C18 ”文件。

如果遗漏上述步骤,并试图保存此文档,则Skyline可能询问如何处理这些结果。在这种

情况下,您应选择删除结果信息并单击确定按钮。

向下滚动查看并确认“iRT-C18 标准肽列表已添加至文档末端。

肽视图显示如下:

将此文档另存为“iRT Human+”,然后再次将其另存为“iRT Human+Standard

创建 iRT采集方法

如果您正在使用自己仪器为计算新的iRT值而采集数据,则可能需要获得数据的仪器采集

方法。查看 Skyline窗口的右下角,您将看到此文档当前包含1231个离子对,可能需要几次未预

定检测来完成分析,但您可利用以下两个事实,减少工作量:

1. 该文档是为检测稳定同位素标记的参考肽段而设置。

2. 您只对保留时间感兴趣,而对定量分析并不感兴趣。

9

因此,实际需要处理的离子对数量可以减半,请执行下列步骤,以删除此文档中重同位素标记的

母离子:

编辑菜单中,选择调整并单击高级

删除标记类型字段中,选择“heavy”

单击确定按钮。

您将看到离子对数量减少至 632。对于这些新的肽段,需要设计新的实验来检测色谱保留时间。

在导出实验方法之前,您需要指明正在使用新的iRT-C18计算器,以便 Skyline将标准肽段的离子

对包括在所有方法之中。可以通过执行下列步骤完成此操作:

设置菜单上,单击肽段设置

单击预测标签(如果其尚未处于活动状态)。

保留时间预测器字段中,选择“<添加……>”

编辑保留时间预测器表单的名称字段中,输入“iRT-C18”

计算器字段中,选择新的计算器“iRT-C18”

选中自动计算回归复选框。

时间窗口字段中,输入“5”

表单显示如下:

单击确定按钮。

确保保留时间预测器字段包含新的预测器“iRT-C18”

单击肽段设置表单上的确定按钮。

为检测新的目标肽段,要导出未预定的离子对列表,以便在新的实验中使用。请执行下列步骤:

文件菜单中,选择导出并单击离子对列表

10

单击多个方法选项。

选中忽视蛋白质复选框。

每次进样允许的最多离子对数字段,输入“335”

此时,导出离子对列表表单将显示如下:

单击确定按钮。

导出离子对列表保存表单的文件名字段中,输入“iRT Human+Standard Calibrate”

单击保存按钮。

刚才的操作导出了两个用于新目标肽段色谱保留时间测定的离子对列表,均包括了Biognosys

标准肽段混合物, 这两个列表中的肽段完成实验测定色谱保留时间后,就可以用于计算新的iRT

值。重要的是,在每次实验中,Biognosys标准肽段的色谱保留时间都需要获得,Skyline将自动处

理此问题,即使每次重复实验中进行了多次进样分析。

对于自己的实验,您可以选择直接导出仪器方法,从而避免手动加载离子对列表。您也可能

想要设定更小的最多离子对数。的确,您只是为了挑选出一批可识别的色谱峰,用来获得可靠的

肽段保留时间,但 335 这个数值已经过于激进了。请相信,生成此数据的 Biognosys 团队非常熟悉

这些目标肽。因此,更常见的数值是100-150,正如本教程前言部分提到的那样。

11

Excel 中打开生成的 CSV 文件“iRT Human+Standard Calibrate_”“iRT

Human+Standard Calibrate_”,您将看到适用于 Thermo TSQ 仪器的离子对列表。在每个文

件的底部,您将看到 iRT 计算器中出现的标准肽段的离子对。

导入并审核数据

本教程文件夹中包含了您刚才创建的离子对列表的数据采集文件。实际上,您已在本教程

iRT 校准部分导入了这些文件。只不过,您选择忽略了这些人类肽段的色谱图。要将文件导入

当前文档,请执行下列步骤:

文件菜单上,选择导入并单击结果

单击添加一个新的重复测定选项。

单击导入结果表单中的确定按钮。

选择您为本教程创建的 iRT 文件夹中列出的前两个 .raw 文件。

o A_D110907_SiRT_HELA_11_nsMRM_150selected_1_

o A_D110907_SiRT_HELA_11_nsMRM_150selected_2_

单击打开按钮。

要查看 iRT-C18 计算器如何计算这些新肽段的分数,请执行下列操作:

在之前解除停靠的 保留时间图形中单击右键(已经设置为显示线性回归),选择计算

并单击“iRT-C18”

完成数据导入之后,您将看到如下图形:

12

图形左侧的紫色散点表示这些肽段尚无校准的 iRT 值。 然而,计算 iRT 值之前,最好对峰

值积分边界进行审查。如果您真正希望对自己的 iRT值进行准确校准,最好非常仔细地对所有肽

段执行此操作。

在真正创建iRT之前,您可能希望利用一次未预定实验,来为多个重复的预定实验创建实

验方法,然后利用平均值计算每个肽段的色谱保留时间,以提高精度。如果仅仅进行一次实验分

析,基本的统计学知识告诉我们,大约有 5% 的肽段将会出现在2被标准差之外

然而,本教程将使用一次实验的数据,对基本边界也仅仅进行粗略的检查。要审查 Skyline

在其中发现积分边界问题的肽段,请执行下列步骤:

编辑菜单,单击查找”(Ctrl-F)

确保查找项字段空白。

单击显示高级按钮。

同时搜索列表,选中未整合的离子对复选框。

查找表单将显示如下:

13

单击查找全部按钮。

单击关闭按钮。

Skyline 窗口底部,您将看到查找结果视图,显示 8 个未完成积分的离子对:

要检查这些肽段的色谱峰,请执行下列操作:

视图菜单,选择离子对并单击全部”(Shift-F10)

视图菜单,选择自动缩放并单击最佳峰值”(F11)

双击查找结果视图中的每一行。

您将看到若干离子对干扰峰,但是其信号强度低于最强离子对色谱峰的 1%(按区域面积计算)。

14

Skyline 将排除这类离子对,从而帮助您确定保留哪些离子对,用于最终定量。但是,如果您已做

出了决定,最好强制 Skyline 连续整合所有包含的离子对。为此,请进行以下操作:

设置菜单,单击全部合并

计算 iRT

此时若要计算本文档中目标肽段的 iRT 值,请执行下列步骤:

右键单击保留时间视图中的线性回归图,选择计算器并单击编辑当前

编辑 iRT 计算器表单中将显示 iRT-C18 计算器,单击添加按钮,并单击按钮下方显示菜

单中的添加结果

Skyline 将显示以下消息:

请注意,在为两次实验检测生成 iRT 值时,Skyline 会为每次实验分别进行线性回归,然后利用各

自的回归模型计算该次实验检测肽段的 iRT 值。如果多次实验包含相同的肽段,则 Skyline 将采用

这些最终计算所得 iRT 值的平均值。与直接计算物理上保留时间平均值的方法不同,这种方法允

许跨多次实验,并且允许这些实验的色谱分离梯度不同。

单击确定按钮。

15

此时,编辑 iRT 计算器表单将显示如下:

单击确定按钮。

保留时间视图将发生变化并显示如下:

16

您刚刚使用 30 分钟梯度采集的数据校准了 147 个新的人类肽段的 iRT-C18 值。

使用 iRT 预定新的数据采集

接下来,您将探索 iRT 如何利用现有方法支持新的色谱条件设置,即使改变洗脱梯度,iRT

能在仅进行一次校准后,提供相对较小的时间窗口开始预定采集。

如果您在自己的实验室执行此操作,则需要打开原始“iRT ”文件,为其导出实验

方法,然后在准备好的样品中加入标准肽段混合物,实现数据采集。本教程文件中夹包含了一个

严格按照这种方法创建的原始数据文件。与上述同样的样品再次进行了质谱检测,但是采用不同

的洗脱梯度(90 分钟)和一个新的色谱柱,不过这次仅仅分析标准肽段。

继续之前,请执行下列操作:

文件菜单中,单击保存”(Ctrl-S)

关闭查找结果视图。

为了适应新的色谱柱和90 分钟梯度,需要重新校准方法,执行下列操作:

文件菜单,单击之前保存的“iRT Human+”文件 (Alt-F, 2)

编辑菜单中,单击查找”(Ctrl-F)

单击隐藏高级按钮。

17

查找项字段,输入“NSAQ”

单击查找下一个按钮。

单击关闭按钮。

按下 Delete 键删除您在另一个文档中已经删除的肽段。

设置菜单上,单击肽段设置

单击预测标签。

保留时间预测器下拉列表中,选择您创建的“iRT-C18”预测器。

选中在出现时使用实际检测到的保留时间复选框。

时间窗口字段中,输入“5”

肽段设置表单将显示如下:

单击确定按钮。

文件菜单上,选择导入并单击结果

18

单击导入结果表单中的确定按钮。

双击您为本教程创建的 iRT 文件夹中的

“A_D110913_SiRT_HELA_11_nsMRM_150selected_90min-5-40_TRID2215_”文件。

完成数据导入后,保留时间回归图将显示如下:

此时,您可看到标准肽段的洗脱时间范围约介于 15 65 分钟之间,此次运行中未对额外的目标

肽段进行检测。然而,此时您已准备好在新梯度上对肽段进行检测。

使用 iRT 预测器导出预定方法

创建预定方法之前,您可以通过执行以下操作,更好地了解在某种预定参数下离子对是如

何被检测:

视图菜单,选择保留时间并单击时序安排

保留时间视图将发生变化,显示类似于下图的图形:

19

如果您未能在上图中看到所有的三条线,则可执行下列操作:

右键单击图形,并单击属性

时序安排图形属性时窗字段,输入“2, 5, 10”

单击确定按钮。

从此图可以看到窗口尺寸对于时序安排的影响。时间窗口越小,则在给定时间内允许同时测定的

离子对越少,这使得能够在特定驻留时间内,对单次质谱进样实验中的更多离子对进行测定。窗

口尺寸大小对于能够捕获到整个色谱峰的肽段百分比,可以通过以下公式进行近似估计:

窗口尺寸平均色谱峰 平均 误差

()()

( ( (

)

误差色谱峰

))))

其中“z”为在正态分布条件下,一定百分比范围覆盖时的标准差临界值,如z(95%) =1.96。在拥有

完美预测并且不考虑峰宽和保留时间偏差的条件下,所需窗口的大小正好为色谱峰宽。即使能够

进行完美预测,峰宽以及保留时间的偏差也会扩大所需窗口尺寸。最后,预测误差也会进一步扩

大窗口尺寸。值得注意的是,即使采用最先进的保留时间预测方法,在预定采集之前仅仅进行一

次未预定实验也是不够的。因为,您试图预测平均保留时间,但是在一次实验中,大约 5% 的肽

段会偏离均值2被标准差之外。

20

本教程中,iRT 方法允许在 90 分钟的洗脱梯度运行中,采用5分钟的时间窗口对目标肽进

行检测。上图表示在一个检测周期中可以检测不超过 265 离子对。 10 毫秒的驻留时间条件下,

最多将产生 2.6 秒的检测周期。为了创建一个能够对本文档中涉及的1223个离子对进行预定检测

的方法,请执行下列步骤:

文件菜单中,选择导出并单击离子对列表

方法类型字段中,选择下拉列表中的预定的

最大并行离子对字段中,输入265

导出离子对列表表单将显示如下:

您可以简单地选择单一方法选项,但表单实际显示出方法:1”,确认了在 5 分钟检测窗口以及

同时测定的离子对数量不会超过 265的条件下,所有的离子对能够在一次进样实验中被检测。对

于定量分析而言,这个数量可能仍然稍微偏高,但却好于只能检测一半离子对而 采用2 次进样,

各检测 335个离子对的方法要好。您还可以根据自己的喜好将此数字降至 135,此时您将看到

Skyline 显示实现这个目标需要进行两次进样。如果需要将此数字降至 90,则显示需要进行 3 次进

样。但是,继续下一步之前,需确保将此数字恢复为 265

单击确定按钮。

文件名字段,输入“iRT Human+Standard”

单击保存按钮。

21

Windows Explorer 中,您将发现此操作将在 iRT 文件夹中创建“iRT Human+Standard_”

件。在 Excel 中,您将确认此文件包含全部 1223 个离子对,预定起始和终止时间间隔为 5 分钟。

审查预定数据

要审查采用刚刚创建的方法采集的数据,首先通过执行下列操作删除 90 分钟梯度校准数据:

编辑菜单上,单击管理结果”(Ctrl-R)

单击删除所有按钮。

单击确定按钮。

此时,执行下列操作导入预定方法采集的数据:

文件菜单中,选择导入并单击结果

单击导入结果表单上的确定按钮。

双击本教程 iRT 文件夹中的“A_D110913_SiRT_HELA_11_sMRM_150selected_90min-5-

40_”文件。

加载数据时,您可通过执行下列操作将保留时间视图切换回线性回归

视图菜单中,选择保留时间并单击线性回归”(Shift-F8)

数据加载完成后,保留时间视图将显示如下:

22

从此图形中,显而易见有 2 个异常肽段。可能的原因有当前数据中的色谱峰积分边界错误,或用

于计算 iRT 值的校准数据中的色谱峰积分边界错误。本案例中,问题出现在 iRT 30 分钟梯度校

准期间,Skyline 自动选择了错误的色谱峰。实际上,您正在查看的数据并非通过上述生成的预定

方法所收集,了解这一点非常重要。如果是根据上述生成预定方法收集数据,则异常肽段的色谱

图甚至不会包括此处检测到的几个峰。此数据是在基于更加彻底地审查校准数据(本教程跳过了

该步)创建的预定方法收集的。

如果您想知道图例中的异常值为何只有一个点显示为紫色(这是因为所设置的相关系数阈值尚

不适用于相关性如此高的计算器),您可执行下列操作,更改相关性阈值:

右键单击保留时间图形,并单击设置阈值

阈值字段,输入“0.998”

单击确定按钮。

此时,保留时间图形将显示如下:

现在您可以单击每个异常点,Skyline 将在肽段视图中对其进行显示。然后,按下 Esc 恢复主窗口,

并按下 Ctrl-C 复制肽段标记。您也可将这些内容收集到单独的编辑器中,供以后审查使用,或者

为之前创建的“iRT Human+Standard ”文件打开另一个 Skyline 实例。然后,您可使用

查找表单审查这两个肽:

EVVEEAENGR

23

LLADQAEAR

对这两个肽段,你会发现很难在校准数据中看到匹配很好的色谱峰。如果您在校准实验时仔细审

查,很有可能会发现这些异常肽段,从而进行删除。这也就解释了为何在校准实验中,您应该尽

可能小心。

现在您可以根据这些更准确的数据,重新计算本文档中所有肽段的 iRT 值,这些数据通过使用同

位素标记肽段,确保了色谱峰选择的正确性。重复上述校准步骤,如有要求,选择替换现有值

然而在本教程中,您可以直接执行下列步骤除去错误校准的肽段:

右键单击保留时间图形,单击删除异常值

删除图形中的 2 个异常值,肽数量应减去 2,降至 156

请注意,上图中名为预测器的线性方程是 Skyline 使用本文档中标准肽段的测定时间和iRT值进

行回归,自动计算出的。这是因为选中了编辑保留时间预测器表单中的自动计算回归复选框。

现在单击肽段视图,并使用向下箭头键审查肽段色谱图。 Skyline 将显示如下图形:

24

您将看到除标准肽段以外的所有肽段都具有轻母离子对和重母离子对,并且每个色谱峰通常比未

预定数据具有更多的点。您还将看到 Skyline 在标记预测的下方显示了色谱峰的预测时间。

本案例中,数据源自单一进样。但是,因为设置了自动计算回归Skyline 将为每次进样(甚至

包括那些需要多次预定进样才能测定所有肽段的文档)分别计算回归,这样做可以让定量更加精

确。在为此类文档导出方法时,Skyline 将在每个方法中自动包含标准肽段的离子对。自动回归为

每次进样计算一个单独的回归方程,比对所有进样采用一个回归方程更加精确,这也使预测

释成为更加强大的肽段身份验证工具。

根据 MS/MS 谱图采集时间计算 iRT

如果您收集的是数据依赖实验(DDA)的数据,其中也参入了足够高浓度的用于构建 iRT 计算器的

标准肽(因而这些标准肽采样密度足够高以及被可靠鉴定到),则可以采用和处理 SRM 数据相同

的方法计算 iRT 值。一般来说,这些 iRT 值精确度较低,因为是基于肽段色谱洗脱峰上随机采样获

得的MS/MS扫描时间,并不是真正的肽段保留时间。然而,如果直接采用探索性数据分析实验的

iRT数值指导构建SRM预定实验,可以节省大量的仪器时间。在数据无关(DIA)分析中,由于所

有肽段的离子全部碎裂产生MS/MS图谱,MS/MS图谱的采样频率足够高,采用MS/MS图谱中的

碎片离子信号来构建离子流色谱峰,利用离子流色谱峰的最大值来建立iRT模型也可以得到十分

精确的结果。

25

在本教程的 iRT 文件夹中,您将发现包含谱图库“Yeast_iRT_C18_0_”的子文件夹

“Yeast+Standard”。此谱图库来自酵母蛋白质酶切肽段混合物的两次 DDA 实验,采用了SEQUEST

搜库,添加了 Biognosys 标准肽段混合物。如同下面所示,只要 iRT数据库中的肽段足够多,导入

的数据中不一定需要包括标准肽段。然而,您必须使用 Skyline 建立的 BiblioSpec 图谱库格式。因

为其它图谱库格式中,不会为每个肽段分别存储每次进样实验的保留时间,从而导致无法对同样

色谱条件下的不同实验进行回归。

您可通过执行下列操作,以在此库中添加肽段谱图匹配(PSM)的 iRT 值:

右键单击保留时间图,选择计算器并单击编辑当前

单击编辑 iRT 计算器表单中的添加按钮,并单击添加谱图库

单击添加谱图库表单中的谱图库文件选项。

单击浏览按钮。

双击“iRT”文件夹中的“Yeast+Standard”子文件夹。

双击“Yeast_iRT_C18_0_”文件。

添加谱图库表单将显示如下:

单击确定按钮。

Skyline 将显示如下表单:

26

该表单显示 Skyline 可以为库中的两次 DDA LC-Run计算有效回归。并且利用这些回归模型为

558 个新肽段计算了 iRT 值。当然,每次LC-Run iRT 值是分别计算的。在两次LC-Run中同时出

现的肽段将产生两个 iRT 值,最终结果为这两个值的平均值。Skyline 还发现 3 个肽段的iRT

已经根据色谱峰获得,因此将跳过。

单击确定按钮。

此时,编辑 iRT 计算器表单将显示经测量的肽列表中有 706 个肽。

单击确定按钮。

MS/MS 扫描时间转换为色谱峰时间

您可以使用刚刚根据 MS/MS 扫描时间计算所得的 iRT 值来预定 SRM 采集,然后使用 SRM

数据根据色谱峰时间获取更加精确的 iRT 值。但是,您也可以使用 Skyline MS1 过滤,直接从原始

DDA LC-Run提取色谱峰时间。可在 MS1 过滤教程中查看如何设置并将数据导入 MS1 过滤文档的

详细信息。在本文档中,您可通过执行下列操作快速浏览已创建并导入数据的文档,包括用于创

建谱图库的两次 DDA LC-Run

文件菜单中,单击打开”(Ctrl-O)

导航至“iRT”文件夹中的“Yeast+Standard”子文件夹。

双击文件“Yeast+Standard (refined) -

选择肽段视图中的第一个肽段。

Skyline 窗口将显示如下:

27

您可以双击保留时间视图中的标题栏,以更好地查看该图形,并了解到库谱图方法计算

iRT 值与检测时间的相关系数为 0.9998。因此相对于采用MS/MS扫描时间获得模型来说,使用

色谱峰获得的模型精度可能低于预期。但另一方面需要说明的是,该数据进行了手工调整,仅仅

采用了那些在两次LC-Run中都出现的,并且具有很好色谱峰的肽段。从这里可以看出,使用谱图

库数据计算肽段的初始 iRT 值时,您可能还需要附加一些检验条件,以筛选出更加可靠的数据。

您在此文件中看到的色谱图提取自LC-Run中的MS1 扫描。您还可以查看记录以确认

MS/MS 扫描的时间,这些时间在色谱图中利用“ID”进行标记。此外,您还可以在 MS1 过滤 教程中

学习如何使用这一十分有用的数据处理方法。

要将使用 MS/MS 扫描时间计算所得的 iRT 值转化为本文档中使用色谱峰时间的值,请执行

下列步骤:

右键单击保留时间图,选择计算器并单击编辑当前

单击编辑 iRT 计算器表单中的添加按钮,并单击添加结果

Skyline 将显示如下所示表单:

28

这样做,系统将替换您在上一部分添加的 558 iRT 值。由于正在使用色谱峰时间,您还可

以选择更换酵母和人类样品共享的 3 个肽段,或使用两者的平均值。

单击确定按钮接受更改。

更多 iRT 计算器编辑选项

现在您拥有 705 个具有相当良好 iRT 值的肽段,虽然这些值仅基于不超过两次重复实验计

算得出。在这些例子中,您已使用了包含 iRT-C18 计算器时采用的标准肽段混合物的数据集。然

而实际中并不一定需要这样。现在,您可以利用与现有iRT数据库具有足够多共享肽段的数据集

来计算新的iRT值。只要存在至少 20个共同肽段,Skyline 就将使用所有这些共同肽段来构建相关

性为 0.99 或更高的回归模型。

测试 Skyline 中的 iRT 功能时,利用了公共数据 PeptideAtlas 中的图谱库来创建Skyline文档。

3

此数据集包含 20 多次重复检测,产生了 1000 多个 iRT 值,但由于显然太大而无法涵盖在本教程

中。

29

在使用编辑 iRT 计算器表单的添加按钮时,您可能还注意有一个添加 iRT 数据库的操

作。此菜单项可用于将现有 iRT 数据库合并至当前计算器。如果数据库使用相同的标准肽段,则

它们将用于完成从一个数据库转换到另一个数据库的回归。否则,与其他数据源一样,只要存在

至少 20个共同肽段,Skyline 就将使用所有这些共同肽段来构建相关性为 0.99 或更高的回归模型

编辑 iRT 计算器表单中的打开按钮允许您使用现有的 iRT 数据库,该数据库可能是您从他

人那里接收的数据库。

您也可使用编辑 iRT 计算器表单中的肽段按钮,将标准肽更改为数据库中包含的任何肽段

集合,并且您可使用重新校准按钮更改 iRT 标尺。

结论

在本教程中,您学习了如何使用 Skyline iRT功能,这是存储肽段保留时间实际检测值的

标准方法,以便用于 SRM 采集的实验设计和采集后的肽段身份验证。只要您为测定的肽段存储了

iRT 值,则通常只需要进行一次校准即可预定任意数量的离子对。更加精确的保留时间预测也使

iRT 预测器成为一种比基于序列的预测更强大的肽段鉴定结果验证工具。Skyline iRT 方法易于使

用,且易于生成 iRT 值。您可根据任何标尺和任何标准肽段集计算 iRT 值。您甚至可以将内生于特

定实验的肽段集合作为标准,只要它们可进行持续检测并跨越您试图测定的大多数色谱梯度范围。

此外,数据库具有共同肽段时,Skyline 能够很方便的完成iRT 数据库合并。您还学习了关于 iRT-

C18 的内容,这是最初 Biognosys 团队使用 Biognosys 试剂盒定义的 iRT 标尺。您可以将此试剂盒用

于自己的实验, Skyline 使得 iRT-C18 标尺易于使用,但可以将标准肽段更改为根据该标尺校准的

任何肽段集合,正如此时您已完成对数百个常用人类和酵母肽段的操作。

参考文献

1. Krokhin, O. V. et al.An improved model for prediction of retention times of tryptic peptides in ion pair

reversed-phase HPLC: its application to protein peptide mapping by off-line HPLC-MALDI MS.

Proteomics 3, 908-919 (2004).

2. Escher, C. et al.Using iRT, a normalized retention time for more targeted measurement of

peptides.Proteomics (accepted) (2012).

3. Deutsch, E. W., Lam, H. & Aebersold, R. PeptideAtlas: a resource for target selection for emerging

targeted proteomics workflows.EMBO Rep 9, 429-434 (2008).

30