Discovery Studio官方教程(Help-Tutorials)| ZDOCK介绍及教程

0 评论

介绍
蛋白对接技术是一种预测蛋白质相互识别以及相互作用的技术。在Discovery Studio中,我们可以使用ZDOCK来实现蛋白质的对接计算。ZDOCK是一种基于快速傅里叶转化相关性技术的刚性蛋白对接算法。算法中快速傅里叶转化相关性技术被用于搜索蛋白-蛋白系统的平动和转动空间。RDOCK是一种基于CHARMm的能量优化过程,用于优化ZDOCK所寻找到的蛋白-蛋白复合物的结合构型,并使用能量打分函数给这些结合构型打分。(ZDOCK学术用户免费:https://zdock.umassmed.edu/,商业用户只能选择DS软件)

注意:

在准备此计算的输入时,考虑以下因素(建议先使用prepare工具准备一下蛋白):

1.如果受体或配体蛋白中有缺失的原子或残基,建议在运行本协议之前对它们进行建模。

2.如果缺失的原子或残基位于蛋白质表面,即使缺失的部分不在结合位点上,预测的对接复合体也可能是错误的。这是因为缺少原子或残基的表面可能被错误地预测为结合位点。

3.如果缺失的原子或残基位于蛋白质的核心,对预测的影响就会降低。

4.原子类型和允许的残基类型仅限于标准氨基酸残基。非标准残基中的原子被视为零电荷的碳。

5.一般来说,在运行计算之前,应该先去除水分子。然而,如果包括水,氧原子被视为未知原子(即,作为零电荷的碳)。

6.如果输入的配体或受体有多种构象(例如,核磁共振实验的结构),则使用第一构象进行计算。如果需要使用除第一个构象以外的其他构象进行计算,则在运行该协议之前删除除该构象以外的所有构象。

7.无论输入分子中是否存在氢原子,计算中都不使用氢原子。

 

本教程使用ZDOCK来进行蛋白对接的实验,并分析对接的结果。从中选取的一些结合构型,利用RDOCK进行优化。本教程的蛋白对接实验中,我们选用牛β-胰岛素(PDB号:2ptn)作为受体蛋白,另外胰岛素抑制剂CMTI-I(PDB号:2sta,I链)将作为配体蛋白。该牛β-胰岛素及其抑制剂CMIT-I复合物的晶体结构是已知的(PDB号为1ppe)。

 

本教程涵盖如下内容:

ZDOCK运算的设定

ZDOCK结果的分析

对接构型的RDOCK优化

蛋白-蛋白结合界面氨基酸的RMSD分析

蛋白-蛋白结合界面氨基酸的非键分析

1. ZDOCK运算的设定
打开受体和配体蛋白

在文件浏览器(Files Explorer)中,展开Samples | Tutorials | Protein Modeling文件夹,双击2ptn.pdb文件。DS将在一个新的3D窗口中打开该蛋白。

在同一文件夹中,将2sta_I.pdb拖至上述同一分子窗口(2ptn分子窗口)中。(图1)

 蛋白-蛋白对接(ZDOCK)

 

在工具浏览器(Tools Explorer)中,展开Macromolecules |   Dock and Analyze Protein Complexes,点击Dock   Proteins(ZDOCK),打开Dock Proteins(ZDOCK)对话框。(图2)

设置Input Receptor Protein为2ptn:2ptn。

设置Input Ligand Protein为2ptn:2sta_I。

点击Angular Step Size右边的栅格,下拉列表中选取15。

注:ZDOCK计算过程中可以采用两种欧拉角度进行结合构型的采样:6°和15°。采样角度为6°时,预测结果更为准确,因为它的最终样本数包括54,000个结合构型。尽管采样角度为15°时的结果准确性有所下降(因为它的采样数只有3600个),但它的计算时间更短。

展开Clustering参数组。

点击RMSD Cutoff参数,将该值设置为6.0。

点击Interface Cutoff参数,将该值设置为9.0。

点击Maximum Number of Clusters参数,将该值设置为60。

 

本教程中使用的配体抑制剂较小,对于这样小的体系,将RMSD Cutoff设置为 6.0 Å的cluster 半径并同时将Interface Cutoff 设置为9.0 Å,cluster结果会更好。本教程中的ZDCOK运算,将不指定blocked residues也不指定filtering binding site residues。

设置ZRank为False。

ZRank选项用于根据静电势、范德华、去溶剂化效应能来对ZDOCK初始预测的pose进行重新排名。本教程中,我们没有使用该选项。

注:ZDOCK可以在采用blocking和(或)filtering选项时进行计算:

如果有数据表明某些氨基酸残基不可能出现在蛋白-蛋白的作用界面,那么在受体蛋白中选中这些残基,然后设定Receptor Blocked Residues参数为Create New Group from selection。同样的,也可以通过设置Ligand Blocked Residues参数来指定配体蛋白中不可能出现在界面上的残基。

如果有数据表明,某些氨基酸一定会出现在蛋白质-蛋白质作用界面上,那么选中它们。然后展开Filter Poses参数组,设置Receptor Binding Site Residues参数和Ligand Binding Site 

Residues参数为Create New Group from selection。

Filter Poses功能也可以在ZDOCK运算完后单独运行,采用Process Poses(ZDOCK)protocol即可。

运行ZDOCK并查看结果

 

点击Run运行作业,在对话框中观察作业运行状态。点击Background后台运行该作业。

该作业大概需要15分钟的时间(奔4处理器,2Gb的内存,2.8GHz的显示器)。

待作业完成以后,双击任务浏览器(Jobs Explorer)中相应的行,打开Report.htm(图3)。在report文件中分析Summary部分并点击View Results以打开一个包含对接pose的新窗口。(图4)


2. 分析ZDOCK结果
输入的受体蛋白和配体蛋白都显示在视图窗口当中。

如果两个蛋白分子并没有在视图窗口当中显示,则在工具栏中点击Fit To Screen按钮使两个蛋白分子居中显示。每一个聚类的中心pose都以点的形式显示在受体蛋白的周围。

1.  结合构型的聚类(Cluster)结果

在系统视图(Hierarchy View)中,展开Docked     Poses和Clusters。

 

这将打开几组Clusters和poses。Cluster_1是更大的聚类(包含的poses最多),后续的聚类所包含的pose逐渐减少。

 

在系统视图(Hierarchy View)中,关闭Docked Poses和Clusters组。在表格浏览器(Data Table)中,点击Protein Pose标签。

 

这将显示如下关于ZDOCK运算结果的信息:

l  ZDock Score – 包含每个对接构型的ZDOCK分数(PSC 打分函数),Pose 1的 Zdock分数最高(更好)。

l  Cluster – 指明每个对接构型所属的聚类组

l  ClusterSize – 报告每个聚类含有的对接构型的个数。

l  Density – 报告聚类过程中临近的对接构象数目。

关于聚类算法的详述,可以参考Discovery Studio Help中的Clustering and analysis of docked protein poses。

 

2.  结合构型作图分析

以下的步骤将解释如何使用不同的方法,借助plots和Dock and Analyze Protein Complexes工具来帮助观看对接构型,并选择一部分ZDOCK的对接构型进行进一步的RDOCK优化。

在工具浏览器(Tools Explorer)中,展开Macromolecule     | Dock and Analyze Protein Complexes,在Browse Poses一栏下设置Browse为Top     Poses in Largest Clusters。

这将显示10个更大的聚类中100个打分更好的pose。

点击First显示第一个pose的配体分子。

这将在分子窗口的视图窗口中产生一个名为Pose1_Cluster2_2sta_I的配体分子。

点击Lock Visibility保留配体分子的该pose并一直处于可见状态。

点击Next观察配体分子的下一个pose,是cluster2中的pose3。

观察到该pose同第一个pose很相似。

点击Next两次显示Pose7_Cluster5_2sta_I。

观察到该pose对接至受体的位置很相似,但是配体的对接界面却有较大的差距。

继续点击Next观察其他pose,如果想要保留某一个pose则点击Lock Visibility。

在Data Table中,点击ProteinPose,使之处于激活状态。

单击鼠标右键,选取List Only     Visible Objects。

 

点击ZDockResult点状图标签,拖拽该窗口,以使能够同时看到ZDockReults窗口。

 

在View工具栏中,点击Select工具,选中ZDockResults窗口中一些ZDock打分高于12.0的点。

 

该操作共选取了11个pose,5个pose属于cluster2,4个pose属于cluster1,cluster3和5各包含一个pose。

 

3. 利用RDOCK优化对接构型
 RDOCK优化

点击ZDockResults分子窗口,以使该窗口处于激活状态。

在工具浏览器(Tools     Explorer)中,展开Macromolecules | Dock and     Analyze Protein Complexes,在Refine Poses一栏下,点击Refine Docked Proteins(RDOCK),打开Refine Docked Proteins(RDOCK)对话框。(图7)

点击Input Receptor Protein右边的栅格,下拉列表中选择ZDockResults:2ptn。

点击Input Ligand Protein右边的栅格,下拉列表中选择ZDockResults:2sta_I。

点击Input Poses右边的栅格,下拉列表中选择Create New Group     From Selection。

默认的会将该新产生的组命名为Group,共包含之前选取的11个pose。

注:Dielectric   Constant参数仍保留设置为4.0。该值即运算RDOCK中计算CHARMm能量时所用的介电常数。

点击Run运行作业,在对话框中观察作业运行状态。

点击Background后台运行该作业。

该作业大概需要5分钟的时间(奔4处理器,2Gb的内存,2.8GHz的显示器)。作业结束时会出现一个提醒任务结束的对话框。

结果分析

待作业完成以后,双击任务浏览器(Jobs Explorer)中相应的行,打开Report.htm。

在report文件

中点击View Results打开一个新的分子窗口。(图8)

经RDOCK优化的对接构型均出现在该窗口中,其中top  refined pose在视图窗口中显示。

每一个优化好的pose其RDOCK所计算的各能量值都列在表格浏览器(Data Table View)中。

l  E_elec1 and E_elec2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的静电势能

l  E_vdw1 and E_vdw 2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的范德华非键作用能

l  E_sol – 经ACE方法计算得到的蛋白质复合物的去溶剂化能

l  E_RDock – RDOCK分数的定义为:E_elec2 + beta×E_sol

表格中同样还包含了运算ZDOCK之后得到的各pose的性质,例如ZDock Score和聚类信息等。这些信息有利于结果的解释。

RDock打分更好的pose属于cluster2。这也证实了cluster2所包含的pose是对接更好的结果,有可能同真实的对接构象比较接近。

在Table中,点击可以看到第一个pose的3D构象。分别点击和可以查看上一个和下一个pose的结构。

 

 

4. 使用RMSD分析结合界面的氨基酸
本小节将把对接的构型同蛋白质复合物PDB 1ppe的晶体结构进行比较。

打开PDB 1ppe

点击Poses分子窗口的标签,使该窗口处于激活状态。

从主菜单栏中,选取File | Insert From | URL,打开Insert From URL对话框。

在ID文本框中输入1ppe。确保地址栏设置为Default PDB     Structures。

点击Open。

这将在Poses分子窗口的视图窗口中插入1ppe蛋白复合物结构。

在分子窗口中,单击鼠标右键,选取Show All显示所有pose。

在系统视图(Hierarchy     View)中,展开Cell,然后展开1PPE。

选中Water,Delete。这将删除1ppe中的水分子。

 

将对接构型与1ppe叠合

在进行RMSD计算之前,首先应该将对接的poses和1ppe进行基于受体蛋白的叠合。

在视图窗口(Graphic     View)中,单击鼠标右键,选取Show Sequence。

这将打开一个Sequence窗口。(图9)

点击Poses分子窗口标签,激活该窗口。

在系统视图(Hierarchy)中,点击选中1ppe的E链。

在工具浏览器(Tools     Explorer)中,展开Macromolecules |     Superimpose Proteins,在Reference     Protein一栏下,选取1PPE中选中的链作为叠合时的参考分子。

在Sequence Alignment一栏中,设置Sequence Alignment为Poses,并将弹出的窗口关闭。

在分子窗口中,确保1ppe的E链仍被选中。

在Superimpose Proteins一栏中点击Superimpose。

该步将对接poses的受体对接至1ppe的E链。

 

计算结合界面氨基酸的RMSD值

在系统视图(Hierarchy)中,点击选中1ppe的I链。

在Dock and Analyze Protein Complexes工具面板下,点击Define Ligand。

点击Select   Binding Interface。

选中处于蛋白-蛋白分子界面的氨基酸残基。

从菜单栏中,选择Structure | RMSD | By     Sequence Alignment….

这将打开RMSD by Sequence Alignment的对话框。

在该对话框中,点击Reference molecule右边的栅格,下拉列表中选择1ppe。点击Selected residues左边的圆形按钮,关闭Report at     residue level选项。点击OK。(图10)

DS将在一个新的Html窗口中打开一个基于选中氨基酸的RMSD报告。(图11)

比较对接poses的E_RDock打分和RMSD值,发现RMSD值最低的poses其E_RDock打分也最低,都属于cluster2类别。

 

5. 蛋白-蛋白结合界面氨基酸的非键分析
打开Macromolecules |   Dock and Analyze Protein Complexes|  Analyze Protein Interface(图10) 输入复合体及配体链即可。运行结果如图11所示。

在这里我们可以看到非键作用的种类、数量、距离以及相互作用的界面氨基酸。另外还配有表格文件供用户保存。

 

 

相关软件
Discovery Studio™ (简称DS), 基于Windows/Linux系统和个人电脑、面向生命科学领域的新一代分子建模和模拟环境。它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白
相关阅读