Discovery Studio官方教程（Help-Tutorials）| ZDOCK介绍及教程-BIOVIA Discovery Studio-生物仿真分析-软服之家

介绍
蛋白对接技术是一种预测蛋白质相互识别以及相互作用的技术。在Discovery Studio中，我们可以使用ZDOCK来实现蛋白质的对接计算。ZDOCK是一种基于快速傅里叶转化相关性技术的刚性蛋白对接算法。算法中快速傅里叶转化相关性技术被用于搜索蛋白-蛋白系统的平动和转动空间。RDOCK是一种基于CHARMm的能量优化过程，用于优化ZDOCK所寻找到的蛋白-蛋白复合物的结合构型，并使用能量打分函数给这些结合构型打分。（ZDOCK学术用户免费：https://zdock.umassmed.edu/，商业用户只能选择DS软件）

注意：

在准备此计算的输入时，考虑以下因素（建议先使用prepare工具准备一下蛋白）：

1.如果受体或配体蛋白中有缺失的原子或残基，建议在运行本协议之前对它们进行建模。

2.如果缺失的原子或残基位于蛋白质表面，即使缺失的部分不在结合位点上，预测的对接复合体也可能是错误的。这是因为缺少原子或残基的表面可能被错误地预测为结合位点。

3.如果缺失的原子或残基位于蛋白质的核心，对预测的影响就会降低。

4.原子类型和允许的残基类型仅限于标准氨基酸残基。非标准残基中的原子被视为零电荷的碳。

5.一般来说，在运行计算之前，应该先去除水分子。然而，如果包括水，氧原子被视为未知原子(即，作为零电荷的碳)。

6.如果输入的配体或受体有多种构象(例如，核磁共振实验的结构)，则使用第一构象进行计算。如果需要使用除第一个构象以外的其他构象进行计算，则在运行该协议之前删除除该构象以外的所有构象。

7.无论输入分子中是否存在氢原子，计算中都不使用氢原子。

本教程使用ZDOCK来进行蛋白对接的实验，并分析对接的结果。从中选取的一些结合构型，利用RDOCK进行优化。本教程的蛋白对接实验中，我们选用牛β-胰岛素（PDB号：2ptn）作为受体蛋白，另外胰岛素抑制剂CMTI-I（PDB号：2sta，I链）将作为配体蛋白。该牛β-胰岛素及其抑制剂CMIT-I复合物的晶体结构是已知的（PDB号为1ppe）。

本教程涵盖如下内容：

ZDOCK运算的设定

ZDOCK结果的分析

对接构型的RDOCK优化

蛋白-蛋白结合界面氨基酸的RMSD分析

蛋白-蛋白结合界面氨基酸的非键分析

1. ZDOCK运算的设定
打开受体和配体蛋白

在文件浏览器（Files Explorer）中，展开Samples | Tutorials | Protein Modeling文件夹，双击2ptn.pdb文件。DS将在一个新的3D窗口中打开该蛋白。

在同一文件夹中，将2sta_I.pdb拖至上述同一分子窗口（2ptn分子窗口）中。（图1）

蛋白-蛋白对接（ZDOCK）

在工具浏览器（Tools Explorer）中，展开Macromolecules | Dock and Analyze Protein Complexes，点击Dock Proteins（ZDOCK），打开Dock Proteins（ZDOCK）对话框。（图2）

设置Input Receptor Protein为2ptn:2ptn。

设置Input Ligand Protein为2ptn:2sta_I。

点击Angular Step Size右边的栅格，下拉列表中选取15。

注：ZDOCK计算过程中可以采用两种欧拉角度进行结合构型的采样：6°和15°。采样角度为6°时，预测结果更为准确，因为它的最终样本数包括54，000个结合构型。尽管采样角度为15°时的结果准确性有所下降（因为它的采样数只有3600个），但它的计算时间更短。

展开Clustering参数组。

点击RMSD Cutoff参数，将该值设置为6.0。

点击Interface Cutoff参数，将该值设置为9.0。

点击Maximum Number of Clusters参数，将该值设置为60。

本教程中使用的配体抑制剂较小，对于这样小的体系，将RMSD Cutoff设置为 6.0 Å的cluster 半径并同时将Interface Cutoff 设置为9.0 Å，cluster结果会更好。本教程中的ZDCOK运算，将不指定blocked residues也不指定filtering binding site residues。

设置ZRank为False。

ZRank选项用于根据静电势、范德华、去溶剂化效应能来对ZDOCK初始预测的pose进行重新排名。本教程中，我们没有使用该选项。

注：ZDOCK可以在采用blocking和（或）filtering选项时进行计算：

如果有数据表明某些氨基酸残基不可能出现在蛋白-蛋白的作用界面，那么在受体蛋白中选中这些残基，然后设定Receptor Blocked Residues参数为Create New Group from selection。同样的，也可以通过设置Ligand Blocked Residues参数来指定配体蛋白中不可能出现在界面上的残基。

如果有数据表明，某些氨基酸一定会出现在蛋白质-蛋白质作用界面上，那么选中它们。然后展开Filter Poses参数组，设置Receptor Binding Site Residues参数和Ligand Binding Site

Residues参数为Create New Group from selection。

Filter Poses功能也可以在ZDOCK运算完后单独运行，采用Process Poses（ZDOCK）protocol即可。

运行ZDOCK并查看结果

点击Run运行作业，在对话框中观察作业运行状态。点击Background后台运行该作业。

该作业大概需要15分钟的时间（奔4处理器，2Gb的内存，2.8GHz的显示器）。

待作业完成以后，双击任务浏览器（Jobs Explorer）中相应的行，打开Report.htm（图3）。在report文件中分析Summary部分并点击View Results以打开一个包含对接pose的新窗口。（图4）

2. 分析ZDOCK结果
输入的受体蛋白和配体蛋白都显示在视图窗口当中。

如果两个蛋白分子并没有在视图窗口当中显示，则在工具栏中点击Fit To Screen按钮使两个蛋白分子居中显示。每一个聚类的中心pose都以点的形式显示在受体蛋白的周围。

1. 结合构型的聚类（Cluster）结果

在系统视图（Hierarchy View）中，展开Docked Poses和Clusters。

这将打开几组Clusters和poses。Cluster_1是更大的聚类(包含的poses最多)，后续的聚类所包含的pose逐渐减少。

在系统视图（Hierarchy View）中，关闭Docked Poses和Clusters组。在表格浏览器（Data Table）中，点击Protein Pose标签。

这将显示如下关于ZDOCK运算结果的信息：

l ZDock Score – 包含每个对接构型的ZDOCK分数（PSC 打分函数），Pose 1的 Zdock分数最高（更好）。

l Cluster – 指明每个对接构型所属的聚类组

l ClusterSize – 报告每个聚类含有的对接构型的个数。

l Density – 报告聚类过程中临近的对接构象数目。

关于聚类算法的详述，可以参考Discovery Studio Help中的Clustering and analysis of docked protein poses。

2. 结合构型作图分析

以下的步骤将解释如何使用不同的方法，借助plots和Dock and Analyze Protein Complexes工具来帮助观看对接构型，并选择一部分ZDOCK的对接构型进行进一步的RDOCK优化。

在工具浏览器（Tools Explorer）中，展开Macromolecule | Dock and Analyze Protein Complexes，在Browse Poses一栏下设置Browse为Top Poses in Largest Clusters。

这将显示10个更大的聚类中100个打分更好的pose。

点击First显示第一个pose的配体分子。

这将在分子窗口的视图窗口中产生一个名为Pose1_Cluster2_2sta_I的配体分子。

点击Lock Visibility保留配体分子的该pose并一直处于可见状态。

点击Next观察配体分子的下一个pose，是cluster2中的pose3。

观察到该pose同第一个pose很相似。

点击Next两次显示Pose7_Cluster5_2sta_I。

观察到该pose对接至受体的位置很相似，但是配体的对接界面却有较大的差距。

继续点击Next观察其他pose，如果想要保留某一个pose则点击Lock Visibility。

在Data Table中，点击ProteinPose，使之处于激活状态。

单击鼠标右键，选取List Only Visible Objects。

点击ZDockResult点状图标签，拖拽该窗口，以使能够同时看到ZDockReults窗口。

在View工具栏中，点击Select工具，选中ZDockResults窗口中一些ZDock打分高于12.0的点。

该操作共选取了11个pose，5个pose属于cluster2，4个pose属于cluster1，cluster3和5各包含一个pose。

3. 利用RDOCK优化对接构型
RDOCK优化

点击ZDockResults分子窗口，以使该窗口处于激活状态。

在工具浏览器（Tools Explorer）中，展开Macromolecules | Dock and Analyze Protein Complexes，在Refine Poses一栏下，点击Refine Docked Proteins（RDOCK），打开Refine Docked Proteins（RDOCK）对话框。（图7）

点击Input Receptor Protein右边的栅格，下拉列表中选择ZDockResults:2ptn。

点击Input Ligand Protein右边的栅格，下拉列表中选择ZDockResults:2sta_I。

点击Input Poses右边的栅格，下拉列表中选择Create New Group From Selection。

默认的会将该新产生的组命名为Group，共包含之前选取的11个pose。

注：Dielectric Constant参数仍保留设置为4.0。该值即运算RDOCK中计算CHARMm能量时所用的介电常数。

点击Run运行作业，在对话框中观察作业运行状态。

点击Background后台运行该作业。

该作业大概需要5分钟的时间（奔4处理器，2Gb的内存，2.8GHz的显示器）。作业结束时会出现一个提醒任务结束的对话框。

结果分析

待作业完成以后，双击任务浏览器（Jobs Explorer）中相应的行，打开Report.htm。

在report文件

中点击View Results打开一个新的分子窗口。（图8）

经RDOCK优化的对接构型均出现在该窗口中，其中top refined pose在视图窗口中显示。

每一个优化好的pose其RDOCK所计算的各能量值都列在表格浏览器（Data Table View）中。

l E_elec1 and E_elec2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的静电势能

l E_vdw1 and E_vdw 2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的范德华非键作用能

l E_sol – 经ACE方法计算得到的蛋白质复合物的去溶剂化能

l E_RDock – RDOCK分数的定义为：E_elec2 + beta×E_sol

表格中同样还包含了运算ZDOCK之后得到的各pose的性质，例如ZDock Score和聚类信息等。这些信息有利于结果的解释。

RDock打分更好的pose属于cluster2。这也证实了cluster2所包含的pose是对接更好的结果，有可能同真实的对接构象比较接近。

在Table中，点击可以看到第一个pose的3D构象。分别点击和可以查看上一个和下一个pose的结构。

4. 使用RMSD分析结合界面的氨基酸
本小节将把对接的构型同蛋白质复合物PDB 1ppe的晶体结构进行比较。

打开PDB 1ppe

点击Poses分子窗口的标签，使该窗口处于激活状态。

从主菜单栏中，选取File | Insert From | URL，打开Insert From URL对话框。

在ID文本框中输入1ppe。确保地址栏设置为Default PDB Structures。

点击Open。

这将在Poses分子窗口的视图窗口中插入1ppe蛋白复合物结构。

在分子窗口中，单击鼠标右键，选取Show All显示所有pose。

在系统视图（Hierarchy View）中，展开Cell，然后展开1PPE。

选中Water，Delete。这将删除1ppe中的水分子。

将对接构型与1ppe叠合

在进行RMSD计算之前，首先应该将对接的poses和1ppe进行基于受体蛋白的叠合。

在视图窗口（Graphic View）中，单击鼠标右键，选取Show Sequence。

这将打开一个Sequence窗口。（图9）

点击Poses分子窗口标签，激活该窗口。

在系统视图（Hierarchy）中，点击选中1ppe的E链。

在工具浏览器（Tools Explorer）中，展开Macromolecules | Superimpose Proteins，在Reference Protein一栏下，选取1PPE中选中的链作为叠合时的参考分子。

在Sequence Alignment一栏中，设置Sequence Alignment为Poses，并将弹出的窗口关闭。

在分子窗口中，确保1ppe的E链仍被选中。

在Superimpose Proteins一栏中点击Superimpose。

该步将对接poses的受体对接至1ppe的E链。

计算结合界面氨基酸的RMSD值

在系统视图（Hierarchy）中，点击选中1ppe的I链。

在Dock and Analyze Protein Complexes工具面板下，点击Define Ligand。

点击Select Binding Interface。

选中处于蛋白-蛋白分子界面的氨基酸残基。

从菜单栏中，选择Structure | RMSD | By Sequence Alignment….

这将打开RMSD by Sequence Alignment的对话框。

在该对话框中，点击Reference molecule右边的栅格，下拉列表中选择1ppe。点击Selected residues左边的圆形按钮，关闭Report at residue level选项。点击OK。（图10）

DS将在一个新的Html窗口中打开一个基于选中氨基酸的RMSD报告。（图11）

比较对接poses的E_RDock打分和RMSD值，发现RMSD值最低的poses其E_RDock打分也最低，都属于cluster2类别。

5. 蛋白-蛋白结合界面氨基酸的非键分析
打开Macromolecules | Dock and Analyze Protein Complexes| Analyze Protein Interface（图10）输入复合体及配体链即可。运行结果如图11所示。

在这里我们可以看到非键作用的种类、数量、距离以及相互作用的界面氨基酸。另外还配有表格文件供用户保存。

Discovery Studio官方教程（Help-Tutorials）| ZDOCK介绍及教程

BIOVIA Discovery Studio

相关阅读

分子指纹在虚拟筛选的应用

大佬最新力作综述，分子对接小白必看

Discovery Studio | 使用CDOCKER对接气味受体和配体

BIOVIA-为下一代电池提供动力

【Discovery Studio应用案例】通过分子对接从鸡汤中鉴定和虚拟筛选新型鲜味肽

【Discovery Studio应用案例】通过分子对接对太平洋白虾全蛋白序列黄嘌呤氧化酶抑制肽的虚拟筛选和结构优化

提升药物发现的卓越性：在Discovery Studio Simulation中将AI/Ml模型与基于物理的仿真方法相结合

【Discovery Studio应用案例】使用计算机体外联合方法鉴定新型 β-微管蛋白抑制剂

Discovery Studio是一款功能强大的软件套件，广泛用于3D分子建模、模拟和可视化

【Discovery Studio应用实例】中国农业科学院：结合多光谱技术的分子对接模拟阐明了小分子配体如何与生物大分子结合