Discovery Studio官方教程-构建及优化组合化合物库

0 评论

目的: 通过此教程,了解Discovery Studio中构建组合化合物库并进行优化操作方法及结果分析。

所需功能和模块:Discovery Studio Client,DS Library Design。

所需数据文件:amines_35.sd,acids_45.sd和AmideFormation.rxn

所需时间:10分钟

介绍

组合化学为发现新的药物先导化合物提供了大量候选化合物,但它是一种高成本、低利用率的方法。虚拟组合库的出现和虚拟筛选的方法使组合化学扬长避短,成为一种更实用的药物研究方法。而在成功构建组合库后,将组合化学和合理药物设计结合起来,通过分子模拟和理论计算方法合理地设计虚拟化合物库,可以增加库中化合物的多样性和类药性,提高库的质量和筛选效率。因此,对于一个构建好的虚拟库,通常需要同时对多种性质进行优化,而通过帕累托优化则可以同时优化组合库的各类性质。

本教程主要介绍了如何通过同一个反应类型构建虚拟组合化合物库,并经帕累托优化使得到的子化合物库兼具多样性及类药性。

本教程包括以下步骤:

组合库的构建及优化
结果分析
组合库的构建及优化

 本教程基于以下羧酸和氨缩合成酰胺的反应类型为基础构建虚拟组合化合物库:

构建组合库操作及参数设置

 1.组合库构建参数设置

在文件浏览器(Files Explorer)中,展开Samples| Tutorials| Library Design文件夹,找到amines_35.sd文件,双击打开在分子窗口中显示(默认为表格浏览器),在同一个文件夹中找到acid_45.sd,单击选中并拖拽进入同一窗口中。

展开分子视图(Graphical View)窗口(可通过CTRL+G展开)和系统视图(Hierarchy View)窗口(可通过CTRL+H展开)(图2)

可通过表格视图(Table View)中的按钮逐一查看各分子结构

在工具浏览器(Tools Explorer)中,展开Small Molecules| Select Subset Libraries,点击Optimize Combinatorial Library with Pareto Method。

在打开的参数设置面板中,点击Input Library Type,在下拉列表中选择Reation。

点击Input Reactants一栏,在下拉列表中选择amine_35:All。

点击Input Reaction File,浏览选取Samples\Tutorials\Library Design\AmideFormation.rxn,指定依据的反应类型。

在Library Dimensions参数栏输入7,8,指明每个片段库中分别用于后续组合库构建的片段个数,此处即由7个含氨基分子和8个羧基化合物反应得到含56个酰胺类化合物的化合物库。上述参数设置如下图3所示:

2.定义帕累托优化参数设置

点击Optimization Property 1参数栏右边的浏览按钮,在出现的Calculable Property对话框(图4)中输入fcfp,在下拉列表中选择FCFP_12,点击OK载入,即从分子多样性的角度来优化库。

展开Optimization Property 1参数栏,点击What to Optimize参数,在下拉列表中选择Unique Value Count,Goal 为默认的Maximize。

通过优化得到此性质更大化的子化合物库,用来描述库的多样性

点击Optimization Property 2参数栏右边的浏览按钮,在出现的Calculable Property对话框(图5)中输入molecular_weight,在下拉列表中选择此参数,点击OK载入

展开Optimization Property 2参数栏,点击What to Optimize参数,在下拉列表中选择Range Penalty,点击Range Minimum,输入100,点击Range Maximum输入500,Goal选择Minimize。

通过优化可得到分子量在100-500之间的分子,并且越小越好。

 点击Optimization Property 3参数栏右边的浏览按钮,在出现的Calculable Property对话框(图6)中输入num_h_donors_lipinski,在下拉列表中选择此参数,点击OK载入

展开Optimization Property 3参数栏,点击What to Optimize参数,在下拉列表中选择Range Penalty,点击Range Minimum输入0,点击Range Maximum输入5,Goal选择Minimize。

通过优化可得到氢键供体数目在0到5之间的分子,且越少越好。

优化部分参数设置如下图7所示:

点击Run运行作业。

等待作业完成,会自动弹出一个Report页面。

结果分析

1.查看Report页面

从Summary一栏可知,该次运算产生了20个化合物库,每个库中包含56个分子,帕累托优化后结果和各个库的结果描述如下表(图8)所示:

其中,ParetoFront为1代表计算结果已收敛,否则,需要增加参数设置中的迭代步数(默认为500),直到该值为1为止;

FCFP_12_UniqueValueCount代表化合物多样性,该值越大代表多样性越好;Molecular_Weight_RangPenalty代表化合物库中分子量平均值与设置范围的偏差,如该例中分子量设为100到500,如果分子库平均分子量在两者之间,该值为0,该值越大,说明离设定的范围越远;

同理,Num_H_Donors_Lipinski_RangePenalty代表氢键供体数目平均值与设置范围的偏差,此值为0时说明满足所设定条件(该例中设定范围为0到5之间),该值越大说明离设定的范围越远;

最后两栏分别代表构建化合物库所用到的7个含有氨基的分子和8个含有羧基分子的编号;

经以上分析可知,我们需要找到FCFP_12_UniqueValueCount值较大,Molecular_Weight_RangPenalty和Num_H_Donors_Lipinski_RangePenalty两值较小的分子。

 从Summary中,还可以看到4个二维点图,以第一副图为例(图9):

该图中靠近右上方分子库多样性较好但分子量偏高,左下方分子库分子量接近所设定范围但多样性偏差,如需两者兼顾可选中间化合物库进行研究。

点击Results中的View Optimization Progress,可得到三维显示点图(图10),分析方法类似。

相关软件
Discovery Studio™ (简称DS), 基于Windows/Linux系统和个人电脑、面向生命科学领域的新一代分子建模和模拟环境。它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白
相关阅读