Discovery Studio
本文简要介绍了最近在BIOVIA Discovery Studio®中实现的两种计算机模拟方法,用于评估蛋白质的溶解度及其在生物制品(包括抗体)工程中的实用性。
介绍
工程生物制剂时要考虑的最重要的特性之一是蛋白质溶解度。 由于生产中的低表达或纯化、降解、储存和/或给药方面的问题,溶解性差会影响产量。
在这里,我们概述了两种基于物理的蛋白质溶解度计算方法。两种模型均基于现有 BIOVIA Discovery Studio (DS)组件执行的组合 CHARMm GBIM分子力学和蛋白质电离计算,以评估转移自由能 (ΔGtr )[4] 在液相和凝相之间。一般来说,蛋白质聚集是一个多阶段过程,从形成不同大小的寡聚体开始,如二聚体、三聚体等。我们可以假设在饱和状态下,凝聚相由相对较大的结晶颗粒组成。然后,我们可以用蛋白质分子对晶格表面的结合能(ΔGbnd)来近似转移自由能ΔGtr,它可以用蛋白质溶解度来表示,ΔGbnd=RTln(S)(图1)。
图1 与模型结晶颗粒结合的蛋白质
理论
第一种方法基于新的结合亲和力溶解度模型(BSM),其中通过直接计算蛋白质与晶格的结合亲和力来评估蛋白质溶解度。据我们所知,BSM 模型在文献中没有类似物。虽然评估完整晶格能量是不现实的,但我们首次提出了一种近似值,其中晶格由被其直接相邻晶体包围的中心蛋白质分子表示(图1)。使用 DS的Create Crystal Neighbors协议,我们生成了模型粒子的原子坐标。基于模型晶体颗粒,我们使用Calculate Mutation Energy (Binding)方案评估了 pH 依赖性和突变对蛋白质溶解度的影响。结合能通过与 pH 无关以及与 pH 相关的静电项的总和来计算,两者都被认为是蛋白质分子结合亲和力的主要贡献者。
与 pH 无关的项包括由 CHARMm 模块计算的范德华和熵贡献,静电项是使用与Calculate Protein Ionization and Residue pK协议中相同的方法推导的。第二种方法基于经验溶解度模型 (ESM),该模型是为快速排列大量蛋白质变体的溶解度而开发的。我们在Calculate Protein Formulation Properties协议中实施了 ESM 模型。在 ESM 模型中,我们通过经验评分函数估计 pH 和突变对溶解度的影响(图 2)。
ESM 模型中用于计算溶解度分数的蛋白质特性
蛋白质分子之间的静电斥力与pH依赖性蛋白质净电荷平方αZ2成正比;由电荷不对称引起的静电引力用偶极矩平方 -βD2 来近似;溶剂化贡献计算为凝聚相和溶液相之间的溶剂化能差 ΔGslv。我们假设非极性相互作用,例如范德华引力,与疏水表面斑块成正比,并且我们通过疏水聚集倾向得分 AS 来近似它们,该得分是按照 Chennamsetty 等人的方法计算的。并在Calculate Protein Formulation Properties协议中实施,其中系数α、β、γ和C是经验参数。
结果和讨论
我们最初使用 Shaw 等人发表的研究中的实验数据测试了 ESM 和 BSM 方法预测溶解度的 pH 依赖性的能力。该研究的重点是 RNase SA 及其3K和5K突变体的溶解度,两种方法都很好地预测了溶解度的 pH 依赖性,特别是 5K 突变体溶解度的重要 pH 形状(图2)。此外,在 RNase SA 计算中使用相同的 ESM 参数,我们实现了锌-胰岛素实验 pH 溶解度的良好拟合。
图3 RNase SA 5K突变体 (PDB:3APE) 在 0.01 M 缓冲液浓度下溶解度的 pH 依赖性,通过 BSM 和 ESM 方法计算并与 Shaw 等人的实验数据进行比较
除了模拟蛋白质溶解度的 pH 形状之外,BSM 和 ESM 方法还用于预测突变对蛋白质溶解度的影响,以用于蛋白质设计。使用 RNase SA 上的 21 个单突变的实验数据进行了初步测试,包括 Thr76 突变为所有氨基酸类型。BSM 和 ESM 方法都显示出与实验值的强相关性,皮尔逊相关系数R分别为 0.90 和 0.92(图 3)。然而,值得注意的是,BSM 结果是在没有对自由能函数进行任何调整的情况下获得的,并且计算使用完全相同的Calculate Mutation Energy (Binding)协议参数运行,就像我们之前对蛋白质结合亲和力和蛋白质稳定性的研究。
图4 计算出的 ESM 和 BSM 在 1.1M 硫酸铵下的溶解度与 RNase SA (PDB:1RGG) 21 个单突变的实验值的相关性
此外,我们将 ESM 方法应用于 122 个具有单突变、双突变和多突变的蛋白质,这些突变来自 Tian 等人发布的数据集。目的是评估 ESM 方法预测这些突变导致的溶解度变化的能力,无论实验方法或聚集机制如何。
总之,该方法正确预测了突变的影响(提高或降低溶解度),122 例中有 95 例 (78%)。有趣的是,当我们考虑到蛋白质稳定性的变化并假设不稳定突变超过 4.0 kcal/mol 将降低溶解度时,预测率已增加到 122 个突变中的 107 个(88%)。为此,我们通过 pH 依赖模式下的Calculate Mutation Energy (Stability)方案计算了每个突变的折叠能量变化。我们获得的结果表明,大多数蛋白质仅具有一定程度的稳定性,折叠能量几千卡/摩尔的变化可能会导致部分或完全解折叠;因此,增加了聚集倾向,进而降低了蛋白质的溶解度。
考虑到对治疗性抗体的计算机设计的重大兴趣,我们还进行了ESM计算来预测溶解度,并将结果与5种不同抗体数据集的实验值进行了比较。它包括抗-IL-13抗体CNTO607的7种变体,靶向神经生长因子(NGF)的单克隆抗体的9种不同变体,模型抗体mAb- J的11种变体,人源化抗三硝基苯抗体HzATNP的17种变体,VEGF结合G6合成mAb的11种变体。预测抗体溶解度的一个重要问题是,大多数可用的x射线结构都是抗体片段,如Fab或Fv结构域,而溶解度测量通常是在全长抗体上进行的。因此,在本研究中,我们提出并测试了一种抗体导向的ESM评分函数(ESMab)变体,假设Fab或Fv片段的突变可以通过Fab – Fab和Fab – Fc相互作用来稳定晶体状态,并且适用于Fab和Fc结构都可用的情况。参考文献1的表9总结了抗体溶解度的ESM预测结果。ESM方法正确预测了67个突变变体中的53个(80%)的溶解度变化,每个抗体数据集的Pearson相关系数R在0.83和0.91之间。测试还表明,ESM结果的准确性优于其他方法,如CamSol、Tango和Solubis。
结论
蛋白质的溶解度受蛋白质分子之间以及与溶剂分子之间的相互作用的影响。在这项工作中提出的模型包括一些影响溶解度的最重要的相互作用,如静电排斥和吸引,非极性相互作用,以及蛋白质分子从液体转移到结晶相的脱溶和熵惩罚。与大多数现有方法不同,BSM和ESM模型考虑了酸性和碱性氨基酸残基的质子化能。两种方法都能以合理的准确性预测pH值和突变对蛋白质溶解度的影响。
由于蛋白质大小的限制和需要晶体颗粒结构,虽然不如ESM方法实用,但我们认为BSM方法具有相当大的理论价值,因为它首次证明了蛋白质溶解度可以从完全物理的、基于力场的模型中推导出来,并为未来设计更有效的实现开辟了道路。
ESM方法在Calculate Protein Formulation Properties协议中实现,同时计算可发展性指数(DI)和粘度评分。它适用于快速筛选大量的设计变体。抗体测试结果表明,溶解度预测具有良好的准确性,并进一步证明,ESM适用于具有改进配方特性的新生物制剂工程或其他生物技术行业中使用的蛋白质。
参考文献
1. Spassov, V.Z., Kemmish, H.., Yan, L. Two physics-based models for pH-dependent calculations of protein solubility. Protein Sci., 2022;31:e4299.
2. Brooks, B.R., Brooks, C.L. III, Mackerell, D.A. Jr. et al. CHARMM: the biomolecular simulation program. J. Comp. Chem., 2009;30:1545-614.
3. BIOVIA Discovery Studio Modeling Environment, Release 2021, BIOVIA Dassault Systemes:San Diego,CA. https://www.3ds.com/productsservices/biovia/products/ molecular-modeling-simulation/biovia-discovery-studio/
4. Tjong, H., Zhou, H-X. Prediction of Protein Solubility from Calculation of Transfer Free Energy. Biophysical J., 2008;95:2601–2609.
5. Tanford, C. Physical chemistry of macromolecules, Wiley, New York, 1961.
6. Spassov, V.Z., Yan, L. pH-selective mutagenesis of protein–protein interfaces: In silico design of therapeutic antibodies with prolonged half-life. Proteins, 2013;81:704-714.
7. Spassov, V.Z., Yan, L. A fast and accurate computational approach to protein ionization. Protein Science, 2008;17:1955-1970.
8. Chennamsetty, N., Voynov, V., Kayser, V., Helk, B., Trout, B. Design of therapeutic proteins with enhanced stability. Proc. Natl. Acad. Sci. USA, 2009;106:11937-11942.
9. Spassov, V.Z., Yan, L., Szalma, S. Introducing an implicit membrane in generalized Born/solvent accessibility continuum solvent models. J. Phys. Chem. B, 2002;106:8726-8738.
10. Spassov, V.Z., Bashford, D. Multiple-site ligand binding to flexible macromolecules: Separation of global and local conformational change and an iterative mobile clustering approach. J. Comput. Chem. 1999;20:1091–1111.
11. Shaw, K.L., Grimsley, G.D., Yakovlev, G.I., Makarov, A.A., Pace,
C.N. The effect of net charge on the solubility, activity, and stability of ribonuclease Sa. Protein Science, 2001;10:1206– 1215.
12. Trevino, S.R., J. Martin Scholtz, M., Pace, C.N. Amino acid contribution to protein solubility: Asp, Glu, and Ser contribute more favorably than the other hydrophilic amino acids in RNase Sa. J. Mol. Biol., 2007;366:449–460.
13. Spassov, V.Z., Yan, L. A pH-dependent computational approach to the effect of mutations on protein stability. J. Comp. Chem., 2016;37:2573-2587.
14. Desbuquois, B., Aurbach, G.D. Effects of iodination on the distribution of peptide hormones in aqueous two-phase polymer systems. Biochem J. 1974;143:83–91.
15. Tian, Y., Deutsch, C., Krishnamoorthy, B. Scoring function to predict solubility mutagenesis. Algorithms for Molecular Biology, 2010;5:33.
16. Wu, S.J., Luo, J., O’Neil, K.T., et al. Structure-based engineering of a monoclonal antibody for improved solubility. Prot Eng Des Sel., 2010;23:643–651.
17. Bethea, D., Wu S-J., Luo, J., et al. Mechanisms of self-association of a human monoclonal antibody CNTO607. Prot Eng Des Sel., 2012;25:531–537.
18. Sormanni, P., Amery, L., Ekizoglou, S., Vendruscolo, M., Popovic,
B. Rapid and accurate in silico solubility screening of a monoclonal antibody library. Sci Rep. 2017;7:820.
19. Shan, L., Mody, N., Sormanni, P., Rosenthal, K.L., Damschroder, M.M., Esfandiary R. Developability assessment of engineered monoclonal antibody. Variants with a complex selfassociation behavior using complementary analytical and in silico tools. Mol Pharm. 2018;15:5697–5710.
20. Wolf Pérez, A-M., Sormanni, P., Andersen, J.S., Sakhnini, L.I., Rodriguez-Leon, I., Bjelke, J.R., Gajhede, A.J., De Maria, L., Otzen, D.E., Vendruscolo, M., Lorenzen, N. In vitro and in silico assessment of the developability of a designed monoclonal antibody library, mAbs, 2019;11:388–400.
21. Van der Kant, R., Karow-Zwick, A.R., Durme, J.V., et al. Prediction and reduction of the aggregation of monoclonal antibodies. J Mol Biol. 2017;429:1244–1261
22. Agrawal, N.J.; Helk, B.; Kumar, S.; Mody, N.; et al. Computational tool for the early screening of monoclonal antibodies for their viscosities. mAbs, 2016, 8: 43-48.
Discovery Studio软件介绍
BIOVIA Discovery Studio 是一款生命科学分子模拟软件,它为研究人员提供了一个完整的工具集,用于探索蛋白质化学的细微差别并促进小分子和大分子治疗药物的发现,帮助研究人员在抗体开发过程中扮演重要角色。
此外,DS软件还提供了抗体自动建模,可以轻松快速地从一组轻链和重链抗体序列以及经过策划的 PDB 抗体模板数据库生成高质量的 3D 抗体全长、Fab 或 Fv 模型(也可以实现对纳米抗体和双特异性抗体的3D建模)。
除此之外还提供了对抗体人源化建议和预测抗体及辅料对抗体的聚集效应。这些工具可以帮助研究人员更好地理解抗体的性质,并在开发和配方过程中尽早改进这些性质,从而加快产品上市的速度和降低总成本。
公司介绍
东方科软成立于2016年10月,总部设在北京,主要服务材料科学与生命科学两大领域的用户,为其提供模拟仿真软件、技术咨询、技术培训及技术支持服务。
公司打造行业领域产品生态圈,不断引进国内外各种先进产品与技术,为材料和药物的设计与创新提供综合解决方案。团队专业背景覆盖材料科学、物理、化学化工、石油石化、生物医药等重要领域,能为用户提供专业、高效、快捷、精准的技术支持与服务。
目前,我们已服务上百家相关学术及企业用户,为他们的产品研发和创新提供了强有力的科学信息软件技术服务与产品支持!