首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

麻省理工学院教授神经网络来预测蛋白质如何连接

麻省理工学院的研究人员创建了一个机器学习模型,可以预测两种蛋白质结合在一起时形成的复合物。他们的方法比现有方法快 80-500 倍,并且通常预测的蛋白质结构更接近实验观察到的结构。

抗体是免疫系统产生的小蛋白质,可以附着在病毒的某些部分以中和它。随着科学家们继续抗击 SARS-CoV-2,一种可能的方法是合成抗体,该抗体与病毒的刺突蛋白结合,以防止病毒进入人体细胞。

为了开发成功的合成抗体,研究人员必须准确地描述蛋白质附着的过程。具有包含许多折叠的块状三维结构的蛋白质可以以数百万种组合粘在一起,因此在几乎无数的候选者中找到合适的蛋白质复合物非常耗时。

新方法可以帮助科学家更好地了解蛋白质相互作用中涉及的一些生物过程,例如 DNA 复制和修复;这也可以加快开发新药的进程。

“深度学习非常擅长捕捉化学家或生物学家难以通过实验记录的不同蛋白质之间的相互作用。其中一些交互非常复杂,人们还没有找到表达它们的好方法。这种深度学习模型可以学习这些类型的数据驱动交互,”麻省理工学院计算机科学与人工智能实验室 (CSAIL) 博士后 Octavian-Jugen Ganea 说。

研究人员开发的名为 Equidock 的模型侧重于两种蛋白质通过在三维空间中旋转或移动而结合在一起的过程,但它们的形状不会收缩或弯曲。

该模型采用两种蛋白质的 3D 结构并将它们转换为可由神经网络处理的 3D 图。蛋白质由氨基酸链组成,每个氨基酸都由图中的一个节点表示。

研究人员将几何知识整合到模型中,因此它了解对象在 3D 空间中旋转或移动时会如何变化。该模型还内置了数学知识,可确保蛋白质始终以相同的方式附着,无论它们在 3D 空间中的哪个位置。

利用这些信息,机器学习系统可以识别出两种蛋白质中最有可能相互作用并形成称为结合点的化学反应的原子。然后她使用这些点将两种蛋白质结合成一个复合物。

“如果我们能从蛋白质中找出哪些单独的部分可能是这些结合点,那么这将为我们提供将两种蛋白质连接在一起所需的所有信息。假设我们可以找到这两组点,我们就可以弄清楚如何旋转和移动松鼠,以使一组与另一组匹配,”Ganea 解释说。

构建模型的最大问题之一是缺乏训练数据。Ganea 说,由于蛋白质的实验性 3D 数据很少,因此在 Equidock 中包含几何知识尤为重要。

在训练模型后,研究人员将其与四种现有的软件方法进行了比较。Equidock 可以在短短一到五秒内预测最终的蛋白质复合物。通常这个过程需要更长的时间,从 10 分钟到一个小时或更长时间。

在质量方面,Equidock 衡量预测的蛋白质复合物与实际蛋白质复合物的匹配程度,通常与原始方法相当,但有时不如原始方法。

“我们仍然落后于其中一个基准。但是我们的方法可以在一个非常大的虚拟屏幕中使用,我们想要了解数千种蛋白质如何相互作用并形成复合物。它还可以用于非常快速地创建一组初始候选者,然后使用一些更准确但速度较慢的传统方法对其进行处理,”Ganea 指出。

麻省理工学院团队希望在 Equidock 中包含特定的原子相互作用,以便系统可以做出更准确的预测。例如,有时蛋白质中的原子通过涉及水分子的疏水相互作用附着。

Ganea 说,他们的方法也可以用于开发类似药物的小分子。这些分子以特定方式与蛋白质表面结合,因此快速确定这种附着方式可以缩短药物开发时间。

未来,研究人员计划改进 Equidock,以便该系统可以预测灵活的蛋白质对接。最大的障碍是缺乏训练数据,因此他们正在努力生成可用于改进模型的合成数据。

2021 年,DeepMind发布了其 AlphaFold 2 深度学习神经网络的一个版本,用于确定蛋白质的 3D 结构。它是开源的,开发人员详细介绍了该模型的工作原理。DeepMind 之前已经 展示了其软件如何仅使用由 DNA 确定的序列来准确预测许多蛋白质的结构。几十年来,研究人员一直在研究他们的系统,AlphaFold 2 擅长 通过 解决一个 50 年前的蛋白质折叠问题来批判性地评估 CASP 蛋白质结构预测

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20220429A02WLL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com