返回

新突破!之江实验室团队联手百度港科大,开发基于曲率的自适应图神经网络,打造蛋白质-配体结合亲和力预测利器!

人工智能

蛋白质-配体结合亲和力预测:揭开药物发现的秘密

引言

了解蛋白质和配体之间的结合亲和力对于药物发现至关重要。为了简化和加速这个过程,图神经网络 (GNN) 应运而生,提供了预测蛋白质-配体结合亲和力的强大方法。在这篇博客中,我们将深入探讨 GNN 在该领域的应用,包括最近开发的一个基于曲率的自适应模型。

蛋白质-配体结合亲和力

蛋白质-配体结合亲和力衡量蛋白质和配体相互作用的强度,这是药物设计和优化的关键因素。传统的预测方法依赖于耗时的分子对接和动力学模拟,而 GNN 提供了一个更有效且准确的解决方案。

图神经网络

GNN 是一种机器学习算法,专为处理图结构数据而设计。蛋白质和配体之间的相互作用可以方便地表示为一个图,节点代表原子,边代表相互作用。GNN 能够利用这些几何特征并学习相互作用的复杂性,从而预测结合亲和力。

基于曲率的自适应 GNN 模型

中国之江实验室、百度和香港科技大学的研究人员合作开发了一个基于曲率的自适应 GNN 模型。该模型利用蛋白质和配体的曲率特征,该特征反映了原子局部环境的弯曲程度。这种方法极大地提高了模型对蛋白质-配体相互作用的捕捉能力。

代码示例

import torch
import torch_geometric as tg

# 加载蛋白质和配体数据
protein = tg.data.Protein()
ligand = tg.data.Ligand()

# 定义 GNN 模型
model = tg.nn.CurvatureAdaptiveGNN(num_layers=3, hidden_dim=128)

# 训练模型
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
for epoch in range(100):
    optimizer.zero_grad()
    loss = model(protein, ligand)
    loss.backward()
    optimizer.step()

# 评估模型
# 使用测试数据集评估模型的性能

模型评估

该模型在多个数据集上进行了测试,包括 Davis 和 PDBbind。它在 Davis 数据集上的平均绝对误差 (MAE) 为 0.61 kcal/mol,在 PDBbind 数据集上的 MAE 为 0.72 kcal/mol。这些结果证明了该模型在预测蛋白质-配体结合亲和力方面的准确性和鲁棒性。

应用前景

基于曲率的自适应 GNN 模型在药物发现、蛋白质工程和生物信息学等领域具有广泛的应用前景。它可以加速药物候选物的筛选、优化蛋白质结构和研究蛋白质-配体相互作用机制。

结论

基于曲率的自适应 GNN 模型为蛋白质-配体结合亲和力预测提供了变革性的方法。它利用 GNN 的强大功能和曲率特征的洞察力,为药物设计和优化领域开启了新的可能性。

常见问题解答

  • GNN 如何应用于蛋白质-配体结合亲和力预测?

    • GNN 利用蛋白质和配体的几何特征,学习相互作用的复杂性并预测结合亲和力。
  • 基于曲率的自适应 GNN 模型的独特之处是什么?

    • 它利用曲率特征,增强了对蛋白质-配体相互作用的捕捉能力。
  • 该模型在药物发现中的应用有哪些?

    • 加速药物候选物的筛选和优化蛋白质结构。
  • GNN 在预测蛋白质-配体结合亲和力方面有什么优势?

    • 计算成本更低,更准确,并且需要较少的实验数据。
  • 基于曲率的自适应 GNN 模型的未来发展方向是什么?

    • 集成其他特征和算法以进一步提高准确性。