GPU 计算和深度学习在药物发现中的转型作用

图灵汇官网

导读

深度学习(DL)在科学研究领域掀起了革命浪潮,尤其在药物发现方面展现出了颠覆性的潜力。这一转变主要得益于图形处理单元(GPU)的性能飞跃及其算法的创新,这些进步极大地提升了数据并行处理的能力。近期,来自不列颠哥伦比亚大学、北卡罗来纳大学教堂山分校和英伟达的研究团队携手发布了一篇题为《GPU计算与深度学习在药物发现中的转型角色》的综述文章。

研究概述

该综述全面回顾了GPU算法的历史演进与最新动态,探讨了GPU与深度学习技术如何直接推动新药与药物靶点的发现。文章详细介绍了先进的深度学习架构,这些架构在早期药物发现阶段以及后续的先导优化过程中得到了实际应用,包括分子对接加速、脱靶效应评估和药理性质预测。此外,报告还分析了GPU加速与深度学习模型如何促进药物发现领域的全球民主化进程,这一进程有望对不断扩大的化学领域进行有效探索,从而加速新药的发现进程。

GPU与深度学习在分子模拟中的应用

GPU计算的并行性显著提高了大规模数据处理效率,特别适用于分子模拟中的原子势能独立计算。深度学习模型的训练也得益于GPU的强大并行处理能力,如矩阵变换操作。这一技术革新使得GPU成为加速分子动力学模拟的关键工具,不仅在生物分子现象的模拟上实现了前所未有的扩展,还能够在实验时间尺度上模拟更复杂的系统,如病毒和细胞。

自由能模拟与量子力学

GPU技术的进步还促进了自由能模拟领域的快速发展,包括结合自由能计算、热力学积分和自由能扰动等方法的应用,从而更准确地预测蛋白质-配体复合物的结合亲和力。TeraChem作为首个专门为GPU编写的量子化学软件,利用混合精度算术高效计算库仑和交换矩阵,为全蛋白质的密度泛函理论(DFT)模拟提供了可能。

GPU加速下的蛋白质结构研究

冷冻电镜技术的高通量和自动化成为了蛋白质结构确定的重要手段。基于深度学习的方法,如DEFMap和DeepPicker,显著加速了冷冻电镜图像的处理流程。此外,AlphaFold-2方法在蛋白质结构预测关键评估(CASP)挑战中的成功,预示了深度学习在未来蛋白质结构表征和可药用蛋白质组扩展中的巨大潜力。

DL在CADD中的兴起与应用

随着深度学习在计算机视觉和语言处理领域的突破,CADD研究人员重新审视并采纳了神经网络。支持GPU的深度学习架构与化学基因组学数据的激增,催生了具有临床价值的药物发现案例。AI驱动的公司(如BenevolentAI、Insilico Medicine和Exscientia)的成功案例证明,GPU计算支持的AI方法在加速新药和改进药物发现方面具有显著效果。

DL架构在CADD中的应用

从基于现有或合成可行化学库的虚拟筛选到从头药物设计中DL生成模型的成功应用,一系列先进深度学习架构被描绘在图4中。表1列举了这些架构在药物发现中的具体应用实例。

扩大虚拟筛选的GPU与DL应用

基于结构的和基于配体的虚拟筛选方法依赖于化合物与靶点的计算结合亲和力排序。面对庞大可购买配体库的指数级增长,GPU和DL技术被用来提升筛选效率,尤其是对于计算资源有限的大型化学库。基于DL的平台通过预测和分子对接加速了活性化合物的选择过程,有助于学术研究小组和中小型企业等访问化学空间。

GPU与DL促进开放科学与药物发现的民主化

DL与CADD的融合极大地推动了药物发现与开放科学工作的全球化民主化进程。DL模型对大量数据的需求推动了数据共享实践,并促使制定更广泛的开放数据政策。云原生计算和面向微服务架构的GPU加速使得CADD方法更加易于获取和标准化,从而促进了计算模块、工具、平台和用户界面的统一。

结论与展望

现代药物发现正受益于DL模型和GPU并行计算的快速进展。硬件创新推动了从虚拟筛选到QSAR分析再到生成药物设计的药物发现难题上的DL应用。预计,功能更加强大的GPU架构和高级DL策略与GPU加速算法的发展,将助力全球科学界以更低成本和更广泛的范围参与药物发现过程。

结语

深度学习与GPU计算的结合,不仅在药物发现领域引发了革命性的变化,还在生命科学的其他未开发领域展现出巨大的潜力。联邦学习和协作机器学习等技术正逐渐成为推动这一民主化变革的先锋力量,未来几年内,这些应用将进一步成熟,促进跨学科合作与知识交流。

本文来源: 互联网 文章作者: 机器之心Synced
    下一篇

导读:梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在Kaggle上参加机器学习比赛,用什么算法最容易拿奖金? 你可能会说:当然是深度学习。 还真不是,据统计获胜最多的是像XGBoost