英伟达推出GPU加速化学工具nvMolKit,为AI药物研发带来数量级效能提升

在当今药物研发领域,化学信息学工具的性能正成为制约AI驱动分子发现的关键瓶颈。随着可合成化学空间呈指数级扩张、深度学习技术广泛应用以及基础模型快速崛起,传统的基于CPU的计算方案已难以满足高通量、大规模分子生成与分析的需求。为解决这一挑战,英伟达与知名开源化学工具包RDKit的开发团队合作,推出了全新的GPU加速库——nvMolKit,旨在将化学信息学中关键任务的计算效率提升1至4个数量级。

nvMolKit并不是一个替代RDKit的全新平台,而是一个专注于GPU加速的核心扩展库。它通过RDKit的C++接口实现底层功能对接,并保留用户熟悉的Python调用方式,实现了“即插即用”的兼容性。用户无需改变原有代码结构,即可直接调用nvMolKit中经过GPU优化的功能模块,在保持计算结果精度一致的前提下,大幅提升运行速度。

目前,nvMolKit主要针对五个核心功能实现了GPU加速:

  1. Morgan指纹生成:在H100 GPU上结合多线程预处理,比RDKit多线程指纹生成快5–8倍;

  2. Tanimoto相似度计算:针对大规模分子交叉比对(如10k×10k矩阵),相比单CPU核心实现最高4000倍的加速;

  3. 余弦相似度计算:交叉余弦相似度矩阵计算提升达1750倍;

  4. MMFF分子力场几何优化:在8 GPU的H100 DGX系统对比112个CPU核心的场景中,针对含上百个分子、各含100+构象的批处理任务实现了25倍加速;

  5. ETKDG构象生成:在同等硬件条件下,平均可实现10–12倍加速,且加速效果随分子规模线性提升。

这些性能突破使得许多以往因计算资源限制而难以实现的任务成为可能。例如,在虚拟筛选中,研究人员现在可以在极短时间内完成千万级分子相似度比对,从而快速识别潜在活性化合物;在生成式化学中,实时分子相似度约束成为可能,支持更高效的引导式分子生成和类似物拓展。

此外,nvMolKit在三维结构处理方面的优化,也为药物研发关键环节带来显著助力。快速的分子构象生成与优化能力,能够支持高通量配体-受体对接任务,并实现对构象集合的物理合理性筛选。研究人员可以更高效地完成基于能量的构象过滤、应变能计算以及依赖三维结构的分子性质预测,从而加速候选化合物的优化与评估流程。

值得指出的是,nvMolKit不仅支持最新的H100 GPU,也在A100平台上表现出强大性能。用户可根据实际基础设施灵活部署,无需更换整个软件生态。

这一工具的推出,标志着化学信息学正式进入GPU加速时代。它不仅是技术架构的升级,更可能改变药物研发的工作范式——从以往的“计算受限”转向“想象力受限”。随着化学空间探索效率的大幅提升,研究者可以将更多精力投入算法创新与生物学机制挖掘,进一步释放AI在分子发现中的潜力。

未来,我们有理由期待更多RDKit核心功能迁移至GPU平台,也将看到nvMolKit在云端药物研发平台、自动化实验室流程和生成式AI模型中的深度集成。英伟达此次的技术推进,无疑为下一代药物研发奠定了坚实的计算基础。