转自微信公众号:HouMed

一个分子在模型中展现出良好活性,距离成为合格候选药物仍有诸多关键环节需要验证,包括溶解性、膜通透性、体内暴露量、毒性及靶点选择性等。近年来 AI 分子模型发展迅速,但多数仍依赖数据驱动的统计拟合,在天然产物、环肽等分布外化学空间及复杂代谢性质预测上表现不稳定。2026 年 5 月 15 日,课题组侯廷军教授团队联合澳门理工大学等在 ChemRxiv 发布 LiTENexus 系统,提出量子化学信息注入(QCII)机制,将势能面、电荷分布、偶极矩等量子化学规律编码进神经算子,构建了端到端的量子启发式虚拟药物发现平台,为 AI 辅助药物发现提供了物理驱动的底层表征方案。该研究的共同第一作者为浙江大学博士生苏群、张辉,与澳门理工大学博士生苟巧林。


图 1:量子化学驱动的 LiTENexus 药物发现系统总览:纵向贯通量子化学底层 - 物理表征 - 宏观药理的跨尺度映射,横向闭环分子生成 - 构象优化 - 虚拟筛选 - ADMET 预测 - 多目标优化全流程,核心 LiTEN-Base 算子为全链路提供统一物理表征底座。




研究背景




AI制药需要回归物理基础

过去十年,AI 辅助药物发现取得了长足进步,一维序列、二维图和三维几何模型相继涌现,将传统计算化学的许多流程加速了数个数量级。但这些模型本质上都是在学习训练数据中的统计相关性,而非支配分子行为的物理规律。当遇到与训练数据差异较大的分子时,模型容易出现泛化失效,且无法解释性质变化的内在机制 —— 这成为制约 AI 制药从 "辅助工具" 走向 "决策核心" 的根本瓶颈。


量子化学方法虽能精确描述分子的微观物理性质,为药物行为提供底层解释,但高精度密度泛函理论(DFT)计算单分子需要数分钟甚至数小时,完全无法支撑百万级、十亿级化合物库的高通量筛选。此前的折中方案多将量子计算结果作为附加标签,未能从根本上解决问题。LiTENexus 的核心突破在于:它将物理规律嵌入模型内部,让神经网络的整个表征空间都受量子化学约束,从底层实现了对分子行为的物理理解,而非表面的统计模仿。




方法概述



LiTENexus 的核心是 LiTEN-Base 通用物理表征引擎,它将分子视为局部几何场中的连续物理分布,通过多极展开、张量收缩和等变表征重建分子的势能面与电子环境。


模型采用独创的双模块设计:多体相互作用(MBI)算子刻画 5Å 范围内的局部化学环境,精确捕捉键角、扭转能垒等精细结构特征;双体相互作用(DBI)算子将感受野扩展至 10Å,建模偶极 - 偶极作用、诱导极化等长程非共价相互作用。这种设计完美解决了药物分子行为由局部结构与全局电场共同决定的核心问题。通过分阶段物理预训练策略,LiTEN-Base 在千万级量子化学数据上完成了物理规律的内化,最终分化为 LiTEN-FF(构象优化)和 LiTEN-Micro(微观性质预测)两个基础模块,为所有下游任务提供统一的物理表征。

图2: LiTEN-Base核心算子理论架构与物理驱动训练全流程:从局部几何场重构、多尺度物理建模,到大规模物理预训练与跨模态蛋白-配体交互架构,实现物理化学第一性原理的深度内化。




结果与讨论




微观层面验证:量子级精度与高通量兼容

论文通过多组实验验证了 LiTEN-Base 的物理感知能力。在构象优化任务中,模型对初始和优化后构象的绝对能量预测误差均低于 0.3 kcal/mol,远低于 1 kcal/mol 的化学准确性阈值,构象弛豫路径的相对能量变化 R² 达到 0.99。在电性特征预测上,LiTEN-Micro 对 MBIS 电荷和分子偶极矩的预测精度接近高阶量子化学方法 M06-2X,同时计算速度提升 2-3 个数量级,单分子计算仅需约 0.003 分钟,满足高通量筛选需求。


进一步分析发现,LiTEN-Micro 提取的微观量子特征与宏观 ADME 性质存在显著相关性。多维物理特征融合后,与大鼠肝微粒体清除率、MDR1-MDCK 跨膜通透性的 Pearson 相关系数达到 0.70,在血浆蛋白结合、溶解度等任务上也较单一特征有明显提升,证明微观电子结构是决定药物宏观行为的核心物理驱动力。

图3: LiTEN-Base 算子量子级特征高精度推导与跨尺度药理映射:展示了从 SMILES 输入到量子特征提取的完整流程,以及构象优化精度、量子性质预测误差分布、计算效率对比。



ADMET 预测:从经验相关到物理可解释

基于 LiTEN-Base 的物理表征,团队构建了 LiTEN-ADMET 多任务预测模型,在三大权威基准上取得了领先结果。在 Biogen 工业数据集上,模型在 6 个核心 ADME 性质上的平均 MAE 为 0.388,优于 CHMR、KPGT 等 20 余种基线模型;在 PharmaBench 的 33 个指标中,25 个指标表现超过基线,其中 CYP2D6 代谢预测任务引入 QCII 机制后,R² 从 0.521 提升至 0.637。


LiTEN-ADMET 基于 ADMETLAB 3.0 的 77 个终点构建,采用三维构象系综预测策略,通过对多个低能构象的预测结果取平均,更贴近分子在真实生理环境中的动态状态。模型在 18 个回归任务和 44 个分类任务中取得最优表现,且呈现出明显的 “救援效应”:模型的性能增益与传统基线的性能上限呈负相关,越是传统方法难以预测的复杂任务,量子化学信息的补充作用越显著。

图4: LiTEN-ADMET 全维度药理任务性能评估:包含 3D 构象集成预测流程、9 大生理性质簇性能分布、77 项端点 SOTA 覆盖情况。



突破化学空间边界:在未知领域保持稳定判断力

分布外泛化是 AI 制药的核心挑战,论文选择与预训练数据重叠度极低的天然产物和环肽进行测试。在天然产物结合亲和力预测任务中,仅经过配体侧微调的 LiTEN-Base,在多数靶点上的表现优于专门在百万级天然产物库上预训练的 NaFM,且误差优势均匀分布在整个化学空间,未表现出明显的结构偏向。


在环肽膜通透性预测任务中,LiTEN-Base 将 R² 提升 42.2% 至 0.64,MAE 和 RMSE 均下降超过 17%。环肽的膜通透性依赖分子内氢键网络的动态形成,传统一维 / 二维模型难以捕捉这一过程,而 QCII 机制注入的原子极化、电荷离域等信息,能够帮助模型间接评估环肽隐藏极性表面的热力学倾向,从而实现准确预测。

图5: LiTEN-Base (QCII) 在分布外 (OOD) 化学空间的泛化能力验证:对比了 LiTENexus 与领域专用模型在天然产物结合亲和力、环肽膜通透性预测上的性能。



虚拟筛选:量子流形检索提升早期富集能力

LiTENCLIP 模块提出量子流形稠密检索(QMDR)范式,将蛋白 - 配体识别转化为跨模态向量检索问题。配体侧由 LiTEN-Base 生成富含立体电子信息的量子流形嵌入,蛋白侧通过 Uni-Mol 提取口袋特征,二者通过物理感知交叉注意力实现无姿势动态对齐,无需预先进行分子对接。


在 DUD-E 数据集上,LiTENCLIP 的 EF₁% 达到 44.06,较 DrugCLIP 和 RTMScore 分别提升 38.2% 和 62.6%;在更具挑战性的 LIT-PCBA 数据集上,模型仍以 EF₁% 6.77 保持领先,且能够准确分辨结构高度相似但结合能力差异显著的 “活性悬崖” 案例,证明其捕捉的是分子间真实的物理相互作用,而非骨架相似性。

图6.LiTENCLIP 多维度虚拟筛选性能全面验证:展示了蛋白 - 配体在量子流形空间的聚类效果、DUD-E 与 LIT-PCBA 基准的多指标性能对比。




总结



LiTENexus 的核心价值远不止于刷新多项行业基准,更在于它重构了 AI 辅助药物发现的底层技术范式,首次明确了下一代 AIDD 系统的三大核心特征:物理驱动的表征体系、跨尺度的统一建模、全流程的端到端闭环。它打破了量子化学与药物研发之间的技术壁垒,将量子化学从昂贵的后处理验证工具升级为整个系统的底层表征底座,建立了从微观电子结构、介观分子构象到宏观药理效应的直接物理映射,终结了传统 AIDD"重统计、轻机理" 的碎片化发展模式。


作为这一范式的首个落地实现,LiTENexus 已完成从算法到工程化的全链条打通,正式上线公共服务平台(https://cadd.zju.edu.cn/litenexus)。平台提供了适配真实研发场景的工作流入口:一键启动 "分子生成 - 性质优化 - ADMET 评估 - 虚拟筛选" 的全流程,既可以串联成完整 Pipeline 运行,也支持独立调用,满足不同研发阶段的灵活需求。

    这不是一个孤立的算法模型,而是一个开放、可扩展的物理智能基础设施。它将原本只有计算化学专家才能掌握的高精度量子化学能力,转化为所有药物研发人员都能便捷使用的标准化工具,大幅降低了物理驱动药物设计的技术门槛。


AI 制药的第一曲线由数据规模和模型参数驱动,它解决了 "快" 的问题,却始终未能突破 "准" 和 "可信" 的瓶颈;而第二曲线可能会由物理规律和第一性原理驱动,它将解决药物研发最核心的 "可解释性" 和 "泛化性" 难题。LiTENexus 的出现,可能是这条新曲线的开端。



资源链接



论文地址:

https://chemrxiv.org/doi/full/10.26434/chemrxiv.15003380/v1

代码开源:

https://github.com/lingcon01/LiTENexus

LiTENexus Platform:

https://cadd.zju.edu.cn/litenexus


供稿:苏   群

排版:洪楠棋

内容中包含的图片若涉及版权问题,请及时与我们联系删除