本文介绍一篇来自浙江大学侯廷军教授、李丹教授团队发表在Nature Communications的研究论文,题为“Targeting the intrinsically disordered AR-NTD through a machine learning-based enhanced sampling workflow”,共同第一作者为浙江大学博士研究生祝凯、王华婷、博士后张锦途。该研究提出了一套结合广义系综增强采样、基于机器学习的集合变量和基于结构的虚拟筛选的计算工作流,用于解析固有无序蛋白的构象景观、识别可成药构象,并揭示小分子配体的结合机制。研究团队以雄激素受体(AR)N端结构域AR-NTD的Tau-5区域为模型体系,系统刻画了其九个亚稳态构象,揭示了已知AR-NTD拮抗剂EPI-002识别 AR-NTD的关键分子机制,并进一步发现了新型AR-NTD拮抗剂K53,为靶向固有无序蛋白的理性药物设计提供了新的计算范式。



研究背景

固有无序蛋白(IDPs)在细胞信号转导、转录调控和疾病发生中发挥重要作用,并与癌症、神经退行性疾病等多种重大疾病密切相关。然而,与具有稳定三维结构的传统药物靶点不同,IDPs缺乏固定的折叠构象,而是以高度动态、多态的构象集合形式存在,使得传统依赖单一蛋白结构的结构药物设计策略难以直接应用。AR是前列腺癌治疗中的核心靶点,目前临床使用的AR拮抗剂主要靶向AR 配体结合结构域(AR-LBD),例如比卡鲁胺和恩扎卢胺,但AR-LBD突变、AR基因扩增以及缺失LBD的AR剪接变体会导致患者对现有AR-LBD靶向治疗产生耐药。相比之下,AR的N端结构域(AR-NTD)在这些耐药机制中仍然保留,并承担主要的转录激活功能,因此被认为是克服耐药性前列腺癌的重要潜在靶点。然而,AR-NTD是典型的本征无序区域,缺乏稳定结构,构象空间复杂,瞬态结合口袋难以捕捉。虽然EPI-001、EPI-002及其类似物被报道可以作用于 AR-NTD,但其配体识别过程、非共价结合机制以及向共价稳定化发展的结构基础仍未被系统阐明。针对这一挑战,研究团队构建了一套机器学习增强采样工作流,用于系统探索AR-NTD的构象空间、识别潜在药物结合构象,并指导新型 AR-NTD拮抗剂的发现。


方法概述

为解决IDP构象高度动态、传统集合变量(CV)难以定义以及配体结合路径难以采样的问题,研究团队构建了一个多层次增强采样与机器学习集合变量(MLCV)相结合的工作流。该工作流主要包括三个核心部分。

REST3 采样结合AE CV识别Tau-5亚稳态构象

研究团队首先选取AR-NTD中与EPI-002结合密切相关的Tau-5片段作为研究对象,并采用REST3增强采样方法系统探索其构象空间。由于Tau-5是高度柔性的本征无序区域,传统低维描述符难以充分区分其复杂构象。为此,研究团队进一步利用基于自编码器的集合变量(AE CVs)对300 K轨迹进行降维分析,以R1、R2、R3区域之间的α碳原子距离作为输入描述符,构建Tau-5的低维自由能面。结果显示,Tau-5可被划分为九个结构差异明显的亚稳态构象,为后续隐蔽结合口袋识别、配体对接和虚拟筛选提供了代表性结构基础。


SWISH 识别隐蔽结合口袋并解析 EPI-002 结合构象

由于IDP的配体结合位点往往具有瞬态性和隐蔽性,研究团队分别对九个Tau-5 亚稳态构象进行了SWISH模拟。该方法通过引入小分子疏水探针并调节蛋白–水相互作用,促进蛋白表面隐蔽疏水口袋的打开。随后,研究团队在SWISH识别出的结合口袋中,对EPI-002进行了非共价和共价分子对接。结果显示,EPI-002 的氯原子在多个结合构象中靠近第404位半胱氨酸残基(Cys404)的硫原子,提示其具备形成共价键的几何可能性;同时,配体周围富集多个芳香残基,说明π–π 堆积作用和疏水相互作用可能参与EPI-002对AR-NTD的初始识别。


OPES、MLCV与Deep-TICA解析结合自由能和配体识别机制

为进一步研究 EPI-002与Tau-5的结合/解离过程,研究团队将OPES增强采样与机器学习集合变量相结合。考虑到水分子在IDP–配体结合中的关键作用,研究团队设计了一系列水相关特征,用于描述配体溶剂化、结合位点水合以及高密度水区域,并通过多任务学习构建能够表征结合态、非结合态和水介导转变过程的集合变量。随后,研究团队在九个Tau-5亚稳态构象上开展OPES-explore模拟,计算EPI-002的结合自由能,并利用Deep-TICA从增强采样轨迹中提取慢动力学模式,从而解析EPI-002的结合、解离以及水介导中间态的变化过程。

图1. 解析 IDP 可成药构象与小分子作用机制的机器学习增强采样工作流。


结果与讨论

研究团队从构象采样、结合机制、虚拟筛选和实验验证等多个层面系统评估了该工作流的能力。


REST3 采样与AE CV识别Tau-5的九个亚稳态构象

研究团队首先利用REST3对AR-NTD中的Tau-5片段进行增强采样,并结合NMR化学位移等实验数据验证模拟构象集合的可靠性。结果显示,模拟得到的二级结构分布和Cα化学位移与实验结果具有较好一致性,说明REST3能够有效刻画Tau-5的动态构象空间。在此基础上,研究团队进一步利用AE CV对300 K轨迹进行降维分析,构建了Tau-5的低维自由能面,并识别出九个结构差异明显的亚稳态构象。这些构象为后续隐蔽结合口袋识别、EPI-002 对接和基于结构的虚拟筛选提供了代表性结构基础。

图 2. REST3增强采样刻画Tau-5的动态构象分布并验证模拟可靠性。


图 3. AE CV自由能面揭示Tau-5的九个亚稳态构象。


SWISH 揭示 Tau-5 中瞬态隐蔽结合口袋

由于固有无序蛋白的结合口袋往往是瞬态形成的,单纯依赖静态构象难以捕捉其可成药区域。研究团队针对九个Tau-5亚稳态构象分别开展了SWISH模拟,通过小分子疏水探针诱导蛋白表面隐蔽疏水口袋打开。结果表明,SWISH能够在Tau-5的亚稳态构象中揭示潜在结合口袋,并为EPI-002的分子对接提供合理结合区域。对接结果进一步显示,EPI-002可进入这些口袋,其反应相关基团靠近Cys404,同时周围富集芳香残基,提示π–π堆积作用、疏水相互作用以及潜在共价稳定化可能共同参与AR-NTD的小分子识别。


图 4. SWISH模拟诱导Tau-5隐蔽结合口袋打开并支持EPI-002结合。


Deep-TICA 解析 EPI-002 结合/解离路径中的水介导机制

在获得EPI-002与Tau-5的结合构象后,研究团队进一步结合OPES-explor 与机器学习集合变量,对配体结合和解离过程进行增强采样。随后,利 Deep-TICA从增强采样轨迹中提取慢动力学模式,构建了Water CV与Distance CV,从而解析结合态、中间态和非结合态之间的转变。结果表明,EPI-002的识别并非仅由疏水作用或π–π堆积作用决定,结构水分子在结合口袋中形成桥联氢键网络,并在配体解离过程中稳定中间态,说明水分子主动参与了AR-NTD与小分子的识别过程。

图 5. Deep-TICA揭示EPI-002结合/解离过程中的结构水介导氢键网络。


虚拟筛选与实验验证发现新型AR-NTD拮抗剂K53

基于前述识别出的Tau-5可成药构象,研究团队进一步开展基于结构的虚拟筛选,并从Specs和ChemDiv化合物库中筛选候选分子,并进行实验验证。细胞实验显示,K53在多种前列腺癌细胞中表现出显著抗增殖活性,尤其能够有效抑制恩扎卢胺耐药的22Rv1和LNCaP-EnzR细胞,同时对非肿瘤细胞表现出较低毒性。SPR、NMR、WaterLOGSY和CETSA等多种实验证据进一步证明K53可直接结合AR-NTD-AF1区域,并在细胞中产生靶点结合效应。功能实验显示,K53能够抑制AR转录活性并下调KLK3、FKBP5和TMPRSS2等经典AR靶基因表达。结构建模表明,K53与EPI-002在关键药效团空间分布上具有相似性,但通过结构修饰获得了更优的活性和成药潜力。

图 6. 虚拟筛选与多维实验验证发现新型AR-NTD拮抗剂K53。


工作流在c-Myc固有无序体系中的可迁移性验证

为验证工作流的通用性,研究团队进一步将其应用于另一种典型固有无序蛋白 c-Myc。结果显示,该流程同样能够识别c-Myc的亚稳态构象和潜在结合口袋,并通过OPES-explore计算小分子抑制剂10058-F4的结合自由能。计算结果与实验观测的微摩尔级亲和力一致,说明该机器学习增强采样工作流不仅适用于AR-NTD,也具有迁移到其他固有无序蛋白体系的潜力。

图 7. c-Myc固有无序体系验证工作流通用性。


总结

本研究提出了一套面向固有无序蛋白药物设计的机器学习增强采样工作流,实现了从IDP构象采样、可成药口袋识别、配体结合机制解析到候选拮抗剂发现的计算–实验闭环。通过对AR-NTD的系统研究,研究团队识别了九个药物相关亚稳态构象,揭示了EPI-002识别AR-NTD时π–π堆积、芳香残基和结构水介导氢键网络的协同作用,并发现了新型AR-NTD拮抗剂K53。K53能够直接结合AR-NTD、抑制AR转录活性,并在恩扎卢胺耐药前列腺癌细胞中表现出较强抗增殖活性和良好选择性。该工作为理解AR-NTD配体识别机制和开发耐药前列腺癌治疗候选物提供了重要依据,也展示了机器学习增强采样在固有无序蛋白药物设计中的应用潜力。

参考资料

Zhu, K., Wang, H., Zhang, J. et al. Targeting the intrinsically disordered AR-NTD through a machine learning-based enhanced sampling workflow. Nat Commun (2026). 

https://doi.org/10.1038/s41467-026-73863-x

内容中包含的图片若涉及版权问题,请及时与我们联系删除