过对杂环芳基类药物及生物活性分子进行计算机模拟反应以实现骨架编辑(如嘧啶杂环转换为咪唑杂环),构建了虚拟的骨架编辑杂环芳香化合物库,并通过量化编辑后骨架在数据库中的占比来评估其转换潜力。占比更低的杂环骨架表现出更高的转换潜力,有助于拓展可利用的化学空间。在该研究中,嘧啶→咪唑、噻唑→吡咯的转换所对应的骨架占比均较低,表明这些转换方向可能具有更高的研究价值与应用前景。


通过选择性核心原子转化(骨架编辑) 修饰这类结构,能显著拓展药物发现与开发的化学空间,为药物研发中优先选择核心原子修饰方法提供了定量框架,并呼吁开发新合成方法实现这些高价值转化。

思维导图.png

研究意义:

  • 首次构建化学信息学分析平台,量化杂环芳烃核心原子转化的影响。

  • 明确哪些骨架编辑能最大程度增加新化学空间的可及性,为药物研发(尤其后期)提供方向。

  • 呼吁开发新合成方法,实现高优先级的核心原子转化。


研究准备


研究对象

首先,作者选取FDA批准药物中高频出现的结构的11类杂环芳烃:吡啶(含喹啉、氮杂吲哚)、吡嗪、吡咯(含吲哚)、呋喃、咪唑、异噁唑、嘧啶(含喹唑啉)、噻唑、噁唑、哒嗪、吡嗪。检测上述杂化芳烃在4个具有代表性的化学数据库——Enamine、Mcule、ChEMBL和默克(Merck)专有库中的占比。

Enamine化学数据库中,吡啶(26.24%)、吡唑(21.14%)和吡咯(8.10%)占据前三。

Mcule化学数据库中,吡啶(40.08%)、吡唑(16.15%)和嘧啶(12.08%)占据前三。
ChEMBL化学数据库中,吡啶(30.58%)、吡咯(13.35%)和嘧啶(12.92)占据前三。


分析流程

分析流程如下图所示:

流程图.png

对于结果归一化该关键步骤

若生成产物数>原数据库中对应杂环的表征分子数:归一化到原数据库表征分子数;

若生成产物数<原数据库中对应杂环的表征分子数:归一化到起始分子数。

归一化后上限为 1.00(即 100% 表征),确保结果可比。

图片2.png

研究内容


前期研究

在未进行结果归一化这一关键步骤的改进前,Enamine、Mcule和ChEMBL文库中每个虚拟杂芳族到杂芳族转化的新生成产物(即之前在任何评估的数据集中都没有表征)的百分比显示,吡唑→呋喃、嘧啶→咪唑、吡咯→嘧啶这几种编辑的 “新分子率” 都接近100%该数值表示计算生成的新产品相对于起始数据集的百分比。该指标确定了哪些转化(如果开发出来)将产生最多未表征的化合物。编辑这些杂环,更容易得到有药效的新分子。

由于Mcule和ChEMBL数据库比Enamine数据库小得多,因此,作者优先考虑Enamine数据集的分析结果,以获得相对公正的结果。对于某些转换,每个起始分子可以产生多个产物。例如,通过将C3或C5交换为氮原子,2-取代吡啶可以转化为两种不同的嘧啶,这种方式计算转化产生的未表征化合物的数量可能是一个误导性的指标因此,引入了结果归一化关键步骤(具体见"分析流程")

图片4.png


结果修正

进行结果修正后,Enamine数据库里"每种编辑的最终价值"——"归一化已知率"越低,说明改出来的产物里"见过的越少、新的越多",编辑越有用。例如,吡唑→呋喃(0.60%):100 个产物里只有 0.6 个是见过的,几乎全是新的。其他具有高度影响力的潜在转化包括噻唑→吡咯(13.71%)、噻唑→咪唑(14.00%)和噻唑哒嗪(18.50%)转化。



单原子编辑技术

相比于多原子编辑,单原子编辑技术在实验室里更容易实现。嘧啶→咪唑(11.18%)(单碳缺失)成为进入新化学空间的主要转化,突显了继续开发以吡啶和嘧啶杂环为重点的骨架编辑方法的重要性

通过硫与碳或硫与氮的交换,噻唑→吡咯(13.71%)噻唑→咪唑(14.00%),也会产生低百分比的特征产物。总之,优先做嘧啶→咪唑、噻唑→吡咯这类"单原子、低已知率" 的编辑,既容易实现,又能出新品



数据验证

1. Mcule数据库

吡唑→呋喃(0.20%)得到的产品在两个数据库中的商业化合物百分比最低。同样,其他多原子转换,如唑→咪唑(0.36%)嘧啶→吡咯(0.27%)呋喃→咪唑(1.02%)的虚拟骨架编辑,产生的商业产品百分比较低。五元杂芳烃单原子转化唑→吡咯(0.22%)产生的商业化合物的低百分比进一步突显了对五元杂芳烃单原子点突变的新方法。以上显示,吡唑→呋喃(0.20%)、嘧啶→咪唑(0.52%)/吡咯(0.27%)是"跨数据库通用"的黄金编辑,不是某一个库的特例。

2. ChEMBL数据库

ChEMBL数据库中,嘧啶→吡咯(0.06%)嘧啶→咪唑(0.32%的转化给出了类似的低百分比特征化合物,再次表明了它们的转化高价值。

3. 默克(Merck)数据库

默克(Merck)数据库中,排名前三的杂环芳基分别为哌啶(36.15%)、吡咯(9.98%)和嘧啶(9.66%)。例如,吡唑→呋喃仅得到0.02%的现有产物。同样,嘧啶→吡唑(0.60%)咪唑→嘧啶(0.73%)的转化也会产生低百分比的现有产物。


数据总结

首先展示了各类杂环芳基化合物中骨架编辑转换百分比最低的实例(下图A),最后列出了所有杂环芳基转换中百分比最低的前十种排序结果(下图B)。

吡唑→呋喃(0.60%)作为最低转换率之一的转换方式,表明其具有较大的拓宽化学空间的潜力。嘧啶唯一在单原子编辑的前十个转换中出现三次的起始亚结构(下图B-右表),这突显了嘧啶的单原子骨架编辑可能会极大地扩展杂芳族化学空间的潜力

最后,对Enamine数据库中特征产物百分比最低(即高值)的五个单原子转换(数据同上图)进行展示。

图片11.png

结论与展望
  • 提供了定量框架:首次量化杂环芳烃核心原子转化的价值,可指导药物研发中优先选择转化方法;

  • 明确高价值方向:嘧啶、噻唑、吡咯的骨架编辑最能拓展新化学空间;多原子转化(如吡唑→呋喃)和环收缩转化(如嘧啶→咪唑)是重点;

  • 指出方法缺口:现有合成方法无法满足高价值转化需求,需开发新方法(如嘧啶环收缩、硫杂环→氮杂环转化)。


内容来源


首图.png


往期推荐



制药三巨头(Abbive,BI与Pfizer)总结发文|非贵金属催化剂,实用方法的最新进展!

武田|Oveporexton (TAK-861):首个用于发作性睡病的 OX2R 激动剂 ,III 期临床中

「JMC综述」|药物设计:天然产物,活性骨架,分子砌块与活性新分子的逻辑关系

为什么说,分子砌块是药物研发的核心基石?|来自药石科技白皮书的答案         

生物等排体系列|开源BioSTAR工作流:生物等排体的数据评估模型                

分子 pKa与LogP和结构的逻辑关系|二氟饱和双环胺为例                            

综述|药物发现早期的靶点结合实验:技术全景与策略选择                           

Synthesis揭秘药企巨头:从药物发现到商业生产中,如何实现手性药物中立体选择性的创新突破?

综述|共价药物2.0时代:如何靶向“不可成药”蛋白的最新进展                         

立体分子库构建|16种螺环骨架→910k药物新分子:大规模独特的螺环分子砌块库

END

内容中包含的图片若涉及版权问题,请及时与我们联系删除