DRUGONE
获得能够结合特定蛋白靶点的抗体在生物医学、基础研究和生物技术中具有广泛重要性,但传统实验流程往往耗时、昂贵且劳动密集。与此同时,已有计算抗体设计方法通常成功率较低,需要大规模筛选才能找到少数有效结合物。研究人员提出了 Germinal,一种可广泛使用的生成式抗体设计流程,能够针对指定表位设计抗体,并在仅需小规模实验验证的情况下获得纳摩尔级结合亲和力。该方法将结构预测模型与抗体特异性蛋白语言模型结合,在用户指定的抗体结构框架上从头设计功能性互补决定区,从而同时优化抗体结构与序列。研究人员在四类不同蛋白靶点上测试 Germinal,结果显示该方法可在所有靶点和不同结合物格式中生成具有功能的抗体,每个抗原仅测试 43–101 个设计。经过验证的设计还表现出良好的哺乳动物细胞表达能力,并具有较高的序列和结构新颖性。研究人员同时开放了代码、计算流程和实验方案,以促进该方法的广泛应用。

抗体是适应性免疫系统中的核心分子,能够以较高特异性识别和结合抗原上的多样化分子表位。由于抗体具有成熟的生化性质、良好的药物开发特征以及高度特异的结合能力,它们已成为生物医学、药物研发、生物技术和基础研究中最常用的一类通用结合分子。
传统上,针对任意抗原获得抗体通常依赖动物免疫或大规模抗体库筛选。然而,这些方法存在明显限制。首先,这些流程通常成本高、周期长、实验工作量大,而且并不总能获得有效结合物。其次,即使获得了候选抗体,其分子性质和结构结合模式的解析也可能非常困难。最后,传统方法通常难以控制抗体识别抗原的具体区域,也就是表位,因此很难把结合事件定向到功能关键位点或特定构象状态。
机器学习推动了蛋白质单体和多聚复合物的高精度结构预测,并进一步催生了结构引导的蛋白设计方法。已有方法能够利用结构预测模型生成具有特定结构性质或结合能力的蛋白序列,也有方法通过反向优化结构预测模型来生成蛋白结合物。然而,稳健地从头设计能够靶向特定表位的抗体仍然十分困难,主要原因在于抗体互补决定区高度多变,而抗体序列空间又受到天然抗体结构与功能约束的强烈限制。过去一些研究往往需要筛选成千上万个设计,才能获得少数结合物,且亲和力常处于微摩尔水平。这类资源密集型流程不利于普通实验室采用。
为解决这一问题,研究人员提出 Germinal 生成式流程。该方法直接在指定抗体框架上自由设计 CDR 区域,同时尽量保留已知框架区在哺乳动物细胞中的表达能力和潜在药物开发优势。Germinal 将 AF-M 结构预测模型的反向传播信号与抗体特异性语言模型 IgLM 的序列先验相结合,使生成序列既具有较高结构可信度,又更接近天然抗体序列分布。研究人员还引入定制损失函数,使抗体主要通过 CDR 而不是框架区与抗原接触,并减少不自然的二级结构富集。候选抗体随后通过分裂荧光素酶筛选或表面等离子体共振初筛,再用生物层干涉法进行结合验证。整体上,Germinal 旨在把抗体发现从“大规模筛选”转变为“少量候选即可验证”的设计模式。
方法
研究人员首先定义目标抗原结构和指定表位;对于多结构域抗原,在可行情况下仅保留含有目标表位的独立折叠结构域,以降低计算成本。Germinal 在 AF-M 和 IgLM 共同形成的优化空间中进行基于梯度的设计,设计过程包括连续序列表示到离散序列的逐步优化,并通过梯度融合同时考虑复合物结构可信度和抗体序列自然性。为使生成抗体更符合天然抗体结合模式,研究人员加入了表位/互补位定位约束,使结合主要发生在设计的 CDR 上,同时加入二级结构约束,避免 CDR 被 α 螺旋或 β 折叠主导,而是更倾向形成天然抗体中常见的环状构象。随后,研究人员使用抗体优化的结构条件序列设计模型重新设计非界面 CDR 残基,以提高稳定性并扩展候选多样性。候选分子再经过独立结构预测模型和生物物理打分过滤,最终进入实验验证。实验部分包括分裂荧光素酶表达与结合筛选、SPR 初筛、BLI 亲和力测定、冷冻电镜结构解析、丙氨酸突变表位验证以及多反应性评估。
结果
通过结构与序列双目标优化设计抗体
从头设计抗体的核心难点在于抗体结构具有高度约束性,同时 CDR 区域又高度可变。天然抗体中,保守的 β 折叠框架区像支架一样支撑 CDR 环,使其以合适空间位置识别抗原。虽然 CDR 中也可能出现二级结构,但天然抗体的抗原结合区域通常以环状构象为主。相比之下,许多基于结构预测模型的结合物设计方法更倾向生成由规则二级结构主导的蛋白–蛋白界面,这与抗体 CDR 的天然结合模式并不完全一致。
研究人员认为,抗体特异性语言模型可以为结构预测模型提供互补信息。由于这类模型在大量抗体序列上训练,它们能够学习天然抗体序列分布,并从序列中捕捉隐含的结构与可开发性信息。Germinal 因此将 AF-M 的结构指导与 IgLM 的抗体序列先验结合起来,在同一优化过程中共同推动抗体向“结构可信”和“抗体样”两个方向演化。整个流程包括设计、序列优化和过滤三个阶段。
在初始尝试中,研究人员发现如果直接使用 AF-M 引导抗体结合物设计,生成结果可能会让框架区残基参与主要结合,或者使 CDR 区域富集不自然的二级结构。为避免这种情况,Germinal 引入了定制的互补位约束,使抗原接触主要由设计的 CDR 区域承担;同时加入针对 α 螺旋和 β 折叠的二级结构约束,使 CDR 更偏向环状构象。这些约束共同使生成抗体更接近天然抗体的结合方式。
研究人员还发现,AF-M 的结构置信度目标和 IgLM 的序列似然目标并不总是一致,而是存在明显权衡关系。单纯追求结构预测置信度可能产生不够天然或不利于开发的序列,而增强 IgLM 引导则能够改善生成序列的可开发性、安全性、人源性,并降低潜在免疫原性风险。因此,Germinal 的关键并不是单独优化某一个目标,而是在结构、序列自然性、结合姿态和可开发性之间进行多目标平衡。总体来看,该设计阶段证明 Germinal 可以可控地生成具有抗体样性质的候选序列。

图1:Germinal 的整体设计流程。
使用 Germinal 靶向多样化抗原
研究人员进一步将 Germinal 应用于四类不同蛋白靶点:PDL1、IL-3、IL-20 和 BHRF1。PDL1 是肿瘤和免疫细胞中表达的免疫检查点配体,是临床验证过的治疗靶点,也是从头设计结合物研究中常用的靶标。IL-3 和 IL-20 是参与免疫信号调控的细胞因子,此前尚未有从头设计结合物的报道。BHRF1 则是来自 Epstein–Barr 病毒的 BCL-2 样抗凋亡蛋白,代表非人源病原体靶点。
经过采样和计算过滤后,PDL1、IL-3、IL-20 和 BHRF1 分别有大量纳米抗体设计轨迹通过筛选。研究人员最终选择了 PDL1 的 101 个、IL-3 的 46 个、IL-20 的 43 个以及 BHRF1 的 52 个纳米抗体设计进入实验验证。这些设计与 PDB 或 Observable Antibody Space 中已有抗体序列的 CDR 相似性较低,中位序列同一性约为 30%,显示出较高序列新颖性。结构比较也表明,这些候选设计的预测抗原结合界面并不接近已知复合物界面,提示 Germinal 并非简单复现已有抗体结构,而是在生成新的结合模式。
研究人员还将该方法扩展到 scFv 格式,并针对 PDL1 和 IL-3 设计单链可变片段。PDL1 和 IL-3 分别有数百个 scFv 设计通过计算过滤,研究人员各选择 48 个进入实验验证。与纳米抗体类似,这些 scFv 设计也具有较低的 CDR 序列相似性和显著的结构新颖性。虽然 scFv 因含有轻链和重链两个结合链,其界面面积相关指标天然高于纳米抗体,但实验结果显示,Germinal 在不同抗体格式之间仍具有一定可迁移性。

图2:Germinal 在多种蛋白靶点和不同抗体格式中的设计表现。
Germinal 设计结合物的实验验证与生物物理表征
在纳米抗体筛选中,研究人员首先通过分裂荧光素酶体系评估候选分子的表达和结合信号。满足表达与结合阈值的设计随后进入 BLI 亲和力验证。最终,研究人员对 PDL1 的 25 个、IL-3 的 11 个、IL-20 的 11 个以及 BHRF1 的 20 个纳米抗体进行 BLI 测试,并分别观察到 7 个、2 个、4 个和 5 个具有可检测结合能力的设计。重要的是,四个靶点均获得了纳摩尔级结合物。
对于 scFv 设计,研究人员将 48 个抗 PDL1 和 48 个抗 IL-3 scFv 重格式化为 Fab 形式,并先通过 SPR 进行亲和力初筛。该筛选识别出 4 个潜在 PDL1 结合物和 1 个 IL-3 结合物。进一步 BLI 验证显示,其中 3 个 PDL1 设计和 1 个 IL-3 设计具有可测结合活性。总体上,Germinal 生成的纳米抗体和 scFv/Fab 均可达到纳摩尔至低微摩尔级亲和力,说明该方法不仅能在计算上产生结构可信的设计,也能在实验中获得真实结合活性。

图3:Germinal 生成抗体的实验筛选、亲和力验证与工程优化。
低表达设计的挽救与优化
研究人员观察到,部分 Germinal 生成设计虽然具有潜在结合能力,但表达量偏低,因此进一步探索了定向优化策略。对于抗 IL-3 的 scFv F4,研究人员考察了两个相关变体:一个是 AbMPNN 重设计之前的父本序列 F4Parent,另一个是来自相同 Germinal 初始设计但采用不同 AbMPNN 采样结果的姐妹序列 F4Sister。两者表达水平均高于原始 F4,并且保持了相当或更好的结合亲和力,因此被纳入后续表征。
对于抗 BHRF1 纳米抗体 C4,研究人员发现其纯化后蛋白量不足,不适合生物物理表征。为改善表达,研究人员将其框架区改造为接近 Legobody 的稳定框架,得到 C4Lego。为了确认这种框架替换不会破坏结合,研究人员也对另一个表达良好的 BHRF1 结合物 D3 进行了相同改造,得到 D3Lego。结果显示,D3Lego 保持高表达并且亲和力有所提升,而 C4Lego 也显著改善表达,并以约 42 nM 的亲和力结合 BHRF1。
此外,抗 IL-3 纳米抗体 D2 的 CDR3 中存在暴露于溶剂的半胱氨酸,可能导致二硫键介导的二聚化,从而影响表达和 BLI 测量质量。研究人员将该半胱氨酸替换为丝氨酸,得到 D2Ser。该替换恢复了单体表达,提高了纯度,并产生更清晰的 BLI 结合曲线。上述结果说明,Germinal 的初始命中可以通过传统蛋白工程策略进一步优化,从而扩大可用结合物池。
多反应性评估
抗体开发不仅需要关注目标结合亲和力,还需要评估是否存在非特异性结合。研究人员使用多特异性颗粒实验检测 Germinal 设计抗体对哺乳动物细胞膜蛋白混合物的非特异性结合。结果显示,所有 Germinal 生成设计总体上表现出较低多反应性,其信号低于多反应性阳性对照的 4%,并接近阴性对照水平。
这一良好特征在 C4Lego 和 F4Sister 等优化变体中也得以保留。然而,D2Ser 相比原始 D2 显示出更高多反应性,提示虽然半胱氨酸到丝氨酸的替换能够恢复单体表达和目标结合,但也可能引入一定非特异性相互作用。该结果强调,在计算抗体设计中,亲和力并不是唯一指标,表达、聚集、多反应性和整体可开发性都需要系统评估。
生成抗体的表位特异性
为了验证 Germinal 是否真正能够设计表位特异性抗体,研究人员解析了代表性抗 PDL1 scFv H5 与 PDL1 复合物的冷冻电镜结构,分辨率为 3.9 Å。实验结构与 Germinal 预测模型整体高度一致,Cα 原子全局均方根偏差约为 1.25 Å。所有六个 CDR 环在实验密度图中均具有合理局部拟合,说明预测的骨架几何与实验结构相符。结合界面分析显示,H5 对 PDL1 指定热点残基的接触保持了设计预期,证明 Germinal 可以在目标表位处生成准确结合模式。
研究人员还通过热点残基丙氨酸突变进一步验证各靶点和抗体格式的表位识别。对于 PDL1、IL-3、IL-20 和 BHRF1,研究人员分别替换预测的关键接触残基,并测量突变体对设计抗体结合亲和力的影响。结果显示,一个或多个热点残基突变会使结合亲和力相较野生型抗原至少下降两倍,并且在 26 个设计中的 17 个中,至少一个突变会完全消除可检测结合。与此同时,针对不同或部分重叠表位的阳性对照抗体在至少一个突变体上仍保持接近野生型的亲和力,说明亲和力下降主要来自结合界面破坏,而不是抗原整体折叠受损。整体上,这些结果证明 Germinal 设计抗体能够按照计算指定的表位与抗原发生相互作用。

图4:Germinal 设计抗体的表位识别验证。
讨论
研究人员提出了一个端到端的从头抗体设计流程,能够在低数量实验验证条件下获得纳摩尔至低微摩尔级结合物。该流程通过可扩展的分裂荧光素酶筛选体系快速识别纳米抗体候选,再用 BLI 进行亲和力验证。研究人员在四个不同可溶性蛋白靶点上获得纳米抗体,其中包括 IL-3。根据研究人员的描述,除其天然受体外,IL-3 此前没有已报道或存入 PDB 的抗体或非天然结合物,因此该靶点不太可能受益于对已有结合构象的记忆。研究人员还将 Germinal 扩展到 scFv 抗体片段,并获得了针对 PDL1 和 IL-3 的结合物。
与已有蛋白语言模型辅助抗体工程方法不同,Germinal 并不依赖已有弱结合物作为起点。许多语言模型方法主要用于亲和力成熟、稳定性改良或其他治疗属性优化,而 Germinal 直接从头设计 CDR 区域。与部分工业界方法相比,Germinal 的重要特点在于其代码、流程和实验方案公开,具有更高方法透明度。与其他开放式结合物设计流程相比,Germinal 的区别在于同时优化结构置信度和抗体样序列特征,并通过显式互补位和结构约束控制结合姿态,同时结合冷冻电镜、表位定向突变和多反应性分析进行系统验证。
研究人员还指出,单一计算打分并不足以可靠预测所有抗体格式中的实验成功。尽管一些经过验证的结合物在回顾性分析中符合已有界面评分阈值,但许多非结合物也能达到类似阈值,这说明从计算评分到真实结合活性的映射仍然困难。因此,Germinal 的成功不仅来自结构预测,也来自多目标优化、候选过滤以及低成本实验筛选的组合。
此外,研究人员强调,计算从头抗体设计仍然受益于传统蛋白工程和生物化学优化策略。Legobody 框架重塑可以挽救低表达候选,半胱氨酸替换可以改善单体表达,而从设计轨迹中恢复父本或姐妹变体可以提高表达或亲和力。这些模块化优化步骤能够扩大功能性结合物集合,并改善初始命中分子的实验表现。
该研究也暴露出未来需要改进的方向。首先,不同靶点和抗体格式之间的筛选指标并不总能完全泛化,因此仍需更稳健的候选排序和实验成功预测方法。其次,单个理性突变可能同时改善某些性质并削弱另一些性质,例如 D2Ser 提高了单体表达和结合测量质量,却伴随更高多反应性。这提示未来抗体设计必须将亲和力、表达、稳定性、特异性和可开发性作为整体目标共同优化。总体而言,Germinal 有望降低抗体发现对大规模实验基础设施的依赖,使研究人员能够更容易地针对特定功能表位生成新型抗体分子,并为分子生物学工具开发和治疗性抗体设计提供新的技术路径。
整理 | DrugOne团队
参考资料
Mille-Fragoso, L.S., Driscoll, C.L., Wang, J.N. et al. Efficient generation of epitope-targeted antibodies with Germinal. Nat Biotechnol (2026).
https://doi.org/10.1038/s41587-026-03187-0

内容为【DrugOne】公众号原创|转载请注明来源
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢