
由生成式人工智能驱动的生物医药科技公司英矽智能(Insilico Medicine, 03696.HK) 今日宣布,其研究论文《当单一答案不再足够:重新审视大语言模型(LLM)的单步逆合成基准测试》(When Single Answer Is Not Enough: Rethinking Single-Step Retrosynthesis Benchmarks for LLMs)已被第43届国际机器学习大会(ICML 2026)接收,并将进行展示。该会议将于2026年7月6日至11日在韩国首尔的 COEX 会议展览中心举行。

关于 ChemCensor 的 ICML-2026 预印本论文已发表,
点击文末【阅读原文】即可访问
该研究由英矽智能位于阿布扎比的生成式人工智能与量子计算研发中心的专业团队牵头,对传统逆合成基准测试中的“唯一真值(ground-truth dogma)”提出了挑战。论文引入了 ChemCensor,这是一种全新的、具备化学知识的评价指标,旨在超越僵化的 Top-K 准确率,转向能够反映化学家实际思维方式的专家级评估:以反应中心与官能团为依据,而非简单的二元逻辑。
“真实的化学本质上具有多重解法,我们的基准测试应当反映这一现实,”英矽智能创始人兼首席执行官 Alex Zhavoronkov 博士表示,“ChemCensor 是我们更广泛的 MMAI GYM 的关键组成部分,我们正在构建该平台,以打造真实、可扩展的训练环境,迈向制药超级智能(Pharmaceutical Superintelligence)。”
论文摘要
超越 Top-K 准确率:论文指出,在 USPTO-50K 等受限基准上采用“单一答案”式评估,难以从根本上反映逆合成任务的真实复杂性,并提出具备化学认知的全新指标 ChemCensor。
CREED 数据集: 引入了发布“综合反应物穷尽枚举数据集”(Comprehensive Reactant Exhaustive Enumeration Dataset,CREED),收录 640 万条经 ChemCensor 验证的反应。
C3LM 模型: 论文给出了 2026 年 1 月版本 C3LM 的实验结果;然而,英矽最新迭代已超越 LocalRetro、R-SMILES、Retro-KNN 等传统最先进(SOTA)模型
URSA-expert-2026: 发布了一个包含 100 个新靶点的专家标注域外(out-of-domain)基准,以降低数据泄漏风险,确保评估更客观可信
英矽智能始终致力于保持完全的透明度和可复现性,大量的支持材料将在 Zenodo、Hugging Face 和 GitHub 发布。
关于英矽智能
英矽智能是一家全球先锋生物科技公司,致力于整合人工智能和自动化技术,加速药物发现并推动生命科学领域的创新,赋能人类更长久更健康的生活。2025年12月30日,公司于香港联交所主板挂牌上市,股票代码:03696.HK。
利用自主研发的Pharma.AI 平台和先进的自动化生物学实验室,英矽智能正在为纤维化、肿瘤学、免疫学、疼痛、肥胖和代谢紊乱等未满足的疾病领域提供创新药物解决方案。此外,英矽智能持续将Pharma.AI应用拓展到多元化领域,如先进材料、农业、营养产品及兽医药物。更多信息,请访问网站www.insilico.com
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢