医学

Medicine

2025年7月2日,温州医科大学张康教授团队在Cell Press细胞出版社旗下期刊Cell Reports Medicine发表了一篇论文,题为“AI-enabled molecular phenotyping and prognostic predictions in lung cancer through multimodal clinical information integration”。该研究提出了一个名为LUCID的多模态人工智能框架模型,该模型能够整合CT影像、主诉、实验室检测结果和人口统计学信息,以无创方式预测肺癌患者的EGFR基因突变情况和生存结局。


温州医科大学张康教授,北京大学未来技术学院王劲卓教授,温州医科大学附属第一医院黄晓颖教授、四川大学华西医院王成弟教授为本文共同通讯作者。北京大学未来技术学院陆宇星博士研究生、北京协和医学院刘飞博士、广州实验室余运芳博士、四川大学华西医院陈勃江研究员为共同第一作者。

▲长按图片识别二维码阅读原文


肺癌是全球癌症相关死亡的主要原因,给全球医疗健康带来了巨大挑战。近年来,人工智能(artificial intelligence,AI)的进步为改善肺癌的诊断、治疗规划和预后预测提供了前所未有的机会。特别是在医学影像分析领域,深度学习算法在解读计算机断层扫描(CT)等影像数据方面取得了显著成功,能够识别出人眼难以察觉的细微病变特征,从而实现更早期、更精准的诊断。然而,传统的诊断模型往往只依赖单一类型的数据,限制了其临床评估的全面性。


在非小细胞肺癌的治疗中,表皮生长因子受体(EGFR)基因突变是一个关键的驱动因素,它能促进肿瘤的发生与发展。特定的EGFR突变(如外显子19缺失和L858R突变)是EGFR酪氨酸激酶抑制剂(TKIs)的有效治疗靶点,携带这些突变的患者使用靶向药物通常能获得比传统化疗更好的疗效和更少的副作用。因此,快速、准确地识别EGFR突变状态对于制定个性化治疗方案至关重要。目前,基因突变检测通常依赖于组织活检等侵入性手段,这不仅给患者带来风险和不适,也需要一定的检测时间。因此,开发一种经济、无创的检测方法来预测基因突变和患者的生存期,对于优化治疗决策和改善患者预后具有重大意义。


近日,来自温州医科大学、北京大学、四川大学华西医院和广州国家实验室等机构的研究团队,开发了一种名为LUCID的新型两阶段多模态人工智能框架。该框架通过整合包括CT影像、患者主诉、实验室检查结果和人口统计学信息在内的四种不同类型的临床数据,旨在无创地预测肺癌患者的EGFR基因突变类型和生存结局。研究表明,LUCID模型在一个包含5175名患者的回顾性队列中表现出强大的预测性能,其预测EGFR突变的AUC达到了0.881,预测患者生存时间的AUC高达0.912。此外,该模型在一个包含1285名患者的独立外部验证队列中也展现了优异的泛化能力与稳健性,证实了其在不同数据集上的有效性。该研究不仅展示了多模态数据融合在精准肿瘤学中的巨大潜力,也提供了一个可扩展的工具,有望辅助临床决策,为肺癌患者制定更个性化的治疗方案。研究结果全文在Cell Reports Medicine发表。

作者专访

Cell Press细胞出版社特别邀请本文研究团队

进行了专访,请他们为大家进一步解读。

CellPress:

近年来人工智能在肺癌诊断和预后预测领域的研究现状如何?



王劲卓研究员:

肺癌是全球癌症相关死亡的首要原因,因此提高其诊断和预后预测的精准度至关重要。近年来,人工智能,特别是深度学习,在医疗影像分析领域展现出巨大潜力。例如,AI算法能够分析CT等医学影像,识别出人类观察者可能忽略的细微病灶模式,从而实现更早、更准确的诊断。然而,现有的大多数AI模型在应用于临床时面临一个核心挑战:它们往往只处理单一类型的数据,如单独分析影像或基因组信息。这种单模态的方法忽略了临床决策中多样化信息的综合价值,导致评估可能不够全面。因此,如何有效地整合CT影像、实验室检查、临床记录等多源异构数据,构建一个更全面的、能模拟真实世界临床思维的预测模型,是当前该领域研究的重点和热点方向。

CellPress:

本项研究提出的LUCID模型,对指导肺癌的临床实践有哪些具体意义?



黄晓颖教授:

LUCID模型对临床实践的意义是多方面的,它旨在将复杂的AI技术转化为医生触手可及的实用工具。首先,它提供了一种无创的预测手段。目前,确定EGFR等关键基因突变状态需要进行组织活检,这具有侵入性且有风险。LUCID通过分析患者已有的CT影像、血液检查、主诉等常规数据,就能对EGFR突变状态和生存风险进行早期预测,这有助于医生在等待病理结果的同时,提前进行治疗规划,缩短决策时间。其次,LUCID模型具有高度的临床流程契合度。它的第一阶段模型可以独立作为放射科医生的辅助工具,自动筛选出可疑的CT影像,极大地提高阅片效率。对于患者而言,该模型能提供更清晰的预后评估,促进医患之间的有效沟通和共同决策。总而言之,LUCID作为一个低成本、可扩展的决策支持系统,有望优化诊疗流程,推动肺癌治疗向更精准、更个性化的方向发展。

CellPress:

与其他AI模型相比,本项研究有哪些突出的亮点?



王成弟教授:

本项研究最大的亮点在于其创新的两阶段多模态融合框架。不同于直接将所有数据“一锅烩”的端到端模型,LUCID首先在第一阶段模拟放射科医生的工作流,利用视觉Transformer(ViT)模型从海量CT影像中精准筛选出高度可疑的病变影像。这一步不仅提高了后续分析的效率和准确性,其本身就是一个有独立应用价值的工具。第二个亮点是第二阶段精巧的融合机制。我们设计了一种基于Transformer的定制化架构,通过交叉注意力和联合注意力模块,分层、深入地融合影像、文本、检验和人口统计学四种不同来源的数据。第三,模型的稳健性和泛化能力得到了充分验证。LUCID不仅在超过5000例的内部数据上取得了优异的性能(EGFR预测AUC达0.881,5年生存预测AUC达0.912) ,更在一个包含1285例患者的独立外部医疗中心数据集上得到成功验证。特别值得一提的是,即使在缺少部分数据模态的情况下,模型依然能保持稳健的性能,这极大地增强了其在真实临床场景中的适用性。

CellPress:

您认为目前利用AI进行肺癌多模态研究还有哪些值得探讨的方向或挑战?



张康教授:

尽管像LUCID这样的模型取得了令人鼓舞的成果,但前方的挑战依然存在。首先,数据质量和可及性是最大的瓶颈。我们的研究依赖于高质量且配对完整的医疗数据,但在真实世界中,数据往往是异构的、不完整的,甚至存在标注不一致的问题。如何让模型在“不完美”的数据上同样表现出色,是未来必须解决的问题。其次,模型的扩展性和灵活性有待提高。目前,如果想预测一个新的基因突变类型,就需要重新收集数据并训练模型,这在计算上是昂贵的。未来的方向可能是开发一种更具扩展性的基础模型,能够更灵活地适应新的预测任务,甚至实现从多模态信息到全基因组信息的全面预测。最后,随着技术的演进,如何将AI模型真正无缝地整合到医院的现有工作流中,并获得临床医生和患者的信任,确保其决策过程的透明度和可解释性,这将是决定这些先进技术能否最终改善患者结局的关键一步。

相关论文信息

论文原文刊载于Cell Press细胞出版社

旗下期刊Cell Reports Medicine

点击“阅读原文”或扫描下方二维码查看论文

论文标题:

AI-enabled molecular phenotyping and prognostic predictions in lung cancer through multimodal clinical information integration


论文网址:

https://www.sciencedirect.com/science/article/pii/S2666379125002897

DOI:

https://doi.org/10.1016/j.xcrm.2025.102216

▲长按图片识别二维码阅读原文

Cell Reports Medicine现已加入Cell Press MJS多刊审稿!Cell Press Multi-Journal Submission(点击查看)的前身Cell Press Community Review模式于2021年推出。对于通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的作者,我们将提供稿件被多本期刊同时考虑的机会。超过80%通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的文章获得了至少一个或多个期刊的评审。


CellPress细胞出版社


内容中包含的图片若涉及版权问题,请及时与我们联系删除