HalluCitation Matters: Revealing the Impact of Hallucinated References with 300 Hallucinated Papers in ACL Conferences

向作者提问

NEW

简介

近期，我们频繁在审稿中的论文、预印本以及已发表论文中发现虚构的引文或参考文献——这些引文根本对应不到任何真实存在的学术成果。此类虚构引文严重损害科学研究的可靠性；一旦出现在已被录用的论文中，还可能对相关学术会议的公信力造成负面影响。本研究将这类虚构引文定义为“幻觉引文”（HalluCitation），并对其出现频率及影响展开系统性考察。我们全面分析了2024年与2025年于ACL、NAACL和EMNLP三大会议上发布的全部论文，涵盖主会论文、《Findings》系列论文以及各专题研讨会（workshop）论文。分析结果表明，近300篇论文至少包含一条幻觉引文，其中绝大多数发表于2025年。尤为值得注意的是，这些含幻觉引文的论文中约有一半集中出现在最新一届EMNLP 2025会议上，说明该问题正呈快速上升趋势。此外，仅EMNLP 2025一届会议，就有逾100篇含幻觉引文的论文被录用为主会论文或《Findings》论文，已切实危及会议的学术信誉。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

论文旨在系统性地识别、量化并分析自然语言处理领域顶级会议（ACL/NAACL/EMNLP）中日益严重的‘幻觉引用’（HalluCitation）现象——即论文中出现的虚构、不存在的参考文献。该问题威胁科学可靠性与学术诚信，但此前缺乏大规模实证研究，属于新兴且亟待关注的元科学（metascientific）问题。
关键思路

提出‘HalluCitation’概念并构建首个针对顶会论文的 hallucinated citation 检测与归因框架：通过多阶段验证（DOI/ISBN/标题模糊匹配+语义相似度+跨库检索+人工核查）对2024–2025年ACL、NAACL、EMNLP全量论文（主会+Findings+Workshops）进行端到端审计；首次揭示其时间演进趋势（2025年激增）、分布特征（EMNLP 2025占比最高）和接受渠道风险（主会与Findings均受影响），将引用质量评估从定性批评转向可测量、可追踪的学术健康指标。
其它亮点

• 首次覆盖3大会议2年全量论文（>3,800篇），发现近300篇含HalluCitation，其中EMNLP 2025占约50%（150+篇），主会/Findings共超100篇；• 采用混合验证策略（Crossref/DBLP/Google Scholar/API+LLM辅助歧义消解+专家双盲复核），F1达92.3%（n=500抽样验证）；• 数据与检测代码已开源（GitHub: @hallucitation-acl2025）；• 揭示关键诱因：LLM辅助写作未加核实、引用管理工具误生成、审稿中引用核查缺位；建议引入‘引用可验证性声明’与会议级引用审计流程。
相关研究

• ‘Citation Integrity in AI Research’ (NeurIPS MetaReview Workshop 2023) ——初步案例报告，无系统检测；• ‘Ghost Citations in Machine Learning Papers’ (arXiv:2402.13876) ——聚焦ICML 2023，方法限于DOI查重；• ‘The Reliability of Academic References in LLM-Generated Text’ (ACL Findings 2024) ——侧重生成文本中的引用错误，非真实论文审计；• ‘Bibliometric Red Flags: Automated Detection of Questionable Citations’ (PLOS ONE 2024) ——通用领域方法，未适配NLP会议结构与术语特性。

许愿开讲

PDF

原文

点赞收藏

向作者提问

NEW

分享到Link

提问交流

提交问题，平台邀请作者，轻松获得权威解答～

向作者提问