大语言模型(LLMs)在多种情境下均被证实会生成看似合理实则错误的信息,然而此类“幻觉”问题在现实世界中的实际规模及其后果迄今仍缺乏充分认识。本研究利用一种具有独特可验证性的对象——科学文献引文——对arXiv、bioRxiv、SSRN和PubMed Central四大开放获取平台中总计250万篇论文所含的1.11亿条参考文献进行了系统性核查。结果发现,在大语言模型被广泛采用之后,虚构引文数量急剧上升;仅以保守估计,2025年一年内即出现高达146,932条幻觉引文。这些错误虽分散嵌入于大量论文之中,但在人工智能技术采纳速度较快的学科领域、文本语言特征明显体现AI辅助写作痕迹的稿件,以及作者团队规模较小或由早期职业研究者组成的团队所发表的成果中尤为突出。与此同时,幻觉引文不成比例地将学术贡献归功于本已声望卓著且多为男性的学者,表明大语言模型生成的错误可能进一步加剧科学界既有的认可不平等现象。预印本平台的审核机制与期刊出版流程仅能拦截其中极小一部分此类错误,说明幻觉内容的扩散速度已远超现有质量保障体系的应对能力。综上所述,本研究揭示:大语言模型的幻觉现象正以规模化方式渗入知识生产体系,不仅危及未来科学发现的可靠性,也威胁其公平性——因为人类研究者与人工智能系统在开展后续研究时,均需持续依赖既有的科学文献基础。