“虚构”的参考文献正在污染科学文献，我们该怎么办？

作者: aeks | 发布时间: 2026-04-02 18:02 | 更新时间: 2026-04-02 18:02

今年早些时候，法国图卢兹大学计算机科学家纪尧姆·卡巴纳克发现，自己一篇从未正式发表的预印本竟被某牙科期刊论文引用——但引用信息有误：期刊名被写成《自然》，DOI无法链接到原文。他立即怀疑这是AI生成的虚假引用。此类事件正快速增多：多项研究显示，大型语言模型（LLM）在文献检索、论文撰写和参考文献整理中被频繁使用，却常虚构根本不存在的学术文献。例如，对近1.8万篇计算机领域会议论文的分析发现，2025年含至少一个疑似幻觉引用的论文比例达2.6%，远高于2024年的0.3%；另一项研究估计，2025年四场顶会中2–6%的论文存在标题篡改或无法验证的引用。《自然》新闻团队联合英国公司Grounded AI，对4000余篇2024年出版物（涵盖五大出版社）进行筛查，发现其中65篇经人工核实确含无效引用（即指向根本不存在的论文）。据此粗略推算，2025年全球约700万篇学术成果中，可能超11万篇含AI生成的虚假参考文献。问题不仅限于会议论文——期刊文章、图书章节、会议录均受影响。出版方已开始部署AI检测工具（如Frontiers自研系统、Grounded AI的Veracity），但工具存在误报（如因格式差异或非英文区域期刊未被数据库收录而误标）；人工核查仍是金标准。专家指出，AI幻觉引用与传统引用错误（如拼写错误、年份错）本质不同：它制造的是完全虚构的学术存在，破坏科研可重复性根基。目前尚无统一处理规范，部分期刊已直接拒稿（如《国际政治经济学评论》1月拒收25%投稿，主因是虚假引用）。研究者呼吁加强作者责任意识、完善出版审核流程，并推动跨平台引文元数据标准化。

DOI: 10.1038/d41586-026-00969-z

标签: 参考文献造假大型语言模型学术诚信幻觉引用科研可重复性