“虚构”的参考文献正在污染科学文献,我们该怎么办?
作者: aeks | 发布时间: 2026-04-02 18:02 | 更新时间: 2026-04-02 18:02
学科分类: 图书馆、情报与档案管理 新闻传播学 计算机科学与技术
今年早些时候,法国图卢兹大学计算机科学家纪尧姆·卡巴纳克发现,自己一篇从未正式发表的预印本竟被某牙科期刊论文引用——但引用信息有误:期刊名被写成《自然》,DOI无法链接到原文。他立即怀疑这是AI生成的虚假引用。此类事件正快速增多:多项研究显示,大型语言模型(LLM)在文献检索、论文撰写和参考文献整理中被频繁使用,却常虚构根本不存在的学术文献。例如,对近1.8万篇计算机领域会议论文的分析发现,2025年含至少一个疑似幻觉引用的论文比例达2.6%,远高于2024年的0.3%;另一项研究估计,2025年四场顶会中2–6%的论文存在标题篡改或无法验证的引用。《自然》新闻团队联合英国公司Grounded AI,对4000余篇2024年出版物(涵盖五大出版社)进行筛查,发现其中65篇经人工核实确含无效引用(即指向根本不存在的论文)。据此粗略推算,2025年全球约700万篇学术成果中,可能超11万篇含AI生成的虚假参考文献。问题不仅限于会议论文——期刊文章、图书章节、会议录均受影响。出版方已开始部署AI检测工具(如Frontiers自研系统、Grounded AI的Veracity),但工具存在误报(如因格式差异或非英文区域期刊未被数据库收录而误标);人工核查仍是金标准。专家指出,AI幻觉引用与传统引用错误(如拼写错误、年份错)本质不同:它制造的是完全虚构的学术存在,破坏科研可重复性根基。目前尚无统一处理规范,部分期刊已直接拒稿(如《国际政治经济学评论》1月拒收25%投稿,主因是虚假引用)。研究者呼吁加强作者责任意识、完善出版审核流程,并推动跨平台引文元数据标准化。