抓到了!奇怪的语言错误可能暴露造假论文
作者: aeks | 发布时间: 2026-06-08 12:02 | 更新时间: 2026-06-08 12:02
本文报道了一项由法医元科学专家詹姆斯·希瑟斯(James Heathers)开展的小型调查:他偶然发现一批医学论文中反复出现一些奇特但高度一致的语言错误,例如将数学家‘Kolmogorov’错拼为‘Kolmogorovor’,或使用语法错误的短语‘after adjusted by common confounding factors’(正确应为‘after adjustment for’或‘after being adjusted for’),以及生硬拗口的表达如‘5 mL gel-containing biochemistry tubes’。起初这些错误看似只是非英语母语作者的常见笔误,但希瑟斯在Google Scholar中搜索这些异常短语后,竟找到约200篇共享相同错误、研究主题、实验设计甚至图表的论文——这种高度重合在统计学上极不可能是巧合,因此他推断这些论文很可能出自同一家‘论文工厂’(paper mill),即专门批量伪造科研论文并出售给急于发表成果的学者的非法机构。值得注意的是,与多数论文工厂集中于基础实验(preclinical)研究不同,这批被识别出的造假论文多基于真实患者数据,因而对临床决策和患者安全构成更直接威胁。不过,其他科研诚信专家也提醒:类似语言模式也可能源于翻译软件、共享编辑服务等正当渠道,并非造假的确凿证据;只有当这些‘语言水印’与其他可疑迹象(如图像篡改、数据异常等)同时出现时,才更有助于锁定问题论文。该方法的优势在于可借助拼写检查器、语法工具和搜索引擎实现自动化筛查,操作快速且成本低;但后续仍需人工逐篇深入核查才能确认学术不端,因此兼具‘快’与‘慢’的双重特性。此外,有学者指出,这类错误更可能反映人工代写(而非AI生成)的‘传统造假’,随着造假手段升级,该方法的长期有效性可能下降。希瑟斯则认为,只要一种检测策略当前有效,就值得立即应用——‘发现问题,就消灭问题’。