我是一名专业事实核查员：AI出错的频率远超你的想象

作者: aeks | 发布时间: 2026-05-27 08:02 | 更新时间: 2026-05-27 08:02

作者以《连线》杂志事实核查员的身份，结合自身工作实践和多项研究数据，深入剖析了AI在事实核查中的真实表现。他指出，尽管AI能快速整理信息、辅助识别可疑主张（如英国Full Fact组织开发的工具），但它本质上无法完成真正意义上的事实核查：它不核实原始信源，不进行人际访谈，不评估法律与伦理风险，更不会为错误负责。实测显示，主流大语言模型（ChatGPT、Claude、Gemini、Grok）在事实核查任务中普遍只提供方法论框架，却拒绝或无法执行具体核查动作；其公开宣称的90%以上准确率缺乏可靠依据，而第三方实测错误率在45%–60%之间——意味着近一半回答可能失实。作者强调，人类知识绝大多数尚未数字化，且物理载体（古籍、胶片、口述史等）长期离线存在；而AI依赖的服务器寿命仅5–10年，远不如刻在金字塔上的象形文字持久。最后，作者坦承人类也会出错（如采访忘开录音笔），因此关键不是拒绝AI，而是理解其原理、善用其线索、坚守人工核查的核心流程：逐行标注、追溯一手资料、多方印证、主动沟通。事实核查的本质，是人对真相的审慎责任，而非算法的自信输出。

标签: AI幻觉事实核查信息可信度大语言模型知识保存