我是一名专业事实核查员:AI出错的频率远超你的想象

作者: aeks | 发布时间: 2026-05-27 08:02 | 更新时间: 2026-05-27 08:02

学科分类: 新闻传播学 计算机科学与技术

作者以《连线》杂志事实核查员的身份,结合自身工作实践和多项研究数据,深入剖析了AI在事实核查中的真实表现。他指出,尽管AI能快速整理信息、辅助识别可疑主张(如英国Full Fact组织开发的工具),但它本质上无法完成真正意义上的事实核查:它不核实原始信源,不进行人际访谈,不评估法律与伦理风险,更不会为错误负责。实测显示,主流大语言模型(ChatGPT、Claude、Gemini、Grok)在事实核查任务中普遍只提供方法论框架,却拒绝或无法执行具体核查动作;其公开宣称的90%以上准确率缺乏可靠依据,而第三方实测错误率在45%–60%之间——意味着近一半回答可能失实。作者强调,人类知识绝大多数尚未数字化,且物理载体(古籍、胶片、口述史等)长期离线存在;而AI依赖的服务器寿命仅5–10年,远不如刻在金字塔上的象形文字持久。最后,作者坦承人类也会出错(如采访忘开录音笔),因此关键不是拒绝AI,而是理解其原理、善用其线索、坚守人工核查的核心流程:逐行标注、追溯一手资料、多方印证、主动沟通。事实核查的本质,是人对真相的审慎责任,而非算法的自信输出。

标签: AI幻觉 事实核查 信息可信度 大语言模型 知识保存