用AI帮你快速读懂科研论文

作者: aeks | 发布时间: 2026-02-05 18:04 | 更新时间: 2026-02-05 18:04

学科分类: 交叉学科 图书馆、情报与档案管理 系统科学 计算机科学与技术

用AI帮你快速读懂科研论文
用AI帮你快速读懂科研论文

从科学文献中整合知识对发现新方向、完善方法学和支持循证决策至关重要,但出版物的快速增长使研究人员难以及时了解动态。大型语言模型(LLMs)虽有帮助,却存在幻觉、数据过时和归因有限等问题,例如GPT-4o在引用最新文献时编造引文率达78%-90%。检索增强型语言模型虽缓解部分问题,但多依赖黑盒API或通用模型,缺乏科学领域专用的开放检索数据存储库,评估也局限于单一学科或简化任务。为此,我们推出OpenScholar,首个专为科研设计的完全开放检索增强语言模型,它整合领域专用数据存储库(OSDS,含4500万篇论文和2.36亿段落嵌入)、自适应检索模块和自我反馈生成机制,能迭代优化长篇输出。为评估它,我们开发ScholarQABench,首个多学科开放式科学整合基准,含3000个研究问题和250个专家答案,采用自动指标与人类评分结合的严格评估协议。在ScholarQABench上,OpenScholar超越专有和开源系统,OpenScholar-8B(开源)优于基于专有模型的PaperQA2等,还能提升现成模型(如OpenScholar-GPT-4o正确性提高12%),在答案正确性和引文准确性上达人类专家水平。16位科学家的评估显示,OpenScholar结合GPT-4o和8B模型时,对专家撰写内容的胜率分别为70%和51%,而纯GPT-4o仅31%。研究还发现参数化模型引文编造率高(78%-98%)、覆盖有限。我们已开源所有成果,包括代码、模型、数据存储库、数据集和公共演示版(用户超3万,查询近9万条)。

DOI: 10.1038/s41586-025-10072-4

标签: 学者问答基准 开放学者 引文准确性 检索增强语言模型 科学文献整合