该标签下共有 1 篇文章
作者: aeks | 发布时间: 2025-11-29 18:03
学科: 临床医学 公共卫生与预防医学 生物医学工程 计算机科学与技术
为减少大语言模型的幻觉问题,检索增强型大语言模型(RALs)会检索外部知识,但它们在生物医学文本处理任务中的表现尚不明确。本研究创建生物医学检索增强生成基准(BioRAB),在5项任务、11个数据集上评估RALs的4项能力。结果显示,RALs总体优于标准大语言模型,但在反事实和多样场景下的鲁棒性及自我识别能力较弱。提出的检测-修正策略和对比学习方法显著改善了这些问题。