AI影像诊断:用不同医院的3D影像,做出稳定可靠的判断

作者: aeks | 发布时间: 2026-03-06 00:03 | 更新时间: 2026-03-06 00:03

学科分类: 临床医学 生物医学工程 计算机科学与技术

本文报道了一项名为Merlin的新型人工智能研究成果:它是一个专为医学影像设计的‘视觉—语言基础模型’,结合了CT(计算机断层扫描)图像识别与医学文本理解能力。Merlin不仅能够分析CT图像中的解剖结构和异常病灶(如肺结节、炎症或肿瘤迹象),还能关联并理解对应的临床报告、诊断描述等文字信息,从而实现图像与文本的双向交互理解。研究团队同步发布了配套的大规模、高质量CT影像-文本配对数据集,供全球研究人员使用。与传统仅处理图像或仅处理文本的AI工具不同,Merlin通过联合建模视觉与语言信息,显著提升了对复杂临床场景的理解能力,有望辅助医生提高诊断效率与准确性,尤其在基层医疗资源有限的场景中具有实用价值。

DOI: 10.1038/d41586-026-00645-2

标签: CT影像分析 医学基础模型 多模态AI 放射科人工智能 视觉-语言模型