AI影像诊断：用不同医院的3D影像，做出稳定可靠的判断

作者: aeks | 发布时间: 2026-03-06 00:03 | 更新时间: 2026-03-06 00:03

本文报道了一项名为Merlin的新型人工智能研究成果：它是一个专为医学影像设计的‘视觉—语言基础模型’，结合了CT（计算机断层扫描）图像识别与医学文本理解能力。Merlin不仅能够分析CT图像中的解剖结构和异常病灶（如肺结节、炎症或肿瘤迹象），还能关联并理解对应的临床报告、诊断描述等文字信息，从而实现图像与文本的双向交互理解。研究团队同步发布了配套的大规模、高质量CT影像-文本配对数据集，供全球研究人员使用。与传统仅处理图像或仅处理文本的AI工具不同，Merlin通过联合建模视觉与语言信息，显著提升了对复杂临床场景的理解能力，有望辅助医生提高诊断效率与准确性，尤其在基层医疗资源有限的场景中具有实用价值。