斯坦福AI发现你睡觉时隐藏的疾病信号

作者: aeks | 发布时间: 2026-01-10 18:03 | 更新时间: 2026-01-10 18:03

学科分类: 临床医学 公共卫生与预防医学 生物医学工程 计算机科学与技术

斯坦福AI发现你睡觉时隐藏的疾病信号
斯坦福AI发现你睡觉时隐藏的疾病信号

这个名为SleepFM的系统,是利用来自65,000人的近60万小时睡眠记录训练而成的。这些记录来自多导睡眠图——一种深入的睡眠测试,它通过多个传感器追踪睡眠期间的大脑活动、心脏功能、呼吸模式、眼球运动、腿部动作及其他生理信号。

睡眠研究蕴含未被充分利用的健康数据
多导睡眠图被视为评估睡眠的黄金标准,通常在实验室环境中进行夜间测试。虽然它广泛用于诊断睡眠障碍,但研究人员意识到,它还捕捉了大量很少被充分分析的生理信息。

“我们研究睡眠时会记录数量惊人的信号,”医学博士、哲学博士埃马纽埃尔·米尼奥说。他是克雷格·雷诺兹睡眠医学教授,也是这项将于1月6日发表在《自然医学》上的新研究的共同资深作者。“这相当于我们对一个完全处于‘受控状态’的受试者进行了8小时的全身生理研究,数据量非常丰富。”

在常规临床实践中,这类信息中只有一小部分会被检查。如今人工智能的最新进展使研究人员能够更彻底地分析这些庞大而复杂的数据集。研究团队表示,这项研究是首次将人工智能如此大规模地应用于睡眠数据。

“从人工智能的角度来看,睡眠领域的研究相对不足。有很多人工智能研究关注病理学或心脏病学,但尽管睡眠是生活中如此重要的一部分,对睡眠的研究却相对较少,”生物医学数据科学副教授、该研究的共同资深作者詹姆斯·邹博士说。

教人工智能学习睡眠模式
为了从数据中挖掘见解,研究人员构建了一个基础模型——这是一种人工智能,旨在从超大型数据集中学习广泛的模式,然后将这些知识应用于多种任务。像ChatGPT这样的大型语言模型也采用类似方法,不过它们是在文本上训练,而非生物信号。

SleepFM是在从睡眠诊所接受评估的患者那里收集的585,000小时多导睡眠图数据上训练的。每个睡眠记录被分成5秒的片段,其作用很像训练基于语言的人工智能系统时使用的“单词”。

“SleepFM本质上是在学习睡眠的‘语言’,”邹说。

该模型整合了多种信息流,包括脑信号、心律、肌肉活动、脉搏测量和呼吸气流,并学习这些信号如何相互作用。为了帮助系统理解这些关系,研究人员开发了一种名为“留一对比学习”的训练方法。这种方法每次移除一种类型的信号,然后让模型使用剩余数据重建该信号。

“我们在这项工作中取得的技术进展之一,是弄清楚如何协调所有这些不同的数据模态,使它们能够共同学习同一种‘语言’,”邹说。

通过睡眠预测未来疾病
训练完成后,研究人员对模型进行了调整,以适应特定任务。他们首先在标准睡眠评估上测试它,例如识别睡眠阶段和评估睡眠呼吸暂停的严重程度。在这些测试中,SleepFM的表现与目前使用的领先模型相当,甚至更好。

然后,研究团队追求了一个更宏大的目标:确定睡眠数据是否可以预测未来疾病。为此,他们将多导睡眠图记录与同一批人的长期健康结果联系起来。之所以能做到这一点,是因为研究人员可以访问来自单个睡眠诊所数十年的医疗记录。

斯坦福睡眠医学中心由已故的威廉·德门特医学博士、哲学博士于1970年创立,他被广泛认为是睡眠医学之父。用于训练SleepFM的最大一组数据包括约35,000名年龄在2至96岁之间的患者。他们的睡眠研究是1999年至2024年间在该诊所记录的,并与电子健康记录配对,其中一些患者的随访时间长达25年。

(米尼奥指出,该诊所的多导睡眠图记录其实可以追溯到更早,但早期都是纸质记录。他在2010年至2019年期间担任睡眠中心主任。)

利用这个合并的数据集,SleepFM审查了1000多种疾病类别,并确定了130种仅使用睡眠数据就能以合理准确度预测的疾病。在癌症、妊娠并发症、循环系统疾病和精神健康障碍方面的预测结果最为显著,预测分数的一致性指数(C指数)超过0.8。

如何衡量预测准确度
C指数(一致性指数)衡量模型对人群风险进行排序的能力。它反映了模型正确预测两个人中谁会先经历健康事件的频率。

“对于所有可能的个体对,模型会给出谁更有可能更早经历某个事件(例如心脏病发作)的排序。C指数为0.8意味着,80%的情况下,模型的预测与实际发生的情况一致,”邹说。

SleepFM在预测帕金森病(C指数0.89)、痴呆症(0.85)、高血压性心脏病(0.84)、心脏病发作(0.81)、前列腺癌(0.89)、乳腺癌(0.87)和死亡(0.84)方面表现尤为出色。

“令我们惊喜的是,对于一系列相当多样化的疾病,该模型都能做出具有参考价值的预测,”邹说。

邹还指出,准确度较低(通常C指数约为0.7)的模型已在医疗实践中使用,例如帮助预测患者对某些癌症治疗可能产生何种反应的工具。

理解人工智能“看到”了什么
研究人员目前正在努力改进SleepFM的预测,并更好地理解该系统如何得出结论。未来版本可能会整合可穿戴设备的数据,以扩展生理信号的范围。

“模型不会用英语向我们解释这一点,”邹说。“但我们开发了不同的解释技术,以弄清楚模型在做出特定疾病预测时关注的是什么。”

研究团队发现,虽然心脏相关信号在预测心血管疾病时影响更大,大脑相关信号在精神健康预测中作用更显著,但最准确的结果来自于所有类型数据的结合。

“预测疾病时,我们通过对比不同的信号通道获得了最多信息,”米尼奥说。身体各部分信号不同步——例如,大脑看起来处于睡眠状态,但心脏却像清醒时一样——似乎预示着健康问题。

拉胡尔·塔帕(生物医学数据科学博士生)和马格努斯·鲁德·克亚尔(丹麦技术大学博士生)是这项研究的共同第一作者。

来自丹麦技术大学、哥本哈根大学医院- Rigshospitalet、BioSerenity公司、哥本哈根大学和哈佛医学院的研究人员为这项工作做出了贡献。

该研究获得了美国国立卫生研究院(资助编号R01HL161253)、奈特-轩尼诗学者项目和陈-扎克伯格生物中心的资助。

DOI: 10.1038/s41591-025-04133-4

标签: SleepFM 人工智能 多导睡眠图 疾病预测 睡眠数据