AI揭示全球癌症生存背后的隐秘因素

作者: aeks | 发布时间: 2026-01-18 03:01 | 更新时间: 2026-01-18 03:01

学科分类: 临床医学 公共卫生与预防医学 医学技术 计算机科学与技术

AI揭示全球癌症生存背后的隐秘因素
AI揭示全球癌症生存背后的隐秘因素

这项发表在顶级癌症期刊《肿瘤学年鉴》(Annals of Oncology)上的研究,不局限于宽泛比较,而是旨在明确哪些具体的政策调整或体系改进对各国癌症生存率的影响最大。研究团队还开发了一个在线工具,用户可选择国家,查看国民财富、放射治疗可及性、全民健康覆盖等因素与癌症治疗效果的关联。

### 将全球数据转化为实用见解
美国纽约纪念斯隆凯特琳癌症中心(MSK)的放射肿瘤学住院医师、该研究的联合负责人爱德华·克里斯托弗·迪伊博士强调了这项研究的重要性。“全球癌症治疗效果差异显著,主要源于各国卫生系统的不同。我们希望构建一个可操作的、数据驱动的框架,帮助各国找到最具影响力的政策杠杆,以降低癌症死亡率并缩小公平差距。”

他指出有几个因素一直很突出:“我们发现,放射治疗可及性、全民健康覆盖和经济实力通常是与国家癌症治疗效果较好相关的重要杠杆。不过,其他关键因素也同样相关。”

### 分析185个国家的癌症与卫生系统数据
为得出这些结论,迪伊博士及其同事运用机器学习,分析了来自全球癌症观察站(GLOBOCAN 2022)的癌症发病率和死亡率数据,覆盖185个国家。他们将这些信息与从世界卫生组织、世界银行、联合国机构以及放射治疗中心目录收集的卫生系统数据相结合。

该数据集包括卫生支出占GDP的百分比、人均GDP、每千人拥有的医生、护士、助产士和外科工作者数量、全民健康覆盖水平、病理服务可及性、人类发展指数、每千人拥有的放射治疗中心数量、性别不平等指数,以及患者直接支付的医疗费用占比。

### 构建机器学习模型
该机器学习模型由研究的第一作者米利特·帕特尔先生开发。他是美国得克萨斯大学奥斯汀分校和MSK的生物化学、统计学与数据科学、医疗改革与创新研究员。

帕特尔先生解释了这种方法背后的逻辑:“我们选择使用机器学习模型,是因为它们能生成针对每个国家的具体估计值及相关预测。当然,我们也意识到人口层面数据的局限性,但希望这些发现能为全球癌症系统规划提供指导。”

### 衡量癌症护理效果
该模型计算死亡率与发病率之比(MIR),即死于癌症的病例占总癌症病例的比例,可作为衡量一个国家癌症护理效果的指标。为展示各个因素如何影响这些估计值,研究人员使用了一种通过测量每个变量贡献来解释预测的方法,即SHAP(Shapley Additive exPlanations,沙普利加性解释)。

帕特尔先生表示,研究目标是从描述转向行动:“除了简单描述差异,我们的方法为政策制定者提供了可操作的、数据驱动的路线图,精确显示哪些卫生系统投资对每个国家的影响最大。随着全球癌症负担的增加,这些见解能帮助各国以最公平有效的方式优先分配资源并缩小生存率差距。国际组织、医疗服务提供者和倡导者也可使用这个网络工具来突出投资领域,尤其是在资源有限的地区。”

### 国家案例显示不同优先级
结果显示,影响最大的因素因国家而异。在巴西,模型表明全民健康覆盖(UHC)与死亡率-发病率比的改善呈最强正相关。目前,病理服务以及每千人护士和助产士数量等其他因素的作用相对较小。研究人员认为,这意味着巴西通过优先发展全民健康覆盖可能获得最大收益。

在波兰,放射治疗服务的可及性、人均GDP和全民健康覆盖指数对癌症治疗效果的影响最大。这种模式表明,近期扩大医疗保险和医疗服务可及性的努力比一般卫生支出产生了更显著的改善,而一般卫生支出的效果似乎较为有限。

日本、美国和英国呈现更广泛的模式,几乎所有卫生系统因素都与更好的癌症治疗效果相关。在日本,放射治疗中心的密度最为突出;而在美国和英国,人均GDP的影响最大。这些发现指出了各国政策制定者可能获得最大收益的方向。

中国的情况更为复杂。较高的人均GDP、更广泛的全民健康覆盖以及更多的放射治疗中心可及性对改善癌症治疗效果贡献最大。相比之下,自付费用、每千人外科工作者数量以及卫生支出占GDP的百分比目前对结果差异的解释力较弱。

研究人员在谈到中国时写道:“尽管国家在卫生筹资和可及性方面有所改善,但患者的高额直接费用仍是实现最佳癌症治疗效果的关键障碍。这些发现强调,虽然中国卫生系统的快速发展在癌症控制方面取得了重要进展,但财务保护和覆盖范围的差距仍然存在,需要加强政策关注,以减少自付支出并进一步加强全民健康覆盖的实施,从而最大限度地发挥卫生系统的影响。”

### 如何解读绿条和红条
帕特尔先生还解释了国家特定图表中绿条和红条的含义:“绿条代表目前与特定国家癌症治疗效果改善呈最强正相关的因素。这些领域的持续或增加投资最有可能产生显著影响。”

他强调红条不应被误解:“然而,红条并不表示这些领域不重要或应被忽视。相反,它们反映了根据模型和当前数据,目前不太可能解释结果最大差异的领域。这可能是由于这些方面的表现已经很强、可用数据有限或其他特定背景因素。”

他补充了一个重要提醒:“重要的是,看到‘红条’绝不应被解读为停止加强癌症护理这一支柱的理由——这些领域的改善对一个国家的整体卫生系统仍然有价值。我们的结果只是表明,如果目标是最大限度地改善模型定义的癌症治疗效果,那么首先关注最强的正向(绿色)驱动因素可能是最具影响力的策略。”

### 优势、局限性与未来方向
该研究的优势包括覆盖几乎所有国家、使用最新的全球卫生数据、提供针对特定国家的政策指导而非简单的全球平均值,以及使用更透明的人工智能模型。研究人员也承认一些关键局限性:分析依赖国家层面的数据而非个体患者记录;数据质量差异很大,尤其是在许多低收入国家;国家趋势可能掩盖国内差异。此外,该研究无法证明关注特定因素会导致更好的癌症治疗效果,只能证明此类努力与改善结果相关。

尽管存在这些限制,研究结果仍为优先行动提供了有用的方法。迪伊博士总结道:“随着全球癌症负担的增加,这个模型帮助各国利用有限资源实现最大影响。它将复杂数据转化为政策制定者易于理解、可操作的建议,使精准公共卫生成为可能。”

DOI: 10.1016/j.annonc.2025.11.014

标签: 全民健康覆盖 卫生系统政策 放射治疗可及性 机器学习 癌症生存率