用纠错后的纳米孔测序数据完成端到端的染色体组装

作者: aeks | 发布时间: 2026-04-28 06:02 | 更新时间: 2026-04-28 06:02

学科分类: 生物医学工程 生物工程 计算机科学与技术

端粒到端粒(T2T)基因组组装是目前高质量参考基因组的黄金标准,但传统方法需结合多种高精度长读长(如PacBio HiFi)与超长纳米孔读长(ONT),成本高、耗DNA多,尤其难以规模化应用。本文突破性地证明:仅使用牛津纳米孔(ONT)的超长Simplex单向读长,先通过自主研发的深度学习工具HERRO进行纠错,再用先进从头组装软件Verkko组装,即可获得媲美传统多平台方案的T2T结果。HERRO的核心优势在于“单倍型感知”纠错——它在提升读长准确率(最高达100倍)的同时,刻意保留来自不同染色体拷贝(如父源/母源单倍型或重复序列)的真实差异,避免错误抹平生物学关键变异。该方法成功重建了最多32条人类染色体(含X、Y),所有测试样本的组装连续性指标(NGA50)均稳定超过1亿碱基对(100 Mb)。HERRO兼容主流ONT测序芯片(R9.4.1和R10.4.1),且在其他物种中也表现良好。这意味着,科研人员今后可用更便宜、更省样、更简化的单平台流程,获得更完整、更准确的基因组,推动精准医学和复杂基因组研究。

DOI: 10.1038/s41586-026-10563-y

标签: 单倍型解析 基因组组装 深度学习纠错 端粒到端粒组装 纳米孔测序