“DNA搜索引擎”让海量生物数据井然有序

作者: aeks | 发布时间: 2025-10-09 22:47 | 更新时间: 2025-10-09 22:47

学科分类: 数据科学 生物学 计算机科学与技术 软件工程

“DNA搜索引擎”让海量生物数据井然有序
“DNA搜索引擎”让海量生物数据井然有序

MetaGraph是一种革命性的生物信息搜索工具,被称为生物学领域的‘谷歌’。它能高效索引和分析来自全球公共数据库的庞大数据,包括DNA、RNA和蛋白质序列,总量超过100万亿个碱基,远超谷歌网页索引规模。传统的生物数据因数量巨大、碎片化严重,难以直接搜索使用。MetaGraph通过数学‘图谱’技术,将重叠的DNA片段连接起来,像书本索引一样组织信息,实现对原始测序数据的实时压缩与快速访问。研究团队整合了7个公开数据库,覆盖病毒、细菌、真菌、植物、动物乃至人类的2100亿条氨基酸序列,构建了包含1880万个独特核酸序列集的庞大资源库。用户只需输入文本提示,就能像使用搜索引擎一样查找所需生物信息。该工具不仅能提升科研效率,还能在未提前标注的情况下识别隐藏的基因模式,例如在全球24万多个肠道微生物样本中快速追踪抗生素耐药基因,整个分析仅需约一小时。专家认为,这为生物学研究提供了前所未有的便捷手段,开启了从大数据中挖掘生命奥秘的新时代。

DOI: 10.1038/d41586-025-03219-w

标签: DNA序列 MetaGraph 大数据分析 抗生素耐药性 生物搜索引擎