长读长测序揭示人类肠道中病毒的活动规律
作者: aeks | 发布时间: 2025-11-29 12:03 | 更新时间: 2025-11-29 12:03
学科分类: 生物医学工程 生物学 生物工程 计算机科学与技术
噬菌体是地球上数量最丰富的生物实体,在塑造微生物群落中发挥着关键作用。大多数噬菌体要么是裂解性的,要么会整合到细菌宿主的DNA中(称为前噬菌体),形成携带前噬菌体的细菌(溶原菌)。对λ和Mu等几种模式整合噬菌体的深入研究,构建了我们对溶原菌的理解框架,并确立了分子生物学的基本原理。近年来,宏基因组测序技术和分析工具的进步表明,溶原菌在人类微生物组中的多样性、普遍性和丰度远超以往认知。
大多数人类肠道噬菌体是前噬菌体,不过也存在噬菌体质粒或载体状态等其他生活方式。通常,前噬菌体利用三类专用整合酶(酪氨酸重组酶、小型和大型丝氨酸重组酶、DDE重组酶)将自身基因组插入宿主染色体。通过整合到宿主染色体,噬菌体确保在不利于裂解复制的条件下,能在宿主内进行复制和垂直传递。宿主可能从前噬菌体编码的基因(如抗生素抗性或毒力因子)中获得生存优势,但也面临前噬菌体重新进入裂解循环并杀死宿主的风险。前噬菌体随时间会积累突变,导致其移动机制衰退,而有些前噬菌体基因可能会被细菌宿主采纳并保留。此外,前噬菌体在诱导时可能错误包装宿主基因,通过普遍性和局限性转导等过程,介导相关细菌菌株或物种间的水平基因转移。
噬菌体对细菌宿主和整个微生物群落影响深远,但在同一样本中研究噬菌体和宿主仍具挑战。区分染色体上的噬菌体区域和细菌区域一直很困难,因此研究人员采用病毒样颗粒(VLP)测序来富集病毒序列。这类研究表明,肠道中的噬菌体相对稳定,能在人类宿主中持续存在1年以上。基于VLP的研究增进了我们对肠道微生物组中噬菌体丰度和稳定性的了解,但该技术有两个明显局限:一是只关注VLP,忽略了采样时未主动产生噬菌体颗粒的前噬菌体;二是几乎没有直接证据表明每个噬菌体感染哪些原核宿主。bulk宏基因组学同时对病毒和原核基因组进行测序,结合新的噬菌体预测工具,在一定程度上解决了这些问题。但大多数bulk研究使用短读长测序,无法解析重复元件,在研究复杂群落中的噬菌体时面临诸多挑战,例如噬菌体基因组可能存在大面积相似区域(噬菌体基因组嵌合现象),导致组装碎片化和基因组不完整;若特定前噬菌体整合到多个宿主中,短读长组装也无法解析其宿主,使进一步研究复杂化。
长读长宏基因组测序能产生更连续的组装结果,有望解析单个噬菌体基因组和整合前噬菌体的宿主,在噬菌体研究中具有优势。已有研究显示,长读长VLP测序能解析更完整的病毒基因组并识别噬菌体中的结构变异;长读长测序还能改善前噬菌体和CRISPR间隔区的组装,捕获10天内稳定的个体化噬菌体群体。尽管这有助于从复杂群落中预测宿主,提示某些噬菌体宿主范围极广,但CRISPR间隔区通常很短(20-50个核苷酸),可能高估宿主范围。通过长读长组装将前噬菌体准确组装到其天然宿主中,能提供直接的感染证据,从而研究特定的噬菌体-宿主关系。
本研究利用长读长测序探究人类肠道中前噬菌体与宿主的关系。研究人员收集了6名健康成年人相隔2年的两个时间点(T1和T2)的粪便样本,生成了长读长宏基因组数据(深度约300亿碱基)和短读长数据(深度60亿碱基)。结果显示,长读长组装的连续性显著高于短读长组装(平均contig N50:长读长255.5kb vs 短读长7.8kb),且基因预测长度相似,表明最新化学技术的ONT测序无需短读长校正即可产生准确组装。
通过噬菌体预测工具比较发现,短读长组装中噬菌体区域数量更多,但整合噬菌体比例更低(约5% vs 长读长约60%),且长读长预测的噬菌体区域更长、完整性更高。长读长测序能将大多数噬菌体组装为整合到细菌宿主中的元件,从而直接确定宿主分类。通过基因周围区域的分类注释和现有宿主预测方法,发现宿主分类一致性高(科水平约90%),大多数整合噬菌体存在于厚壁菌门A和拟杆菌门中,与高质量基因组箱的数量一致。
在2年的时间尺度上,研究人员探究了噬菌体是否独立于宿主获得或丢失。通过聚类分析,52%的噬菌体基因组在两个时间点都组装到宿主中,其中90%在宿主基因组中的位置稳定,约5%表现出动态变化(宿主存在但噬菌体丢失或获得)。基于读长覆盖度变化,发现动态噬菌体可能源于新感染、丢失事件或菌株替换。此外,通过结构变异分析,发现约7%的情况下,未携带前噬菌体的宿主( naive宿主)与溶原菌共存,且前噬菌体在群体中的 prevalence 具有高度异质性。在部分噬菌体中检测到环状基因组(表明前噬菌体诱导),大多数诱导噬菌体的覆盖度为宿主区域的1-3倍,符合低水平诱导的理论预期,而非大规模裂解复制爆发。
研究还发现约5%的噬菌体聚类在多个宿主环境中组装。通过噬菌体物种聚类(95%序列一致性,85%覆盖度),大多数噬菌体宿主范围限于种水平(78%),约20%限于属水平,11个噬菌体物种限于科水平,8个限于目水平(多为拟杆菌目)。例如,一种噬菌体整合到 Oscillospiraceae 科的 Vescimonas coprocola、Ruminococcaceae 科的 Negativibacillus sp. 和 Butyricicoccacea 科的 Agathobaculum butyriciproducens 中,提供了跨科宿主范围的强证据。另一种噬菌体在 Tannerellaceae 科的 Parabacteroides distasonis 和 Bacteroidaceae 科的 Bacteroides stercoris 中整合,通过覆盖度和组装验证排除了组装错误。
前噬菌体通常携带整合酶实现基因组整合。对具有结构变异证据的前噬菌体分析发现,酪氨酸和丝氨酸整合酶最常见,DDE型整合酶多与其他整合酶共存,可能代表细菌插入序列(IS)而非噬菌体自身的移动机制。在569个具有明确基因组边界的前噬菌体中,22个未注释整合酶,但两端含有IS30转座酶基因,研究人员将其命名为IScream噬菌体。这类噬菌体基因组结构高度保守,包含噬菌体核心功能基因(如结构蛋白、裂解相关基因),在MGV数据库中发现1780个潜在IS30结合噬菌体,表明其在肠道中广泛存在。IScream噬菌体的IS30转座酶中,朝外的转座酶相对保守且具有催化结构域,朝内的则高度可变、常截短,可能由朝外的转座酶催化噬菌体移动。通过对 Blautia hansenii 培养物的研究,发现IScream噬菌体可自发诱导形成环状基因组,PEG沉淀和PCR验证表明其能形成病毒颗粒,DNase处理保护环状基因组,电镜观察到噬菌体样颗粒,证实其具有噬菌体活性。
综上,本研究通过纵向长读长宏基因组学,揭示了人类肠道前噬菌体的稳定性、群体异质性、广泛宿主范围及新型IScream噬菌体的存在,增进了对肠道噬菌体-细菌动态及水平基因转移、微生物基因组可塑性进化机制的理解。