1

我们身上的陌生人:测绘人体菌群的第一张地图

从无法培养到测序革命,HMP如何在2007年重写了「健康」的定义

5101 字 · 约 15 分钟

2010年的一个清晨,委内瑞拉亚马逊州的一家产科病房里,玛丽亚·格洛丽亚·多明格斯-贝洛正在等待一个婴儿出生。她不是来接生的,而是来采样的。棉签、无菌管、冰盒,一套精心准备的工具摆在手术台旁边。婴儿一旦落地,她要在五分钟内完成一项争分夺秒的任务:在这个新生命与外部世界完全接触之前,刮取他皮肤、口腔和鼻咽的第一批微生物居民。 多明格斯-贝洛是委内瑞拉裔微生物学家,彼时任职于波多黎各大学。她想回答一个听起来简单、实则从未有人认真测量过的问题:一个人最初的微生物是从哪里来的?顺产与剖宫产,这两条出生路径,会给新生儿带来截然不同的第一批定居者吗? 这个问题之所以在2010年才有人去问,部分原因是技术。在此之前,科学家研究微生物的方式,三百年来几乎没有根本性的改变。

本章要点

2007年,美国国立卫生研究院投入1.7亿美元启动人类微生物组计划,借助16S核糖体RNA测序技术,首次对242名健康成人五大体表区域的菌群进行系统普查,建立起人类历史上第一张微生物「健康基线」地图。这张地图揭示了三件此前无人知晓的事:健康人身上普遍携带金黄色葡萄球菌等机会性病原体,健康的阴道菌群恰恰以极低的多样性维持稳态,而每个人的菌群「指纹」在健康状态下具有跨时间的个体特异性。与此同时,多明格斯-贝洛在委内瑞拉产科病房的发现,将「健康基线」的起点从成人向前推至人生第一分钟,迫使整个领域重新追问:我们所定义的「正常」菌群,究竟从哪一刻开始算起?

三百年的盲区

1676年,荷兰布商安东尼·列文虎克用自己磨制的透镜,第一次看见了口腔刮取物里蠕动的微小生命。他把这些「极微小的动物」描述得绘声绘色,寄信给伦敦皇家学会,引发了科学界的震动。但列文虎克能做的,只是看见它们。接下来将近三百年,科学家研究微生物的主要手段是培养:把样本涂抹在培养基上,给它们温度、营养,等着菌落长出来,再一一鉴定。

这套方法有一个致命的局限。自然界中绝大多数微生物,在人工培养条件下根本不生长。它们需要特定的气体环境、特定的共生伙伴、特定的化学信号,而实验室的培养皿提供不了这些。结果是,科学家能研究的,只是那些恰好适应了人工环境的少数物种。在肠道这个生态系统里,可培养的种类大约只占实际存在物种的百分之一。另外百分之九十九,在培养皿里沉默无声,仿佛从未存在过。

这个盲区持续了如此之久,以至于科学家一度以为自己对人体微生物的认识已经相当完整。20世纪中叶的微生物学教科书会告诉学生,人体肠道的主要居民是大肠杆菌和乳酸杆菌。这个答案并非错误,只是极度残缺,就像试图描述一片热带雨林,却只见过其中会飞进开着窗的房间里的蚊子。

转机来自一个完全不同的领域。1977年,伊利诺伊大学的卡尔·乌斯和乔治·福克斯发表了一篇论文,证明细菌细胞里有一段名为16S核糖体RNA的基因,其序列在不同物种之间各有差异,可以充当微生物的「分子条形码」。这个发现的革命性在于:鉴定一种微生物,不再需要先把它养活,只需要读取它的这段基因序列,就能知道它是谁。

但乌斯的发现在技术上真正变得可用,还需要再等将近三十年。2005年前后,以454焦磷酸测序为代表的新一代高通量测序技术完成商业化,单次测序的成本骤降,通量大幅提升。一个实验室现在可以同时处理数千份样本,对每份样本里的16S基因序列进行平行读取。那百分之九十九的沉默居民,终于有了被点名的机会。

普查一个人体宇宙

2007年,美国国立卫生研究院正式启动人类微生物组计划,投入1.7亿美元,目标是在严格定义的「健康」标准下,第一次系统绘制人体五大体表区域的微生物基线图谱。这个计划的雄心,与1990年启动的人类基因组计划一脉相承:用工业化的规模和标准化的流程,对一个此前只有零散认知的生物系统进行全面普查。

「健康」这个词,在HMP里被定义得异常严苛。受试者需要通过一份长达数页的排除标准筛查:近期没有使用抗生素,没有慢性病,没有正在进行的感染,体重指数在正常范围内,牙齿没有严重问题。最终,242名成人通过了筛选,其中129名男性、113名女性,共采集了4,788份样本。

五大区域的选择,背后有明确的逻辑。口腔、皮肤、肠道、阴道、鼻腔,这些部位都是人体与外部环境直接接触的界面,也是已知与疾病关联最密切的微生物栖息地。肺在当时被认为基本无菌(后来的研究修正了这个假设),眼睛的微生物量极少且采样困难。HMP需要的是能够建立统计学意义上可靠基线的部位,而不是每一个角落。

口腔是这次普查中采样密度最高的单一区域。仅口腔及咽部就设置了9个采样点,包括唾液、颊黏膜、角化龈、腭、扁桃体、咽喉、舌软组织,以及龈上和龈下牙菌斑。这个设计揭示了一个令人意外的事实:即使在同一张嘴里,相邻的微环境就已经孕育出截然不同的优势菌群。龈上菌斑暴露在空气中,放线菌占主导;仅一层牙龈之隔的龈下菌斑处于低氧环境,普雷沃菌成了主角。口腔不是一个统一的生态系统,而是由十几个微型生态系统拼合而成的马赛克。

肠道的数据来自粪便样本,这是目前最接近肠道内容物的无创采样方式。每份样本平均产生5,408条经过质量过滤的16S序列,此外还有681个样本进行了更深度的宏基因组测序,平均每个样本产生2.9吉字节的原始数据。宏基因组测序读取的是样本中所有微生物的全部基因,而不仅仅是16S这一段,因此能提供功能层面的信息:这些菌在做什么,而不仅仅是它们是谁。

2012年,HMP联合体在《自然》杂志发表了核心成果论文,正式确立了这张基线地图。

健康不等于无菌

HMP最出人意料的发现之一,与病原体有关。

在一般人的直觉里,健康人身上不应该有致病菌。HMP的数据彻底颠覆了这个假设。研究者对照了一个包含327种已知病原体的数据库,在这242名经过严格筛选的健康成人身上,检出了其中56种,占比约17%,且全部为机会性病原体(即平时不致病、在特定条件下才会趁机作乱的细菌)。

最引人注目的是金黄色葡萄球菌。这种细菌是耐甲氧西林金黄色葡萄球菌(俗称超级细菌)的源头,每年在全球造成数以万计的感染死亡。HMP发现,在健康人群中,鼻腔携带率高达29%,皮肤携带率为4%。将近三分之一的健康人,鼻子里住着这种细菌,却安然无恙。

这个数字迫使科学家重新思考「携带」与「患病」之间的关系。金黄色葡萄球菌在鼻腔里的存在,并不意味着感染,而是一种长期共存的稳态。宿主的免疫系统认识它,与它维持着某种默契的边界。只有当这个边界被打破,比如免疫力下降、皮肤破损、或者细菌进入了血液,疾病才会发生。健康,不是无菌的状态,而是一种动态的平衡。

阴道菌群的数据提供了另一个维度的复杂性。在HMP的五大区域中,阴道的alpha多样性(衡量单个样本内物种种类丰富程度的指标)是最低的,也就是说,健康阴道里的菌种种类相当单一。但与此同时,不同个体之间的阴道菌群差异却极大,beta多样性(衡量不同样本间菌群组成差异程度的指标)在五大区域中名列前茅。原因在于:不同女性携带的优势乳杆菌物种各不相同,有人以卷曲乳杆菌为主,有人以惰性乳杆菌为主,各自构成了高度单一但彼此迥异的群落。

这个「低多样性不等于低复杂性」的发现,直接挑战了当时微生物组研究中一个流行的简单假设:多样性越高,菌群越健康。阴道的数据表明,这个原则不能一刀切地套用。在阴道这个特定的生态位里,高度单一的乳杆菌主导群落恰恰是健康的标志,而多样性升高,反而与细菌性阴道病相关。生态学的规律,需要在具体的生境里重新校准。

稳定性的数据同样值得关注。HMP对131名受试者进行了两次采样,平均间隔219天。分析结果显示,同一个人在不同时间点的菌群变化幅度,始终低于不同人之间的差异。换句话说,每个人的微生物组在健康状态下具有跨时间的个体特异性,像一枚生物指纹,相对稳定地属于这个人。

出生第一分钟的赌注

就在HMP的数据还在各测序中心汇集的时候,一个规模小得多、但问题更为根本的研究,正在委内瑞拉的一家产科病房里进行。

多明格斯-贝洛的研究对象是9名母亲和10名新生儿,其中4例顺产、6例剖宫产,包括一对男性异卵双胞胎。研究团队在婴儿出生后5分钟内,对母亲和婴儿的多个体表部位同步采样,共获得157,915条16S核糖体RNA序列,每个样本约2,000条。这是第一次有人在多个体表生境同步比较出生方式对新生儿初始菌群的影响。

数据呈现出一个清晰得令人震惊的模式。顺产婴儿皮肤、口腔黏膜和鼻咽部位的菌群,与其母亲的阴道菌群高度相似,以乳杆菌、普雷沃菌或斯尼思菌属为主。部分母亲的阴道样本中,乳杆菌占到了序列总量的88%到94%,这些乳杆菌几乎原封不动地出现在了婴儿身上。剖宫产婴儿则截然不同,他们各部位的菌群与皮肤表面菌群相似,以葡萄球菌、棒状杆菌和丙酸杆菌为主,这是母亲及手术室环境的皮肤菌群,而非阴道菌群。

出生方式决定了新生儿第一批定居者的来源,这个结论本身并不令人完全意外。令人意外的是另一个细节:无论顺产还是剖宫产,新生儿在出生后5分钟内采集的各部位样本,皮肤、口腔、鼻咽之间几乎没有分化,携带的是同一套「未分化」的先锋菌群。而母亲的口腔、皮肤、阴道,早已各具特色,菌群高度分化。

这说明,体表不同部位菌群的分化,是出生后逐步发生的,而非与生俱来。婴儿在出生那一刻接收的,是一个统一的「种子库」,然后由不同的体表微环境,在接下来的数周、数月里,将这些种子塑造成各自不同的群落。出生方式决定的,是这个种子库从哪里来。

2010年,这篇论文发表在《美国国家科学院院刊》上,立刻引发了争议。争议的焦点不在于数据,而在于它的公共卫生含义。2007年,美国超过30%的活产婴儿经由剖宫产出生,这个比例在此后数年还在继续攀升。多明格斯-贝洛的数据意味着,超过三分之一的美国新生儿,从出生第一秒起就走上了与顺产婴儿截然不同的微生物定植轨道。

这条不同的轨道会通向哪里?当时没有人知道。但这个问题已经无法回避。

「健康基线」从哪里开始

HMP建立的健康基线,来自两个地理位置的242名美国成人。这个数字在微生物组研究的历史上是空前的,但放在人类多样性的尺度上,它仍然是一个局部的快照。

研究者在发表成果时对这一局限有清醒的认识。这242人通过了严苛的健康筛查,但「健康」本身就是一个有文化背景、有地理背景、有时间背景的概念。一个在亚马逊丛林里长大的委内瑞拉人,和一个在圣路易斯长大的美国人,他们的「健康」菌群可能有着深刻的差异,但HMP的基线里只有后者。

多明格斯-贝洛的新生儿研究,从另一个方向戳穿了「基线」概念的复杂性。如果出生方式从根本上决定了一个人最初的微生物种子库,那么HMP所测量的成人健康基线,究竟是哪种出生方式下的健康?是顺产的,还是剖宫产的,还是两者的混合?当研究者说某种菌群构型属于「健康」,他们描述的,是一个真实存在的共同状态,还是在无穷多样性中强行画出的一条平均线?

这两个问题,在2012年HMP核心论文发表时,都还没有答案。但它们的提出,本身就是一种进步。在HMP之前,科学界对人体微生物的认识,建立在那百分之一的可培养物种上,建立在零散的、缺乏标准化的小样本研究上。HMP提供的,是第一个系统性的参照系,一张虽然不完整但可以被质疑、被补充、被修正的地图。

有地图,才能知道自己在哪里偏离了路径。有基线,才能开始追问偏离意味着什么。HMP的意义,不在于它给出了最终答案,而在于它第一次让这些问题变得可以被精确地提问。

各体表生境的「签名菌群」,在属水平上平均占据各生境菌群的17%到84%不等。这个范围本身就说明,不同部位的菌群生态,有的高度可预测,有的则充满个体差异。皮肤的菌群组成,在不同人之间的差异,远大于同一个人不同时间点之间的差异。每个人,在某种意义上,都是一个独特的微生物宇宙。

结语

2012年,当HMP的核心论文在《自然》杂志发表时,它带来的不只是数据,还有一套新的语言,让科学家得以更精确地谈论一个此前只能模糊描述的系统。242名成人、4,788份样本、五大体表区域,这张地图的边界清晰可见,它的空白同样清晰可见。 多明格斯-贝洛在委内瑞拉产房里的发现,则把这张地图的时间轴向前延伸至人生第一分钟。如果先锋菌群的种子库决定了后续菌群发育的轨迹,那么「健康基线」就不只是一个成人的概念,它的起点可能早在出生那一刻就已经确定。 这个问题的答案,需要一种不同的研究模式:不是在实验室里等待受试者上门,而是把研究工具交到普通人手中,让成千上万的人参与进来,提供他们自己的样本,讲述他们自己的故事。这正是罗布·奈特和杰夫·利奇在2012年发起美国肠道项目时所想到的。

图表数据

从列文虎克到HMP:三百年的技术跃迁

  1. 1676
    列文虎克首次观察到口腔微生物,但无法鉴定物种
  2. 1977
    乌斯与福克斯证明16S核糖体RNA可作为微生物分子条形码
  3. 1990
    人类基因组计划启动,奠定多中心协作与数据共享规范
  4. 2005
    454焦磷酸测序商业化,高通量测序成本骤降
  5. 2007
    NIH投入1.7亿美元正式启动人类微生物组计划
  6. 2010
    多明格斯-贝洛发表新生儿出生方式与菌群研究
  7. 2012
    HMP核心论文发表,242名健康成人4,788份样本建立基线

HMP五大体表区域采样点数量与菌群特征

备注
口腔采样点数量来自PMID 22699609;阴道采样点数为3个(对应女性受试者独有的3个采样位置)
regions
名称signaturesampling_sitesalpha_diversity
口腔及咽部链球菌、放线菌、普雷沃菌(因微环境而异)9
皮肤葡萄球菌、棒状杆菌、丙酸杆菌多点
肠道拟杆菌门、厚壁菌门1极高
阴道各型乳杆菌(因个体而异)3极低(但个体间差异极大)
鼻腔葡萄球菌(携带率29%)多点中低

顺产vs.剖宫产:新生儿第一批定居者的来源对比

rows
  • 种子库来源
  • 母亲阴道菌群
  • 母亲及环境皮肤菌群
  • 优势菌群
  • 乳杆菌、普雷沃菌、斯尼思菌属
  • 葡萄球菌、棒状杆菌、丙酸杆菌
  • 母亲阴道乳杆菌占比
  • 部分母亲高达88—94%
  • 极低或缺失
  • 出生5分钟内各部位分化程度
  • 全身各处几乎无分化(同一套先锋菌群)
  • 全身各处几乎无分化(同一套先锋菌群)
  • 2007年美国占比
  • 约70%
  • 超过30%
来源
PMID 20566857
columns
  • 维度
  • 顺产新生儿
  • 剖宫产新生儿

本章引用论文