首页 理论教育微生物对肠道癌症的转化应用启示

微生物对肠道癌症的转化应用启示

【摘要】:了解结直肠癌微生物群的宏基因组结构将有助于选择有用的生物标志物,而认识微生物群相关的机制将有助于确定癌症预防和治疗的有用靶点。生物标志物是疾病存在或严重程度的指示器。鉴于有多项研究报道了由特定微生物引起的菌血症与随后的结直肠癌诊断之间的关系,检测这些特定细菌或其血液免疫反应可能为检测结直肠癌提供线索。

虽然深入探讨结直肠癌机理已经超出了这篇综述的范围,作者还是总结了与临床相关性更强的结直肠癌发生相关的微生物方面的内容。了解结直肠癌微生物群的宏基因组结构将有助于选择有用的生物标志物,而认识微生物群相关的机制将有助于确定癌症预防和治疗的有用靶点。在此背景下,了解不同微生物因素在驾驶员—乘客致癌模型中的位置也很重要,直接致癌细菌(司机)和肿瘤环境中的机会性细菌(乘客)可用于癌症诊断、预防和治疗的不同目的。了解每一种细菌的独特生态位,将有助于设计出一种逻辑化策略将这些发现转化为临床应用。

3.1 利用微生物群作为生物标志物

肠道微生物群的一个新兴应用是作为生物标志物。生物标志物是疾病存在或严重程度的指示器。有大量证据表明,一般风险人群筛查可以降低结直肠癌发病率和死亡率,因此一种准确的、非侵入性的筛查试验可以大大减轻结直肠癌的全球健康负担。此外,有几项研究报告了细菌标志物与治疗效果或临床结果之间的关系,增加了使用这些标志物进行预测和预后的潜力。肠道微生物群的分析是潜在生物标志物的丰富来源。

3.2 生物标志物用于筛选粪便标志物检测结直肠癌

图3-1-2 肠道微生物群生物标记物用于结直肠癌筛查

人们需要准确的生物标志物来筛查结直肠癌,尤其是早期结直肠癌,因为早期结直肠癌治疗可以获得良好的临床结果。例如,局限性结直肠癌的5年生存率为90%,而远处转移性的5年生存率为14%。目前的粪便免疫化学检测(FIT)对结直肠癌的敏感性为79%,对晚期结直肠腺瘤的敏感性为25%~27%。虽然多靶点粪便DNA检测可能比FIT能检测出更多的癌症(敏感性92.3%),但仍然受限于晚期腺瘤检测的敏感性(敏感性42.4%)。因此,对结直肠癌和晚期腺瘤进行准确、经济、无创、高敏感性的检测是非常必要的。越来越多的结直肠癌宏基因组数据集为开发用于疾病诊断的粪便微生物标志物提供了丰富的来源。已有多项研究利用多种细菌丰度来区分结直肠癌患者和健康个体,其中两项病例对照研究分别用22和34种微生物标记物得到受试者工作特征(ROC)曲线下的面积(AUC)为0.84~0.85。既往香港的一项宏基因组研究中,比较结直肠癌(n=74)和健康个体(n=54)发现20个微生物基因与疾病的存在相关。这组基因标志物可以被削减为两个有效生物标志物F.nucleatum的丁酰辅酶A脱氢酶和P.micra的RNA聚合酶亚基β(rpoB),AUC为0.84。在一项使用贝叶斯方法的研究中,综合6种细菌粪便丰度数据的logistic回归模型区分结直肠癌患者和健康者的AUC为0.80,年龄、种族和BMI加入模型后AUC进一步提高至0.92。此外,考虑到结直肠癌中出现的病毒组和细菌组的宏基因组结构,从这些群落中获得的微生物特征可能被用于筛选结直肠癌的生物标志物。在几种候选细菌中,无论是单独定量还是与其他细菌连用(特别是Clostridium symbiosum,C.hathewayi和产大肠杆菌素的clbA),F.nucleatum都是一个关键的标志物。F.nucleatum粪便丰度可增强FIT的有效性,比FIT单独检测结直肠癌的灵敏度和特异性更高。例如,增加粪便F.nucleatum丰度来拟合,可以使AUC从0.86增加到0.95。这种方法证明了多靶点测试的优点,即其中各个成分可以相互补充以减少癌症病例的遗漏。在2019年发表的一项大规模meta分析研究中对随机森林分类器进行评估,仅用16个物种就能够对大部分数据集实现交叉验证,其AUC>0.8。这一发现为使用有限数量微生物物种或基因的标记物进行基于粪便的准确诊断测试提供了支持。最后,来自地理上不同的宏基因组的meta分析表明,多微生物分类器在全球都适用,并且对技术和地理上的差异具有很强的适应性。

肠道微生物群生物标记物用于结直肠癌筛查,评价原始数据和已报道的用于结直肠癌筛选的粪便微生物标记物的性能的研究。AUC,受试者工作特性曲线下面积;CEA,癌胚抗原;FOBT,粪便潜血试验;FIT,粪便免疫化学试验;PKS,聚合酶;qPCR,定量PCR。

3.3 粪便标记物检测腺瘤

研究证实,结直肠癌是由正常黏膜逐渐发展为癌前病变,最后发展为恶性肿瘤。腺瘤是结直肠癌的主要癌前病变,一旦发现,可以通过结肠镜切除来阻止癌变级联反应。因此,检测腺瘤性息肉,尤其是晚期腺瘤,对预防和减少结直肠癌很有必要。目前,基于无创的粪便筛选试验(包括FIT和多靶点粪便试验),结直肠腺瘤检测的敏感性较低。在一项研究中使用贝叶斯方法评估模型标志物,5个粪便细菌标志物丰度数据结合临床参数可以较好区分结直肠腺瘤患者和健康对照(AUC=0.90),结直肠腺瘤验后概率增加了4.5倍。这些发现提示了利用微生物组成数据诊断结直肠腺瘤的可能性。然而,一项粪便宏基因组的meta分析研究显示,从健康对照组中预测腺瘤患者的AUC值较低(最大AUC为0.58)。F.nucleatum作为一种特异性菌株,在多项研究中均被发现在结直肠腺瘤中富集,尽管其丰度差异的幅度小于结直肠癌患者和健康人之间的差异。粪便样本中F.nucleatum的定量或者和其他微生物标记/FIT联合使用已被证明可以将结直肠腺瘤患者与健康人区分开来,尽管腺瘤病例与对照之间的差异没有那么明显。研究人员还在粪便样本之外寻找生物标志物。几项研究报告了结直肠癌与口腔微生物群(如,Streptococcus和Prevotella spp.)之间的关系,并提出了用口腔细菌图谱预测结直肠癌的可能性。在一项研究中,研究人员调查了结直肠癌患者、结直肠腺瘤患者和健康个体的口腔微生物菌群,并开发了一种基于口腔微生物菌群的分类器,将这些病例与健康对照组区分开来。这种方法的主要优点是取样方便,使患者的接受度更高而且有利于大规模的全人群筛查。鉴于有多项研究报道了由特定微生物引起的菌血症与随后的结直肠癌诊断之间的关系,检测这些特定细菌或其血液免疫反应可能为检测结直肠癌提供线索。鉴于结直肠癌与S.gallolyticus的密切联系,开发了一项复杂的血清学检测,检测阳性与10年后的结直肠癌诊断相关。此外,评估F.nucleatum血清抗体也可能是结直肠癌检测的一个潜在生物标志物。如前所述,一些微生物代谢产物与结直肠癌相关,使代谢组成为生物标志物发现的丰富库。多项研究发现,结直肠癌患者和粪便健康对照组的SCFAs和胆汁酸水平存在差异,包括结直肠癌患者的乙酸盐升高和丙酸盐、熊去氧胆酸降低。这些代谢物可以作为结直肠癌筛查的“指纹”。然而,由于在这些研究中的个体数量很少(21~46人)、样品准备和分析技术不同,很难在研究之间做出可靠的比较。需要进行更大规模的研究和不同的技术(包括核磁共振、液相色谱或气相色谱质谱或选择性离子流动管质谱),以评估代谢组分析在临床环境中对结直肠癌筛查的作用。

3.4 检测粪便中特殊细菌的变化可以发现早期直肠癌

在大多数散发性结直肠癌病例中,肿瘤发生是一个包括基因组和形态学共同改变在内的多步骤过程,主要包括息肉样腺瘤和黏膜内癌的形成发展和逐渐恶化。并且越来越多的证据表明,人类肠道菌群与结直肠癌的发生有关。因此,全面的宏基因组学合并代谢组学分析可能为通过肠道环境变化了解结直肠癌发展提供了一种替代方法。某研究在医院接受全结肠镜检查的受试者中进行,排除有遗传性或疑似遗传性疾病(如家族性腺瘤性息肉病、遗传性非息肉病性大肠癌、微卫星不稳定性高)、炎症性肠病、腹部手术史、粪便样本不足以收集数据的病例。根据受试者结肠镜和组织学结果分为9组:①正常(结肠镜检查无明显发现);②少量息肉[最多2个小息肉(<5mm)];③多发性息肉样腺瘤伴低度发育不良(MP);④黏膜内癌(息肉样腺瘤伴高度发育不良),0期/pTis结直肠癌(S0期);⑤结直肠癌I期;⑥结直肠癌II期;⑦结直肠癌III期;⑧结直肠癌IV期;⑨正常,有结直肠手术史(HS)。组①和②合并为健康对照组,结直肠癌I-II期分别合并为SI/II和SIII/IV,共分为6组(健康对照、MP、S0、SI/II、SIII/IV和HS)进行分析。受试者在医院口服肠清剂后立即收集粪便样本并将其冷冻在干冰上。采用鸟枪法为基础的宏基因组学方法和毛细管电泳飞行时间质谱(CE-TOFMS)为基础的代谢组学方法对粪便样本进行研究。研究共获得616份宏基因组学数据和406份代谢组学数据。结果显示,除更严重的结直肠癌病变外,多发性息肉样腺瘤和黏膜内癌病例的微生物组和代谢组变化也很明显。研究发现了两种截然不同的菌群升高模式。第一种,从黏膜内癌至更严重阶段,Fusobacterium nucleatum spp.的相对丰度持续升高(P<0.05)。第二种,只在多发性息肉样腺瘤和(或)黏膜内癌中,Atopobium parvulum和Actinomyces odontolyticus的相对丰度显著增加(P<0.05)。代谢组学分析显示,支链氨基酸苯丙氨酸在黏膜内癌中显著升高(P<0.05),而包括脱氧胆酸在内的胆汁酸在多发性息肉样腺瘤和(或)黏膜内癌中显著升高(P<0.05)。本研究还确定了区分黏膜内癌和健康对照的宏基因组学和代谢组学标记物。本研究人群大且数据多样,并且发现了结直肠癌发展早期阶段的微生物组和代谢组变化,这可能对结直肠癌的病因研究和诊断研究具有重要意义。

616份宏基因组学数据和406份代谢组学数据的概况如图所示。富含Bacteroides属的受试者Prevotella属的丰度较低。值得注意的是,616例受试者中有118例(19.2%)的肠道菌群中发现Megamonas属非常丰富(属于10个最丰富的属),但在剩余受试者肠道中Megamonas属很少检出,提示这是为一种不寻常的人群分布。在过去欧美研究中未曾报道过Megamonas为肠道菌群的优势属,但在中国人群研究中被发现为优势属,这表明该属可能是亚洲人群的特征菌。主成分分析(PCA)在所有受试者和251名健康对照者中均发现了两个最易变的类,被定义为人类肠型的主要贡献者的Bacteroides和Prevotella。年龄分布存在差异(P=7.80×10-10),且Prevotella群以男性居多(79.1%)(P=6.82×10-8)。丙酸盐和丁酸盐作为结肠细胞的主要能量来源,是两种含量最丰富的代谢物。PCA显示,除丙酸盐和丁酸盐外,人群中二氢尿嘧啶和尿素含量也有较大的变化(图3-1-3b)。

图3-1-3 粪便样品的宏基因组学和代谢组学总体特征

注:a.616例受试者的30个最高丰度细菌属相对丰度(上)和人类基因组比例(中间)[健康对照(n=251),MP(n=67),S0(n=73),SI/II(n=111),SIII/IV(n=74),HS(n=40)]。406例受试者的代谢物百分比(下)[健康对照(n=149),MP(n=45),S0(n=30),SI/II(n=80),SIII/IV(n=68),HS(n=34)]。b.细菌属(n=616,左)和代谢物(n=406,右)的PCA图。PC,主成分。(www.chuimin.cn)

与健康对照组相比,本研究发现不止SI/II和SIII/IV组,MP和S0组的菌群变化也非常明显。在S0、SI/II和SIII/IV样品中,Firmicutes,Fusobacteria和Bacteroidetes门的许多菌种均显著增加,且增加程度随着恶性程度的加深而加大。

Fusobacteria门的增加菌种出现在至少两个阶段中,而许多来自Firmicutes和Bacteroidetes门的许多菌种都是阶段特异的。大量Proteobacteria门的菌种仅在MP中升高(图3-1-3a),Bifidobacterium属主要在S0中降低。注意到两种显著的菌种升高模式(P<0.05):第一种是从早期到后期阶段均升高,而第二种仅在早期阶段升高。前者主要有F.nucleatum,例如F.nucleatum spp.,nucleatum,Solobacteriummoorei,Peptostrepto coccusstomatis,Peptostrepto coccusanaerobius,Lactobacillus sanfranciscensis,Parvimonasmicra和Gemellamorbillorum。后者主要有Atopobiumparvulum,Actinomycesodontolyticus,Desulfovibriolongreachensis和Phascolarcto bacterium succinatutens。

此外,本研究还发现了与结直肠癌相关的新菌种,Olinsella aerofaciens,Dorealongicatena,Porphyromonas uenonis,Selenomonas sputigena和Streptococcus anginosus在SIII/IV组中显著升高。与过去研究一致,两种丁酸盐生产菌Lachnospira multipara和Eubacteriume ligens在结直肠癌阶段均显著减少。而硫化物生产菌则显著升高,包括Desulfovibrio vietnamensis,D.longreachensis和Bilophila wadsworthia。

胆汁酸、短链脂肪酸、氨基酸和中心碳代谢元素与肠道微生物关系密切而成为人们关注的重点(图3-1-4)。与健康对照组相比,该研究发现MP中的脱氧胆酸盐(DCA)(P=0.000118,q=0.0503),S0中的甘胆酸盐(P=0.00100,q=0.0508)和牛磺胆酸盐(P=0.00195,q=0.0655)浓度显著升高。此外,支链氨基酸含量(异亮氨酸、亮氨酸、缬氨酸)及苯基丙氨酸、酪氨酸、甘氨酸和丝氨酸水平均显著升高。亮氨酸经细菌发酵产生的支链脂肪酸——异戊酸盐从S0到SIII/IV逐渐增加。

由于DCA在MP中显著升高,该研究试图寻找可能与这种代谢物相关的细菌。B.wadsworthia是MP中唯一与DCA显著相关的细菌(图3-1-4d),二者的相关系数在其他阶段虽为正但无统计学意义。研究证明B.wadsworthia可以生长在含有牛磺胆酸盐的培养基中,而牛磺胆酸盐是DCA前体——胆酸盐的共轭形式。考虑到A.parvulum在MP和S0中显著升高,并被报道通过与炎症性肠病患者 Streptococcus的高度共现关系构成一个产生H2S的细菌网络中枢,本研究试图检测该细菌与其他菌种丰度之间的相关性。在S0组的属和种水平上,与A.topobium相关的细菌数量均显著增加(图3-1-4e)。A.parvulum和A.odontolyticus,S.anginosus,S.moorei和G.morbillorum具有很强的相关性,其相对丰度在S0和/或后面的阶段显著增加。A.topobium在结直肠癌早期的增加表明它可能对产生H2S的细菌群落有很强的影响。

与健康对照相比,1243个KEGG的直系同源基因(KO基因)在至少一个阶段中出现显著升高(P<0.05),96个出现显著降低(P<0.05)。从S0组开始,粪便中氨基酸浓度就有了明显变化,因此,本研究检测微生物基因丰度以探究微生物在氨基酸代谢中的作用。

基因丰度的变化按代谢通路展示(图3-1-4)。在丰度差异最大的通路中,本研究发现芳香氨基酸代谢和产生硫化物的通路与结直肠癌有关。苯丙氨酸和酪氨酸生物合成相关基因显著升高,其中以pheC(S0,P=1.94×10-5,q=0.0297)作为区分S0与健康对照的最高评分指标。在分解代谢通路中,参与苯丙氨酸降解产生有毒的苯乙酸盐的基因主要在MP升高。参与色氨酸生物合成的基因在SIII/IV中显著减少(P<0.05)。异化硫酸盐还原酶亚单位A(dsrA)主要负责产生具有基因毒性的硫化氢,而本研究发现dsrA在SIII/IV中显著升高(P=0.00499,q=0.0729)。过去研究发现dsrA在许多硫酸盐还原细菌中具有活性,例如Desulfovibrio spp.,而本研究发现Desulfovibrio piger在SIII/IV中显著升高(P=0.0178,q=0.226)。

图3-1-4 癌症进展不同阶段的特异性菌群和代谢组特征

注:a、b.与健康对照组(n=251)相比,4个阶段的[MP(n=67)、S0(n=73)、SI/II(n=111)和SIII/IV(n=74)]的细菌丰度显著升高或减少(P<0.05;单侧Mann-WhitneyU检验)。c、d.与健康对照相比,在4个阶段中显著增加或减少的细菌门分布。与健康对照组相比,对4个阶段中每一阶段显著升高或减少的每一个(Proteobacteria,Bacteroidetes,Fusobacteria,Firmicute和Actinobacteria)中的菌种数量分别进行计数。在所有阶段数量变化非常小的,表明普遍存在的,为绿色;大多数菌种都表现为一个特定阶段的改变的为红色或多个特定阶段的改变的为蓝色)。f.系统发育树展示了361个来自Proteobacteria,Bacteroidetes,Fusobacteria,Firmicute和Actinobacteria门的不同丰度的菌种。外圈表示菌种显著升高(橙色)或减少(绿色)。异常升高菌种用红色标记(FDA校正P<0.1,单侧Mann-WhitneyU检验)。最内圈显示了各菌种的所有样本相对丰度合计的平均值,其中平均相对丰度低于1×10-6 的菌种被排除。箱式图展示了与健康对照组(蓝色圆圈)相比有显著变化(P<0.05)的其他研究报道的癌症相关菌种(绿色圆圈)、丁酸盐生产者(黄色圆圈)、硫化氢生产者(粉色圆圈)或4个宏基因组流程中均新发现的癌症相关物种的相对丰度。每个箱型图的y轴表示相对丰度。每个箱形图中从左到右分别为健康对照、MP、S0、SI/II和SIII/IV。c.与健康对照组(n=149)比较,四个阶段[MP(n=45)、S0(n=30)、SI/II(n=80)和SIII/IV(n=68)]的粪便胆汁酸、支链脂肪酸(branched-chainfattyacid,BCFA)和氨基酸浓度明显升高或降低(P<0.05,单侧Mann-WhitneyU检验)。BCAA,branched-chainaminoacids支链氨基酸;AAA,aromaticaminoacids芳香氨基酸。d.B.wadsworthia与DCA的关系。MP组B.wadsworthia与DCA的相关系数最高(CC=0.63,P=1.50×10-5,采用渐近t近似计算)。e.A.parvulum的属网络分析。在健康对照组(n=251)、MP(n=67)、S0(n=73)、SI/II(n=111)和 SIII/IV(n=74)中分别构建属相关网络。总共使用了丰度>1×10-4、至少与其中一个阶段的Spearman相关系数>0.4的2个属。节点大小与属的丰度成正比,线段宽度与相关强度成正比。f.各组中与A.parvulum相关的菌种相关系数。展示了丰度>1×10-5和Spearman相关系数>0.5的菌种。红色表示的物种已在b中展示。显著变化(升高或降低)如下表示:+++表示升高P<0.01;++表示升高P<0.01;+表示升高P<0.05;-表示降低P<0.05;--降低P<0.01。25%~75%置信区间用方框表示,黑线表示中位数,延伸线表示1.5×四分位。

大多数S0病变可以通过内窥镜方法治愈,并且存在很长的窗口期可以被及时检测发现。为了探讨肠道宏基因组和代谢组参数作为诊断标志物的潜力,本研究分别构建了随机森林分类器和LASSO logistic回归分类器对健康对照和S0、SIII/IV期病例进行判别。共构建了4种模型,分别为仅菌种、仅KO基因、仅代谢物数和三者结合。比较4种模型的分类潜力发现,组合模型在S0和SIII/IV分类上都优于单个模型。随机森林分类判别S0和SIII/IV结直肠癌患者的ROC曲线下的面积(AUC)分别为0.78和0.85。

S0分类中,首要特征主要是KO基因,包括编码环己二烯脱水酶的pheC。其他特征包括D.longreachensis、S.moorei、亮氨酸、缬氨酸、苯丙氨酸和琥珀酸,这些特征的分布被检测到存在差异(图3-1-5)。SIII/IV分类的首要特征是口腔厌氧菌,例如已经被鉴定为结直肠癌s的标志细菌的P.micra,P.stomatis,F.nucleatum和P.anaerobius。

图3-1-5 结直肠癌患者(SI/II和SIII/IV)的手术治疗前和术后1年左右的宏基因组数据

本研究数据包括了28例结直肠癌患者(SI/II和SIII/IV)的手术治疗前和术后1年左右的宏基因组数据。在图3-1-5中所示的22个菌种中,患者切除肿瘤P.stomatis,P.anaerobius,P.micra,P.uenonis和D.longicatena的相对丰度显著降低。与HS组粪便样本进行比较上述5个细菌的含量没有发现显著差异。