首页 理论教育传染病流行病学研究内容简介

传染病流行病学研究内容简介

【摘要】:传染病的发生是病原体与宿主之间交互作用的结果。传染病分子流行病学的研究内容主要包括病原体特征分析和宿主基因易感性分析。若某种方法有较高的分辨力和重复性,但只有50%~60%的菌株可以分型,其在传染病流行病学研究中的实用性就大打折扣。表型分型在传染病流行病学调查中具有重要的作用,但表型分型易受检测条件传代次数和环境压力等因素的影响,不如基因型特征稳定。

传染病的发生是病原体与宿主之间交互作用的结果。这种相互作用表现在细胞水平、个体水平及群体水平,且不断变化,从而直接或间接地影响宿主感染病原体的趋势和结局。传染病分子流行病学的研究内容主要包括病原体特征分析和宿主基因易感性分析。

1 病原体特征分析

病原体在宿主体内其结构和生物学性质等会不断发生适应性变化。分析病原体特征除了可了解病原体本身的生物学特性外,还有助于了解其在宿主体内的变化和作用。病原体特征分析的关键是选择合适的测量指标,这些测量指标必须是客观的、稳定的和有代表性的,可检测并且容易检测的。恰当的病原体分型方法在传染病调查过程中已必不可少。而且方法选择不当轻则增加调查成本,重则导致错误结论。可以说,病原体分型方法的正确选择是研究成功的关键甚至是决定因素。

1.1 分型方法的选择标准

分型方法的选择应结合实验室条件,选用简便、快速、成熟、可靠的并且得到公认的测定方法。对于新的测定方法,应注意所得结果与其他方法所得结果的可比性。选择分型方法主要应考虑以下几个方面。

(1)分辨力

分辨力是指可以精确区分同一种群中不同菌株的能力。但在实际应用中,几乎没有一个分型系统能将细菌的种分成一致的型别,因为尚未对其生态型的分布与医院内感染暴发型别进行系统研究。用两种分型方法以阶梯方式分析同种不同株,可获得最大的分辨力。一种方法用于定义出基本群,而另一种方法作为二级方法用于将基本群进一步分类成不同型别。基因分型方法具有较高的分辨力。

(2)重复性

重复性是指在相同测量条件下,对同一被测量对象进行连续多次测量所得结果之间的一致性。分型方法应具有较好的重复性。影响方法稳定性的因素包括测量环境、培养基、培养时间、温度和接种量等。我们能精确地控制培养条件所致的各种变异,但对分型标志表达的准确控制却无能为力。也就是说,要想获得一种重复性好的分型方法,必须对该方法的各环节加以标准化。血清学分型方法的重复性要比噬菌体分型和细菌素分型法的重复性好。

(3)分型性

一个良好的分型系统应将大多数菌株归入已定义的群组中。在选择分型方法时,分型性是需要考虑的一个重要方面。若某种方法有较高的分辨力和重复性,但只有50%~60%的菌株可以分型,其在传染病流行病学研究中的实用性就大打折扣。增加病原体分型性需要不断增加菌株的型别,但这往往不能有效地增加分辨力,因为所增加的型别很可能是菌株变异的结果。

(4)简便性

实用的分型方法应该是操作简便的,这样才能被广大流行病学工作者及临床实验室所接受。玻片凝集和其他简便的血清学试验比相对复杂的ELISA和核糖分型在实际工作中应用广泛。而操作复杂的技术更适合在专业实验室中使用。到目前为止,尚无任何一种方法在各方面都能极好地满足要求。

1.2 常用的分型方法

(1)表型分型

表型(phenotype)是指具有特定基因型的个体在一定环境条件下所表现出来的性状特征的总和,包括在细胞、器官和整体水平上可检测和观察的特征。表型分析方法主要包括生物型、抗生素的敏感型、噬菌体分型、血清学分型、聚丙烯酰胺凝胶电泳(PAGE)/免疫印迹、多位点电泳等。表型分型在传染病流行病学调查中具有重要的作用,但表型分型易受检测条件传代次数和环境压力等因素的影响,不如基因型特征稳定。此外,表型分析提供的信息往往较少,不足以在菌株间进行区分。目前主要采用基因分型的方法鉴定病原微生物

(2)基因分型

近十多年来,基因分型方法发展迅猛。早期的基因分型方法主要包括核糖体分型、质粒图谱分析、随机扩增多态性DNA(random amplified polymorphic DNA,RAPD)或随机引物PCR(arbitrary primer polymerase chain reaction,AP-PCR)、脉冲场凝胶电泳(PFGE)等方法,后来发展出限制性片段长度多态性(RFLP)、扩增片段长度多态性(AFLP)、多位点序列分析(MLST)、可变数目串联重复序列(VNTR)分析及多位点可变数目串联重复序列(MLVA)分析等方法。单核苷酸多态性(SNP)分型是目前最为广泛采用的分型方法,具有分辨力高、准确可靠、重复性好、简便可行且经济高效等特点。TaqMan MGB探针法是SNP分型的金标准。这些技术已成为细菌分型的有力工具,在了解病原体的流行病学特征,追查微生物的传染源、传播途径等方面均有重要意义。通过基因分型不仅可以了解微生物的遗传背景,还可以在基因水平上了解其致病机制。

(3)脂肪酸分析

脂肪酸分析技术是指通过皂化、甲基化、萃取和碱洗涤等步骤,将样品中的脂肪酸转化为脂肪酸甲酯,并结合灵敏的气相色谱分析,得到样品中微生物群落结构组成多样性、比例及微生物生物量等方面的信息。脂肪酸与细菌的遗传变异、毒力、耐药性等有极为密切的关系,利用气相色谱分析细菌中的脂肪酸已成为一个相当成熟的微生物化学分析手段。利用脂肪酸鉴定细菌的适用范围很广,几乎可用于所有可培养的细菌,借助参考菌株的数据库,可以实现对菌株的追踪,完成分型工作,如医院感染源的确定、发酵工业生产中污染来源的确定等。

(4)蛋白质分析

细菌基因组可编码几千个蛋白质分子,种类较多且相对分子质量覆盖范围广。以其中某一种蛋白质的特异性来鉴定某种细菌几乎是不可能的。可行的办法是根据蛋白质的多样性和丰富性,利用菌体内的多个蛋白质质量信息的分析方法极有希望成为鉴定细菌更为有效的手段。常用的蛋白质分析技术有凝胶电泳、蛋白质转印杂交、色谱分析、质谱分析、蛋白质测序等。

(5)稳定放射性核素分析

放射性核素是指不稳定的原子核能自发地放出射线(如α射线、β射线等),通过衰变形成稳定的核素。病原微生物的生物分子结合环境中稳定的放射性核素,根据放射性核素比例可得到微生物与环境起源的关系。采用此方法可测定放射性核素在培养用的营养物质、水与培养的细胞或芽孢之间的基本关系。据Helen报道,枯草芽孢杆菌的细胞和芽孢与培养基的水中氧和氢的稳定放射性核素比例呈线性相关,认为稳定放射性核素分析可用于追踪地域性相关微生物产物,是法医学中分子技术方法的补充。

(6)基因组分析

传染病暴发时,微生物菌株来源的鉴定主要依靠基因组序列的比较。一般情况下,通过基因组分析,大多数生物病原体都能被准确地鉴定。某些生物病原体的变异速度快,追踪其来源非常困难,但全基因组分析仍然适用。根据微生物基因组分析提供的进化信息,可了解其培养的过程、流行病学动态及传染病发生的时间,缩小来源追踪的范围,提高对其种群动态和系统发生来源的认识,有助于来源的鉴定。只有广泛收集大量菌株的DNA序列,制订基因组研究计划,发展新技术,提高测序能力,才能更好地发挥基因组分析的作用。

病原微生物全基因组测序不断应用于流行病学研究中,基因组流行病学(genomic epidemiology)应运而生,成为一个新的研究领域。基因组流行病学是在碱基序列的基础上进行流行病学分析,使得分型的分辨率有了极大的提高,能帮助我们快速地确认并追踪病原体,也能够检测出实验室难以培养的微生物或新出现的病原体,帮助解决传统流行病学无法阐明的科学问题。国内外很多研究显示,近几年基因组流行病学在多次重大传染病疫情的调查、防控中都发挥了极其重要的作用。比较基因组学也是基因组流行病学中的重要研究方法。通过基因组的比较能发现病原体重要基因的突变、插入或者缺失,并且确定病原体相互之间的关系。把基因组学、转录组学和蛋白质组学有机地结合起来,从多组学角度开展传染病分子流行病学研究是目前的趋势。

(7)生物芯片技术

生物芯片技术是通过缩微技术,根据分子间特异性地相互作用的原理,将生命科学领域中不连续的分析过程集成于硅芯片或玻璃芯片表面的微型生物化学分析系统。利用该技术可以实现对细胞、蛋白质、基因及其他生物组分的准确、快速、大信息量的检测。生物微细差别的存在要求发展灵敏的技术来检测和鉴定微生物。生物芯片技术可能较容易完成这项艰巨任务。采用基因芯片可以检测细菌、病毒、支原体、衣原体、立克次体等微生物,蛋白质芯片可用于检测各种蛋白毒素类、不同生长条件下的基因表达、DNA序列中的特异性突变和环境中的微生物特性。生物芯片实质上是微型化的生化分析仪器。它针对DNA、RNA、蛋白质及其他生物分子,能完成对生物分子、细胞组织的高通量检测分析。近年来发展了不同形式的芯片,应用于复杂环境中的细菌检测和微生物群落分析。生物芯片技术的局限性主要表现在应用芯片技术检测和鉴定微生物时,要求探针的灵敏度高,含有微生物关键的遗传组成(如毒素、毒力因子、抗生素耐药性标志物)以及足够量的病原体DNA,而且实验必须有效。

(8)高通量测序技术

高通量测序技术(high-throughput sequencing)又称“下一代”测序技术(“next-generation”sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。Illumina公司的新一代测序仪Hiseq 2000和Hiseq 2500具有高准确性、高通量、高灵敏度和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学(基因表达及调控、基因功能、蛋白/核酸相互作用)研究,是目前最常用的测序技术。该测序技术推进了科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如,在基因组水平上对还没有参考序列的物种进行从头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(re-sequencing),在全基因组水平上扫描并检测突变位点,发现产生个体差异的分子基础。

(9)生物信息学技术

生物信息学(bioinformatics)是研究生物信息的采集、处理、存储、传播、分析和解释等各方面的学科,也是生命科学和计算机科学相结合形成的一门新学科。微生物法医学在生物犯罪的调查研究中,利用数据库和采集到的信息和数据,能完成基因组序列的分析和比较、新基因和新SNP的发现和鉴定、遗传密码起源和生物进化的研究等。利用生物信息学可加快分析鉴定微生物的速度,在生物犯罪的调查中起综合的信息处理作用。

在进行病原体特征分析中,应用先进的分子生物学技术往往会收到事半功倍的效果,有时也必不可少。比如2001年发生在美国的炭疽芽孢杆菌恐怖事件,是一起从2001年9月18日开始为期数周的生物恐怖袭击,在该事件确定菌株来源的调查中就应用了生物信息学技术。从受害者身体上分离出的菌株经过基因组测序,通过可变数目串联重复分析技术(variable number of tan dem repeats,VNTR)对事件中的炭疽芽孢杆菌进行了分型,发现炭疽芽孢杆菌具有高度的基因单态性,表现在不同的分离株99%以上的核苷酸序列一致,从而确定了所用菌株来源为安姆斯(Ames)菌株。对不同地点发生的“白色粉末”分型结果显示,它们的来源相同。具体地说,这些菌株都是来自1981年得克萨斯州的一头死牛身上的分离株。这些菌株当时被命名为Ames株,随后被送往美国陆军医学研究所,在那里被用于美国防御性生物武器计划,同时也被提供给美国和欧洲的其他研究实验室。之后,该菌株被送往英国,在那里被去除毒力质粒pXO1和pXO2,这两个特别处理的基因组DNA被送往TIGR中心。在1998年加利福尼亚大学伯克利分校的一个实验室精制出第一菌株,命名为波顿唐1(Porton 1)。2001年在英国波顿唐,从原冻存菌株中取出另一菌株精制处理,命名为Porton 2。根据以上流行病学调查,再加上相应的VNTR分型分析,可以得出所用的菌株来自美国军方菌株的结论。

病原体的分型技术常在如下情况使用:生物恐怖病原的分型、共同来源的传染病暴发、患者间的传播、散发感染高危人群的常规监测、抗生素治疗失败和毒力型的鉴定。在某些情况下,如果导致院内感染暴发的菌株具有一种未使用的抗生素抗性标志或者在常规实验中表现出明显不同的生化特征,则不必对其进行分型。

2 宿主基因易感性分析

2.1 宿主基因易感性的概念

宿主易感标志是指在暴露因素作用下,宿主对疾病发生、发展易感程度的生物标志。遗传与非遗传因素(如年龄、性别、体力活动、吸烟及饮食等)都有可能影响宿主对疾病的易感性。基因易感性研究是指应用流行病学的基本原理和方法,结合分子生物学技术,探讨相应的生物学标志物对疾病的影响。目前,疾病易感性研究主要关注遗传易感性,即个体遗传背景差异所导致的不同个体对同一疾病易感程度的强弱。人群对传染病易感性的高低主要来自两个方面:①特异性免疫水平:常用血清学生物标志进行评判,如血清中特异性抗体的有无或其水平;②病原体致病的遗传易感性水平:可用基因组变异进行评判。宿主易感性的高低在疾病发生、发展和预后判断中具有重要意义。

全基因组关联研究发现,不仅许多慢性非传染性疾病存在易感基因,而且许多传染病也存在易感基因。大部分传染性疾病,如水痘、带状疱疹、感冒疮、乙肝、结核等的易感性与HLA区域基因(MICA、HLA-A、HLA-DRA、HLA-DQA)有关。黄种人对乙型肝炎病毒比白种人、黑种人普遍易感,表现为易感染、感染后潜伏期短、发病进展快等。针对结核病的分子流行病学研究中进行的宿主基因易感性分析发现,自然抗性相关巨噬细胞蛋白1(NRAMP1)基因及甘露糖结合凝集素(MBL)基因与汉族人群中肺结核发生的易感性显著相关,而MBL基因的HL和LL基因型则与肺结核的保护作用显著相关。

2.2 研究设计

在进行宿主基因易感性分析时,合理、有效的研究设计至关重要。因此,在进行研究设计时,应按照传统流行病学研究设计的一般要求,有明确的研究目的,选择有代表性及一定数量的样本,并注意掌握各种对照组的设置、对照组和实验组的可比性、方法的准确性、合适的资料统计分析方法、偏倚的控制等这些最基本的要点。如果脱离了这些要点,即使在研究中使用了先进的实验室技术,也得不到准确的研究结果。

(1)研究方法的选择

一般来说,流行病学描述性、分析性、实验性(干预)研究方法都可以引入分子生物学理论和技术进行分子流行病学研究,都可以用于传染病分子流行病学研究。因此,在进行宿主基因易感性研究时,可根据实际情况选择适当的流行病学方法。但由于宿主基因易感性研究在标本采集上受到某些限制,并在研究指标的测量上要求客观准确,检测方法比较复杂,需要一定的实验条件等,因而不适宜做大规模现场调查研究,多进行病例对照研究及巢式病例对照研究等。

病例对照研究是以确诊的患有某特定疾病的病人作为病例组,以不患有该病但具有可比性的个体作为对照组,通过询问、实验室检查等搜集研究对象既往可能的危险因素暴露史,测量并比较病例组和对照组中各因素的暴露比例,评价暴露因素与疾病之间的统计学关联。在评估各种偏倚对研究结果的影响后,借助病因推断技术,推断出某个或某些暴露因素是疾病的危险因素,从而达到探索和检验疾病病因假说的目的。分子流行病学病例对照研究是通过比较病例组与对照组中生物标志物水平或频率的差异来判断其在疾病发生发展中的作用,既可以用于研究生物标志物与疾病危险性的关系,也可以用于研究可能的基因-环境交互作用。

巢式病例对照研究是基于大样本人群队列的病例对照研究。选择一个队列,收集基线资料,采集所需研究生物学标志的组织或体液标本储存备用,然后随访到出现能满足病例对照研究样本量的病例数为止。把这些病例作为病例组,按配比条件,从同一队列中选择一个或数个非病例作为对照,抽出病例与对照的基线资料并检测收集的标本,进行病例对照研究。由于基线调查时就已经收集暴露信息并采集了生物样本,可以避免选择偏倚和信息偏倚,使得研究对象具有代表性和可比性,非常适合分子流行病学研究。

(2)生物标本的选择

分子生物学需要从生物标本这个载体中获取信息,标本来源一般包括病原标本和宿主的生物标本。在确定易感人群时,通常选择免疫学指标和易感基因作为易感标志物进行测定。一般选择抗体水平作为传染病易感性指标,而易感基因及其表达产物的选择则应根据疾病不同阶段而区别对待。测量的标本应符合以下一般原则:①生物标本应特异、稳定;②标本采集、储存方便;③所有生物标本都应有详细的背景材料和鉴别标志。宿主易感性研究常用的生物标本有血液标本(血清、血浆、白细胞、红细胞、外周血单个核细胞等)、组织标本、其他生物标本(如唾液、胃液、尿液、精液、头发和媒介生物等)。生物标本的采集和保存需要保证标本内各种生物分子、细胞结构等不被破坏。生物标本的保存方法视标本性质而定,通常保存在低温冰箱中,短期保存在-20℃条件下,长期保存在-80℃条件下。

(3)常用的分子生物学技术

大多数分子生物学技术都可用于宿主基因易感性研究。常用的有以下几种:

①核酸技术。常用的核酸技术包括核酸电泳图谱分析、核酸酶切电泳图谱分析、核酸分子杂交技术、核酸序列分析等。采用这些技术可以发现单个生物体在DNA水平的特征性条带谱型,从而鉴定出其对某种疾病的基因易感性水平。上述基因分型技术、芯片技术和高通量测序技术都用于宿主易感性研究。而核酸的研究范围也在不断扩大,目前研究的核酸主要包括DNA、RNA(包括编码基因和非编码基因),同时也包括表观遗传因素以及外泌体中核酸分子的检测等。

②蛋白质技术。只要有蛋白质存在,就有基因存在,蛋白质是基因表达的产物,几乎所有生物体都具有蛋白质,包括结构蛋白和功能蛋白。对蛋白质进行研究分析,实际上是间接地对其相对应的基因进行分析,因为蛋白质的氨基酸顺序是由相对应的核苷酸顺序决定的,因此蛋白质分析也具有特异性。蛋白质分离鉴定技术主要有离心、凝胶电泳、蛋白质转印杂交、色谱分析、蛋白质测序等。

③酶学技术。蛋白酶的分离鉴定技术与蛋白质相似,但需要一定的条件(如温度4℃~6℃、特定缓冲液等)。蛋白酶既可进行定性检测,也可进行定量测定。酶经过凝胶电泳分离再进行特异染色可以鉴定其相对分子质量,并进行不同生物体的比较,如近年来分子流行病学中应用的多位点酶电泳法。

④其他技术。分子流行病学应用的实验室技术很多,除了上述技术外,还有各种色谱技术、毛细管电泳技术、其他理化分析等实验室技术,均可用于宿主易感性分析研究。

(4)遗传标记的选择

人类基因组中频率大于1%的SNP至少有1 000万个,平均290 bp间隔就有一个SNP。如果对基因组中所有的SNP进行基因分型是不现实的。理论上应该选择那些影响到蛋白功能和表达的多态位点,因为这些位点更有可能影响疾病的发生。然而在大多数情况下,多态位点功能的证据很难获得。目前可以根据基因变异的位置和类型来选择最优的多态位点。错义突变可以改变蛋白质的氨基酸序列,无义突变可以引起编码的终止,这些类型的突变可以解释目前大多数已知疾病的发生,因此应该作为基因分型的首选。启动子区的多态位点也十分重要,它们有可能影响基因的表达。然而仅仅依靠DNA序列的位置很难预测一个启动子区多态位点的真实功能。如果多态位点出现在一段基因启动子区高度保守的序列,那么这个多态位点很有可能影响到基因的功能,因此这一类型的变异也应作为研究的重点。如果可能的话,可以通过基因转染实验来证实启动子区多态的功能,当然这需要花费时间和一定的实验技术设备。一般而言,同义突变与疾病关联的可能性较小,因此相对于错义突变和启动子突变,它不作为优先考虑的对象。但是同义突变可能会影响到mRNA的稳定性,所以比内含子SNP相对重要一些。还有一种类型的突变是影响mRNA变位剪切的位点,这些位点一般位于内含子和外显子交界处大约10 bp区域,这一区域的序列相对保守。如果这一区域有多态位点,那么应作为研究的重点。

除了考虑多态位点的功能以外,多态位点在人群中的频率也是考虑的重要因素。多态位点的频率会影响到关联研究的检验效能。频率非常低的SNP需要有较大的相对危险度才能够检验出显著性的关联,然而相对危险度高的多态位点可能已经通过连锁分析被筛查得到,因此考虑到研究样本量的大小,一般选择频率大于5%的多态位点进行研究。通过SNP的位置和功能预测选择SNP后,最好进行预实验确定其在研究人群中的频率,这对于进一步的实验十分重要。

基因组中的SNP不是相互独立的,所以另外一种选择SNP的策略是根据多态位点在研究人群中的连锁不平衡状态来选择标签SNP。选择恰当的标签SNP可以保留全部或者大部分SNP的信息,可以在关联分析中节省基因分型的费用。标签的概念是由Johnson首先提出来的,他们用单体型信息解释量来选择标签SNP,此后,逐步发展了许多不同的方法和算法。这些选择SNP的方法主要有以下几个方面的差别:①遗传信息的来源:单体型或者基因型;②评价SNP选择标准的不同:单体型变异、单体型R2、pair-wise r2、熵等其他标准;③算法的差异。如何选择和应用这些SNP选择方法,需要首先理解这些方法的应用原理和选择标准的差异。

(5)资料的处理和分析

①传统流行病学常用分析指标如疾病的发病率、暴露率、比值比和危险度估计等,都可以应用到传染病分子流行病学研究中。而有些指标(如生物标志的发生率、检出率等)的含义可能有些变化,应根据实际情况和惯例进行相应调整。与传统流行病学数据分析不同的是,现代分子流行病学设计许多新型的生物学数据,包括基因分型、基因组芯片、表达谱芯片、DNA和RNA测序、表观遗传芯片和测序产生的数据。这使得在分子流行病学资料处理和分析中涉及了更多的数据整理、质控、格式转换、变量(基因)筛选、多重检验问题以及结果的呈现形式(作图)等,还包括必不可少的生物信息学分析。因此分子流行病学与传统流行病学资料分析的本质一致,但是有着明显的不同。

②采用遗传关联分析进行宿主基因易感性分析中,种族遗传关系对传染病的发生不可忽视。遗传多态性在不同种族间存在异质性,多态性的频率以及多态性之间的连锁不平衡都有差别。例如在结核病的研究中,对伦敦西北区3所医院的调查发现,非洲裔黑人病例比白种人多3倍,而性别、出生地、过去治疗史都无统计学差异,表明在特定区域内,结核病在种族间存在差异。一个人群中检测到的遗传关联在另一人群中并不一定存在,比如一种极端情况(其实非常常见)是一个人群中的关联多态位点在另一个人群中是单态,即频率为0,因此在另一人群中不可能存在遗传关联。

(6)全基因组关联研究

候选基因的关联研究是基于已有的生物学知识得到基因功能与疾病相关,或由连锁分析得到与疾病显著相关的染色体区段。然而,这种方法只能检测很少的基因,而且当疾病基本生理学特征尚不明了时,候选基因策略就很难适用,这些不足限制了在基因组更大的范围内进行疾病的关联分析。随着对人类基因组计划和人类基因组单体型图计划(HapMap)的完成以及高通量SNPs检测芯片的问世,全基因组关联研究方法被广泛应用于多种复杂疾病和性状的遗传学研究中,并取得了一系列研究成果。

全基因组关联研究利用关联研究的方法在人类全基因组范围内发现疾病的易感基因。就其方法本身而言,并不是新的方法,只是关联研究方法的扩展。该方法不需要假设与疾病相关的基因,也不需要假设致病基因的基因组位置,因此是一种客观有效的方法。新的基因芯片技术可以在较短的时间内检测高达数十万到数百万个SNPs信息。近年来,世界范围内传染病全基因组关联研究发展迅速,发现了一系列疾病的相关基因或变异。2017年发表在Nature Communication杂志的大规模全基因组关联研究Meta分析表明,大部分传染性疾病,如水痘、带状疱疹、感冒疮、乙肝、结核等的易感性与HLA区域基因(MICA、HLA-A、HLADRA、HLA-DQA)有关。该研究还发现了其他一些与18种常见传染病相关的易感基因位点。

(7)实验中的质量控制

①实验室管理。传染病分子流行病学研究的大部分重要工作都在实验室完成,分子流行病学中使用的实验室技术也相当广泛,因为只要检测与致病因子及致病机制中相关的生化、生理、免疫、分子、遗传等的生物学标志的技术均可被应用于分子流行病学研究。因此,研究过程中必须严格执行实验室操作规范:实验试剂、材料和样本都要按照要求妥善保存;同一指标最好使用同一批次的试剂材料,不同批次试剂的使用中要注意进行对比分析和标准化;一项研究中,同一种生物标志的测量方法要统一;每一步骤都要制定操作规范,并严格做好实验记录,要保证操作的可重复性。

②设立对照。与传统流行病学研究类似,为保证检测质量,可以设立多种对照,如标准对照(指含有某种生物标志,并已知其含量的生物标本)、空白对照(指不含某种生物标志的生物标本)及重复对照(指同一份待测生物标本被分成具有不同编号的多份标本)。在实验中可以利用盲法加入实验样本中一定量的阳性对照、阴性对照和重复对照,以监督和控制检测质量。

③重复试验。重复试验包括实验室内重复试验(即在同一实验室内不定期进行实验室内不同操作者之间的交叉重复试验)和实验室间重复试验(即在不同实验室进行同一批标本的检测,核查其一致性)。

(8)常见偏倚

①选择偏倚。选择偏倚是指不同类型(暴露或结局的特征)的研究对象入选的机会不同。在这一类偏倚中,除样本选择偏倚外,还可出现标本采集偏倚(如采集的部位、时间、机体状态、方法等不同造成的偏倚)。如果样本来自某生物标本库,则更容易出现选择偏倚。

②信息偏倚。信息偏倚又称观察偏倚,是指在收集整理资料阶段由于观察和测量方法上有缺陷,病例组和对照组获得不同的信息而产生的系统误差。它包括回忆偏倚、调查偏倚、检测偏倚、样本存储偏倚。检测偏倚包括操作偏倚、试剂(材料、仪器)偏倚、方法偏倚等,样本存储偏倚主要是指由于生物标本存储时间不同而造成检测结果的偏倚。

③混杂偏倚。混杂是指所研究因素与结果的联系被其他外部因素所混淆,这个外部因素就叫混杂变量。它是疾病的一个危险因子,又与所研究的因素有联系;它在暴露组与对照组的分布是不均衡的。性别和年龄是最常见的混杂因素。如果受到其他因素的歪曲和干扰,或者由于设计原因(如未随机化等),也可以产生混杂偏倚。