关于血液和尿液样本采集、处理和存储的方案 ——英国生物样本库 ( UK Biobank )
摘 要:
背景:英国生物样本库(UK Biobank)采取前瞻性流行病学策略,在中老年人群中研究基因、环境和生活方式与常见病的关系。本库收集的资料和生物样本来自于500000位捐献者(年龄:40-69岁)。众所周知,生物样本的采集、处理和存储方案将会对后续的科学研究产生重大影响。
内容:本方案的目的是阐明在额定的经费支持下获取最大的科研价值的建库,本库所采用的样本采集、处理和存储方法,来确保样本质量,为后续开展的现有或可预判研究实验服务。
方法:本方案的制定借鉴了大量已有文献、咨询了相关专家并进行了同行评议。本方案内容涉及样本的采集种类、处理方法和时间以及存储条件等问题,来确保样本长期存储的质量。本方案的可靠性目前已经过了大量实验的证实。对于每位捐献者,本样本库采用真空采血管采集45ml的血液和9ml的尿液,并在现场进行最小程度的处理。对于样本保护剂、抗凝剂和促凝剂的选择将根据预期的用途来选定。本样本库也在部分捐献者中收集了头发、指甲、唾液和粪便等样本。血液和尿液样本将在24小时之内从现场运送到存储中心。样本将在那里进行处理,处理后的尿液、血浆、血清、白细胞和红细胞会存储在超低温容器中。全血的部分分样也进行了保存,即保留其潜在的细胞系。部分样本用于标准的血检(因为这些检测项目必须使用新鲜血样)。最终,将收集到15000000份样本,其中9500000份样本存储在-80℃自动化设备中,另外的5500000份样本存储在-180℃液氮中。基于研究中涉及的样本数量巨大,本方案中采用了大量的自动化手段。其中涉及的流程、技术、设施和设备等都采用了最佳实践。鉴于记录样本采集、处理和存储的数据量是繁琐的,本方案采用商业化的LIMS系统来统一管理这部分资料。
总结:本库采用的样本采集、处理和存储方案不仅满足了本研究的需求(样本量巨大),并最大限度的确保了样本的质量。从第一批次40000人次的实践来看,已展示这套方案是合适的、可靠的。
介 绍
英国生物样本库(UK Biobank)采取前瞻性流行病学策略,在中老年人群中研究基因、环境和生活方式与常见病的关系。本库将于2007年4月到2010年底期间,在500000捐献者(年龄:40-69岁)中采集基线资料。将在现场收集初始资料,包括问卷、身体与认知检查和样本留样。这些资料将会与捐献者的其他医疗信息关联在一起,这将有助于后续的跟踪随访(包括疾病的产生、甚至死亡)。本库采取的样本采集、处理和存储方案的制定借鉴了大量已有文献、咨询了相关专家并进行了同行评议,而且其可靠性已在大量的实验中被证实。本方案具体规定了样本采集的种类、前处理和存储的温度、样本运输的工具、样本处理的方式、分管情况和长期存储条件等。
方 法
注意事项
建立生物样本的长期存储的生物样本库,其中最重要的一点是能够为后续广泛的科学研究提供高质量的样本,而不是局限于单一的病种(例如,如果仅仅关注于糖尿病,那么就只需要收集空腹血样)。鉴于研究项目的要求(见框1),在有限的资金情况下,开发一套样本采集、处理与存储的方案就势在必行。
框1:英国生物样本库对样本采集、处理和存储采取的原则
结合上述项目要求,就需要考虑到下面以下注意事项:
经济与过程
项目发展过程中,首先要考虑的就是经济与效益。鉴于有限的资金支持,本库采取的每一项措施都要经过深思熟虑,其中就有一些早期的提议因不符合经济原则而被否定。如果一些要求因为技术性的原因不能够实现,方案中也会适当的修改来尽可能的满足。例如,在现场进行大量快速地收集晨尿和24小时尿很难实现,方案中就采用了随机尿来替代。
技术
在500000位捐献者中收集血液和其他样本是一下非常创新的项目。也没有非常成熟的解决方案来满足本项目。本库借鉴工业上的最佳实践并采用高通量的操作原则。本库采取的技术手段都是建立已经成熟的技术上,并且要求能够满足高通量和高质量的原则,而不会采用不成熟的技术。如果将来有提高效率的新技术出现,本库也只会在这项技术经过完整的评估之后再添加进来。
中心处理VS现场处理
已有的生物样本库均没有本库的规模大,因此其采取的样本采集、收集和存储的方案并不适用与本库。正如框1所述,本库的原则之一就是采用标准化的操作流程,确保每一份样本的采集、处理和收集均采用相同手段,并经过严格的质量保证和质量控制。鉴于本库的情况,就有现场处理和中心处理两种途径。现场处理能够快速地处理和冷冻保存样本,这能够高质量的保存样本中不稳定的分子。但是,现场处理在保证信息的完整性和严格的执行质量控制方面是很难做到。在预实验中显示,一个现场每天接待80位捐献者,5、6位技术人员是能够保证样本质量的。超过这个数量,信息的完整性很难保证,时常出现错误,并会出现延时现象。对于本库来说,高质量的样本和数据是压倒一切的。另外,现场处理需要更多的人员、设备及场地,粗率估计其花费将是中心处理的两倍。本研究采取最少的现场处理,并在采集样本后尽快的运送到中心进行处理。采取中心处理,样本在离体后就没有得到尽快的处理和冷冻保存,这将可能导致不稳定的分子发生改变。另外,细胞的溶解也将对分离血清或血浆造成困难。因此,本库采用大量实验来验证中心处理对样本的影响,并证实这种方案是可靠的。
样本种类、稳定剂和抗凝剂
基线调查期间收集的样本种类是非常重要的,同时要考虑采用何种稳定剂来处理,并且要在可控的经济水平上。本库的原则是收集便于采集并且富含生物信息的样本(血液和尿液)(见框2)。
框2:样本种类采用和排除条件
在基线调查期间,本库收集了45ml的血液和9ml的尿液。本库还考虑了其他的样本种类(如粪便、头发、指甲和唾液,见框2),鉴于其附加信息不足、收集不方便及花费大等情况,并没有在所有500000人中进行收集。例如,粪便样本中细菌的“副产品”(如氢化物、甲烷、烷烃、甲基烷烃、酚类和有机酸等)虽然是很多肠道疾病(如肠易激综合征和克罗恩氏病)的标志物;但是这些物质也可以在尿液中进行检测。另外,肠道微生物可以采用核磁共振技术在尿液中检测。头发和指甲虽然能够用来测量中毒重金属中毒,但是一份汞代谢的研究显示,头发总的汞含量作为身体或器官中汞含量的指示物是不准确的。另外,砷化物(如砷甜菜碱及其他常见化合物)并不在头发中富集。更重要的是,在头发或指甲中测量环境中的砷化物会受到外界环境的影响(如空气、水、香皂和洗发水等),这些东西更容易在尿液中测量。
样本采集条件
我们收集了全血中各种生化分子与细胞在不同抗凝剂、不同温度和不同运输条件下的稳定性情况。各种生化分子可以分为两类:1)、已知的种类(如DNA、已知的蛋白质和代谢物、血常规和细胞种类等);2)、未知的种类(如血清或血浆中的蛋白组等)。如果有可能,我们会将已知生物物质的保存条件推广到未知的物质上面,并进行相关的验证性实验。
保存生化物质中重要的因素有:抗凝剂、稳定剂、温度、延迟处理时间(从离体到处理的时间间隔)和内源性溶解物(如酶和细胞死亡)等。样本的无菌条件也是非常重要的。另外,我们还会不去做重复的收集,以降低不必要的花费。比如,我们没有采用全血,在纸质介质上来存储DNA(尽管有研究表明这种方法的DNA回收率很高);而是用白细胞来存储大分子DNA,B细胞来作为DNA的补充。
抗凝剂
保护剂等添加剂的选择对于样本下游的研究是至关重要的。例如在含有抗凝剂的管子中采集的全血会产生细胞因子,导致其浓度上升。对于一些分析,抗凝剂不必不可少的;对于另外一些研究,是一定不能添加抗凝剂的。例如,如果后续研究中需要使用白细胞,从中提取永生细胞系的话,那么枸橼酸葡萄糖就必须的。肝素稳定后的血液会影响T细胞繁殖能力、能结合于特定的蛋白质、并影响DNA的聚合酶链式反映。添加有肝素锂的血液是非常适合代谢组学的研究的。添加有柠檬酸盐的血液是非常适合提取RNA和DNA的,并能适合淋巴细胞的培养。如果要进行功能凝血因子测定,柠檬酸钠是合适的;如果要通过免疫反映来检测纤维蛋白原抗体,乙二胺四乙酸(EDTA)是合适的。尽管乙二胺四乙酸会影响镁离子的含量和细胞的功能(如增加姐妹染色体的交换、减少有丝分裂指数等),但是其稳定的血液非常适合于以DNA和蛋白质为基础的分析。因此,本库采用乙二胺四乙酸和肝素锂作为抗凝剂。另外,本库还采用了枸橼酸葡萄糖保存一份血液,以备后续淋巴细胞的研究。
促凝剂
与血浆、血细胞相比,血清更适应与另外一些研究(如大部分临床生化分析和代谢研究等)。全血在室温中存储于玻璃容器中会自动凝固,但这种方法是不可行的,因为玻璃容器非常有可能破损。鉴于全血在不经过处理时只会部分凝固或凝固很慢,因此在塑料管中收集血清就必须添加促凝剂。目前,有两种促凝剂:二氧化硅和促凝酶。促凝酶能够快速促进血液凝固(一般用于心血管手术中),但是其价格是非常昂贵的,并不适用于本库。因此,我们采用二氧化硅作为促凝剂。实验显示,二氧化硅处理血液中的血清是能够满足后续研究需求的。
降解情况
酶的降解会影响到很多生物标志物。例如,乙二胺四乙酸和维生素C能够稳定血液中的叶酸,因此如果后续需要检测叶酸的项目就必须在血液离体后尽快的添加这些稳定剂。蛋白质会受到细胞中蛋白酶的影响而降解,特别是当细胞的完整性被破坏后;虽然可以通过尽快添加蛋白酶的抑制剂来解决上述问题,但是这些抑制剂对于活细胞来说都是有毒性的(如果需要检测细胞的活性,就一定不能添加),并会影响到后续抗原性实验和功能性实验。RNA酶是广泛存在的,因此RNA特别不稳定;RNA的完整性就有赖于操作中无RNA酶的,并需要添加RNA酶抑制剂。然而,添加了RNA酶抑制剂,就会影响到样本的其他用途。本库中并没有采用任何能够快速阻止酶活性的试剂,因为这些试剂会干扰到后续的其他研究及其对细胞的毒性,特别是在长期冷冻保存中会影响到RNA的完整性、个体间的差异和其自身的不稳定性。另外,如果在整个人群中都采用RNA酶抑制剂的话,花费将是巨大的;因此我们只在部分人群中采用。另外,代谢组学的研究可以通过枸橼酸葡萄糖管中收集的淋巴细胞来进行(虽然其中含有B细胞可能会产生一定的影响)。对于尿液样本,可以添加保护剂(如硼酸)来降低细菌的污染。然而本库中并没有添加硼酸(这与其他样本库是不同的),因为这会在尿液样本中产生其他化学物质。虽然叠氮化合物也能够保存尿液并不会产生其他物质,我们也没有采用这种方法,因为这会增加现场操作的困难和质量的不稳定性、稀释血液。更重要的是叠氮化合物是有毒的,并会对代谢物产生影响。
温度及延迟处理时间(从离体到处理的间隔)
温度会影响到样本的稳定性,特别是在样本离体后到处理前之间。活细胞虽然能够在室温下稳定性的保存48小时,但必须尽快进行细胞培养或存储在液氮中。细胞分离后再存储与不分离后存储相比,其细胞更容易存活(因为细胞的存储需要添加二甲基亚砜,不然的话细胞会破裂)。对于生化分子来说,如果不能够尽快的进行分析,样本需要保存在低温中,因为室温中不稳定的分子很容易降解(如细胞因子、抗氧化物(维生素c、尿酸和维生素e等)和其他的物质(叶酸和维生素B12等)等)。理想情况下,不同的生化分子需要不同的保存温度,然而这对于一个大的项目来说是不可能实现的。4℃是一个很好的选择:细胞能够保持其活性(相比于室温,活性会有一定的降低),同时样本也能够在一定程度上对抗酶的降解作用。有一项研究表明,相比于各种方案的选择(包括抗凝剂、稳定剂、保护剂、运输温度、延迟时间和条件等),各种细胞因子(如肿瘤坏死因子、α干扰素、γ干扰素、白细胞介素Iα、白细胞介素Iβ和白细胞介素6等)的保存条件最好是在4℃中。同时在该研究中,相比于各种抗凝剂,乙二胺四乙酸是最稳定的。本库中进行了一项研究表明,在4℃和18℃中,样本的稳定性能够保持至少24小时,细胞的活性能够保持至少36小时。
样本采集方案
本库采用表1的方案来采集血液和尿液。在静脉穿刺过程中,皮下注射针头与含有稳定剂的真空采血管直接相连,通过压力来采集血液。在尿液的运输过程中,通过一个相同的装置将尿液从采集管中收集到运输管中。
表1、样本稳定剂、采集优先级和数量
现场样本的处理过程
前面已经提出,会在现场进行最小程度的处理。当血液收集到采血管中后,将进行10次的上下反转,使血液与抗凝剂或保护剂混匀。通过采用含有肝素锂的血浆分离管和含有促凝剂的血清分离管来降低延迟分离对样本的影响(可能会使钾离子或和同型半胱氨酸的含量增加)。这些管子中含有一项专利物品(惰性并含有胶塞)能够阻止细胞等物质通过,使血清和血浆通过,从而在低速离心后能够使样本产生分离的效果。每一个采集管上均含有其与众不同的条形码,并在扫描入库后与捐献者的ID号码想关联。这个条形码不是提前分配给捐献者的,这样做,捐献者就不容易弄混其ID号码并能阻止没有血液的管录入到LIMS系统中。在扫面如果的过程中,会自动引发一个内置的计时器,用来准确地记录血清分离管中血液的凝集时间。血浆分离管中的血液会立即在现场进行离心(离心力:2500g;时间:10min;温度:4℃),并录入信息系统中。血清分离管中的血液允许在离心前室温下保存25-30min;离心时间会记录在信息系统中。所有的采血管将保存在4℃(含有枸缘酸的采血管保存在18℃),在白天工作结束后将通过商业物流运送到中心(其运送盒均经过温度控制)。
中心样本的处理过程
在第二天白天,样本会运送到中心进行尽快的处理,并按如表2的方式进行分装。处理过程中,所有的样本将处于4℃,并会尽快进行长期保存,确保所有的样本在24小时之内入库。
表2、样本的分装方案
采集管上的条形码会再次扫描,并与LIMS系统中的数据对照,确保其正确无误,然后与捐献者的其他数据相关联。鉴于本库每天的存入量是巨大的(每天达到5000份血液和尿液),我们采取自动化的处理方式,所有的操作时间、温度及人员都将记录在LIMS系统中:
EDTA真空采集管(9ml)。
含有EDTA的真空采血管中的血液将会在4℃下离心(2500g)10min。分装后的血浆、白细胞和红细胞将存储在1.4ml含有二维条形码的冻存管中,封存后放入96孔板中。LIMS系统中的数据会进行更新。
抗凝管和促凝管
含有分离胶采血管中血浆和血清将直接存入标记的冻存管中(如表2),LIMS系统中的数据会进行更新。
含有枸缘酸的采血管
500μl的全血与500μl的无菌DMSO(浓度20%,通过RPMI培养基稀释)存放于标记号的冻存管中,所有的操作在生物安全柜中进行,LIMS系统进行记录。然后将通过程序降温仪进行降温,初始温度4℃,-30℃之前每分钟1℃、-100℃之前每分钟10℃。随后,所有冻存管将保存于气相液氮中。
EDTA采血管(4ml)
我们也采集了新鲜样本来进行实验(因为有些分析不能通过保存的样本进行)。4ml EDTA管中的新鲜样本将会在全自动血液分析以上进行也常规分析(框3)。所有数据均通过条形码进行关联,LIMS系统进行记录。
框3:4ml采血管中全血所做的血液分析
尿液采集管
尿液分装标记后入库(如表2),LIMS系统进行记录。
LIMS系统、数据结构与数据安全
本库采用LIMS系统来进行整个数据的信息化。LIMS系统虽然需要一些调整才能更适应于特殊的实验过程,鉴于其数据结构的完整性和ORACLE数据库的采用,我们认为其非常适应于本样本库。整个数据结构系统是适应与本库的基本原则的。采用条形码(采血管上采用1维条形码,冻存管上采用2维条形码)确保了样本可追述行,保证其能够准确地从现场到中心到存储。鉴于所有的过程均是自动化完成的,所有的附加信息(包括采集和存储的时间、从采集到存储的温度、样本的体积等)均能够追溯到冻存管和个体上。条形码的采用保证了每一份样本均能够关联到其捐献者的12位ID上。LIMS系统中的数据分为两个部分,一部分是现场的数据,一部分是捐献者的数据。对数据的获取是需要经过严格地验证的。
流程自动化与质量保障
样本在中心进行处理是高度自动化的,这增加了每天的入库量、降低了操作上的失误、保证了质量的一致性和可重复性。同时,这也有利于复杂数据的管理。通过采用工业上的操作流程、精密设计、严格操作和控制,所建立的可靠的经济的并留有余量的自动化操作流程能够保证样本库入库工作的顺利进行并确保了了数据的安全。所有的一些努力都是为了后续研究能够获得高质量的样本。因此,所有的操作步奏均经过了质量保障环节,所有有关于操作的数据(如机器型号、工作人员)都与样本相关联。流程中嵌入的检验设备和方法每天都会用来确保没有任何质量问题。例如,每个真空采血管ID的前三位用来指定采血管的种类,这有助于确保采血管的正确采用。条形码的采用还有助于提高大量不同种类样本的处理效率,因为所有的采血管增加条形码后均能够自动的在分装平台上运行,不用人工进行区分。采用自动化的操作流程,能够降低操作上失误(如对样本的操作不规范、对血液样本采用尿液的操作流程或相反),从而将注意力集中在流程处理上,这也有助于样本质量的提高。已经发现有任何的失误,操作流程会自动停止,或通知操作人员来处理。大量的质量保证措施内嵌入操作流程这对于保证样本质量是非常重要的。
样本的长期存储
研究长期保存大量生化分子的文章并不多,大部分都局限于特殊种类的蛋白或小分子。例如,有些文章只研究了细胞因子(只包含了血浆中一部分的分子)的保存条件,这些文章探究了温度(从-70℃的冰箱到-180℃的液氮)对样本质量的影响,有的研究持续长达6年。有一项研究探究了存储温度(从室温到-70℃)与冻融次数在20天内对血浆分子(包括β2M、sIL-2R、neopterin、IFN-γ、sTNF-RII和TNF-α等分子)的影响,指出-70℃是最好的保存温度。一项持续6年的研究表明-70℃与液氮保存对凝血因子、纤维蛋白原和炎症因子等分子的质量没有影响。还有一项持续6年的研究,探讨了-20℃、-40℃、-80℃和-180℃或更低对白蛋白、载脂蛋白A-1、载脂蛋白B、胆固醇、肌酐激酶、肌酐、纤维蛋白原,高密度脂蛋白胆固醇,低密度脂蛋白胆固醇、总蛋白和甘油三酯等分子的影响,指出-20℃和-40℃温度下这些分子可能会降解,-80℃和-180℃或更低的温度下这些分子保持稳定。本库也将会使用大量样本探究各种存储条件对大量分子的保存产生的影响。
招募结束后,本库将存储15000000份1.4ml的冻存管。出于安全方面的考虑(见框1),这些样本将会存储在两个不同库内(这两个库并不在一起)。主库中的样本先被使用,备用库中的样本作为备份(含有DMSO的样本和需要长期保存于-80℃的样本也存储在备用库内)。主库将会容纳9500000份样本,存储于-80℃中,所有的入库和出库均通过自动化的系统来进行。该系统通过液氮将整个系统内部(封闭系统)保持于-80℃温度。样本的出库通道附近的温度是-20℃。只有需要的样本才会被取出系统,其他的样本将会自动放回(因为这些样本并没有离开系统,这就避免了样本的冻融)。所有的操作均是通过外部的操作杆来进行。备用库将会存储5500000份样本在-180℃以下的液氮中。液氮中的样本需要人工来进行入库和出库。液氮存储容器含有温度监控模块,并通过真空管道自动添加液氮。对液氮中样本的所有操作必须按照研究操作流程来进行。其中,操作时间、操作温度和操作人员均必须进行登记并录入LIMS系统中。
讨 论
本库制定样本采集、处理和存储方案的原则包括:面向后续研究、质量控制和质量保障、样本安全和经济等。伴随着方案的制定,操作流程、设施设备和技术等方面也进行了发展来确保样本质量。本库采用的方案及操作只是多种选着之一,我们也是在经济与多种方案之间平衡之后才选着的,从而保证500000位捐献者者的样本的质量安全。
样本在现场进行了最低程度的操作,并尽快运送到中心,并保证24小时之内能够入库。大部分的样本在4℃下进行运输,需要进行淋巴细胞培养的样本会在18℃下进行运输。中心化的处理方案能够最大限度的保证质量控制并且经济,但是也会带来一些问题(如在运输过程中一些非常脆弱的分子可能发生改变)。然而有研究表明,这些变化是非常小的。
样本在中心处理后会存储于两个库,主库中的样本存储于-80℃,备用库中的样本存储于-180℃及一下的温度中。主库中选择-80℃是经过大量研究后得出的结论,这个温度下,大量分子包括细胞因子也能够安全的保存。鉴于样本质量的重要性,本库也会进行关于保存中样本质量的研究。出于安全性的考虑(如火灾),备用库并没有与主库建立在一起。备用库采用液氮来存储,存储温度可以达到-180℃一下(这是最低可行的存储温度,尽管还是会有特别脆弱的分子降解)。备用库还保存用于淋巴细胞繁殖的样本。
本库中的样本用来探究各种疾病的危险因素(通过采用小范围的前瞻性病例对照研究或其他研究)。这种小范围的病例对照研究能够最大限度的利用样本,只需回顾性的基线样本库挑选出需要的样本即可。同时,这种研究只需要部分的样本(如几千人或几万人,而不是500000人),这样做经济、减少样本的浪费并能够很好的控制样本质量。在500000人群中,需要多年的发展,收集足够的患病率,才能够获得足够的统计学效应。这份分析策略能够在将来确定需要做的研究后再开始实验,并能且可能的研究策略会更多。当然也在将来的一部分人群中采取样本与现在的样本进行对比,来研究各种中间性疾病,如代谢综合症和高胆固醇等。
在样本处理过程中采用的设备和技术都必须是成熟可靠的,不然的话将会对样本带来巨大的损失。虽然过程中采用了一些新的自动化技术,但是自动化的每一个步奏所需要的技术都是成熟可靠的。所有的消耗品都是现成的标准的并能够自动化的录入LIMS系统中,如1.4ml的冻存管就是非常经济的,并且加入条形码后能够自动化处理的。条形码会多余一些(以防破损),并贴于管身,防止丢失。采用膜封闭技术能够避免手动开盖并降低细菌污染。管子和封膜收拾经过超低温检测的,确保安全。所有的标记都是永久性的并经过校验,确保误读率在5500000分之一以下。
人员的安排完全按照本库的原则来进行。样本库人员每天两班,一周六天,完全按照制定的方案执行所有操作。每一组人员都有一位监管者,负责流程的一部分。他们还负责其流程内的质控控制和保证,并提升其工作水平。我们采用自动化处理并不是要降低人员数量。自动化用来提高样本入库量、保证样本质量并确保样本信息可追踪;人员保证流程的合理性并在自动化出现问题或发现质量问题时人工处理。
从2007年4月到2007年11月,我们共招募志愿者37000人,处理了180560份血液和36250分尿液样本,共收录样本971445份。每份样本的平均处理时间(从采集到入库)是22.75小时(SD=2.88)。整个过程中,处理和入库流程没有发生任何问题,并且说有的实验室均保证能够按时的完成处理任务。尽管目前每天的入库量已经达到最大入库量的70%,实验室依然能够保证按时按量的进行处理如何操作。
总之,本库制定的样本采集、处理和存储方案能够在有限的经费下保证研究计划顺利的进行。当然还有其他的解决方案。其他项目应该按照本身计划的目的、样本量和研究设计来构建自己的方案。我们也非常欢迎其他项目能采用我们制定的方案。
摘自: International Journal of Epidemiology
编译:四川大学华西医院 杨宗泽
校审:四川大学华西医院 胡迅
转载:eBiobank