建立更好的生物样本库

作者:Baker M.
2021-12-16

未来的研究需要数据丰富高质量的样本,但是这些的样本获得和存储,有时又与研究者的想法是不一致的。


全世界范围内,冷冻箱内和标本柜的架子中均放满了人类的生物样本。


生物样本库收集的生物材料是为了科学研究的,生物材料的大小、规模和关注点是非常广泛的。样本的收集可以来自于普通人、外科手术的病人、或是刚刚死去的病人身上。有一些样本收集的日期可以追溯到几十年前。例如:土著人的基因组序列,就是在20世纪20年代来自于英国人类种族学家Alfred Cort Haddon最初收集的一撮头发中测序得出来的;他周游世界收集来的样本,现在都已保存在英国的剑桥大学里。其中大部分采集样本包含了是干粉或者冰冻的血液,同时也收集了一些例如眼睛、脑部之类的组织和指甲。生物样本库依据需要解决的基本问题不同而存在不同的区别;一项基于人口学的生物样本库收集的血液和医疗数据,可能被用于解决乳腺癌遗传风险因素的研究,而一项基于疾病的生物样本库,收集的肿瘤生物样本则可能被用于揭示乳腺癌的不同分子分型。


一份来自于加利佛尼亚圣塔莫尼卡市RAND公司的研究机构的报告中,估计在本世纪初,美国的生物样本库的组织生物样本已超过3亿份,而且正以每年2000万份的速度增加。明尼阿波利斯明尼苏达大学,生物存储核心资源中心的主任Allison Hubel认为,这个数据有可能是被低估的。


尽管如此,有许多科学家认为,他们不能获得足够的样本资源。2011年的一份调查报告显示出了700多个研究癌症的研究者,其中超过47%的研究者在获取高质量样品过程中遇到很多麻烦。由于这个原因,81%的研究者曾报道过,他们的工作范围受到了限制,60%的研究者对他们的研究成果存在质疑。


过去,研究者只是在显微镜下检测生物样本,或仅仅检测出生物样本的少量化学结构或化学成分。然而现在的研究者想描绘出数百种包括DNA、RNA、蛋白质和代谢物的生物分子的结构。全基因组相关的研究的推广和普及,需要研究者通过检索基因序列来寻找基因标记物,这要求一些经过训练的科学家,要继续在更多的定量检测和更大数量的样本统计中探索。马里兰州贝赛达斯国家癌症研究中心的临床研究者和生物样本库的专家Stephen Hewitt说:“在过去的20多年中,生物医学研究者使用的生物样本的方式经历了一个持续性的改变,但我们对影响样本质量的因素了解的还不够,样本的使用者关于样本很容易遭到破坏的培训也不够”。


冷冻保存


马萨诸塞州剑桥市Broad研究中心生物样本平台的主任Kristin Ardlie说:“如果不能正确处理样本,可能会极大的限制你的工作”。她回忆了以前一个项目是从胚胎样本中分离RNA,而胚胎中有大量的降解RNA的酶。在几次尝试都宣告失败后,他们调查发现,有一个工作人员把收集的胚胎样本先放在了-20℃冰箱里几个小时之后,才转移到-80℃冰箱里面去。


Kristin Ardlie说:“研究者总是想冻上就没问题了”。但问题是标准的冰箱温度不足以抑制酶的降解。除了DNA,其他生物分子在-20℃并不能有效地被保存。绝大部分的样本都可以被保存在-80℃低温中,但是确实有一些样本例如活细胞,则需要保存在接近-200℃的低温。在这个温度下,酶的活性可以被完全抑制。


比没有东西可以分析更糟糕的是,对经历了一些不确定变化的物质进行分析。一项研究发现,两种癌症生物标记物在血清样本中表达的浓度,与收集和冻存了10年的生物样本相比,再重新解冻监测这些样本,两种癌症生物标记物的浓度上升了15%。


在另外一个研究实验中,研究者设计了模拟长期冷冻时间,并且经过几次冻融过程的方案,检测了在血浆样本中的一些癌症生物标记物。其中一些蛋白生物标记物,在长时间经过数次冻融过程后仍然稳定。然而被广泛用于糖尿病、关节炎和癌症研究中的血管内皮生长因子,生物标记物是不稳定的,因此,作者建议不要用冰冻样本去研究血管内皮生长因子。


瑞士的生物样本库的顾问DanielSimeon-Dubach说,并非所有的生物样本库都会记录某一个样本是否因为曾经被拿出分析后而被解冻,然后又重新被冻存,也不并是所有的生物样本库都会记录冰箱的监测温度。即使是一个短期的温度波动,都要考虑到危害生物样本的冰晶形成。Simeon-Dubach说他曾经看到一些研究者为了展示他们的样本,打开冰箱门的时候长达数分钟。我对他说:“你在干嘛?给我图片看就可以了!”


在架子上保存


许多大型的生物样本库用精密的冷冻箱来保持一个恒定的温度。例如位于马萨诸塞州的汉密尔顿贮藏技术公司的一些运转系统,在最初开始运转时大概投入100万美元,来保存大概25万份到1000万份样本。研究者先把放有样本的样本管放在冷冻室舱口通道,再由机械臂将样本转移到里面的保存生物样本的冻存架上进行保存,而不是打开冷冻门那种。研究者甚至可以根据某一特定研究,利用实验室信息管理系统来查找合适的研究样本。例如,根据使用者的需求进行检索那些来自特定年龄和体重的捐献者的样本,样本在得到使用申请后,会被放入转移孵育舱,当样本被取走后系统会发一封确认电子邮件进行确认。-80℃冰箱也会记录下每个样本在冷藏室里被转移的次数和时间长度。


其他一些公司,例如位于马萨诸塞州切姆斯福德的布鲁克斯自动化公司,在华盛顿地区的蒙特雷克特伦斯市出售自动化冷藏室和冰冻仪器,同时也出售保存和检索样本的数据管理软件。


即使没有这些精密的设备,冷冻保存也是代价昂贵。国家癌症研究中心生物贮存和生物样本研究办公室(OBBR)代理主管Jim Vaught说,一个标准的流行病学研究需要大约10万病人的10万份样本,这将填满五台冰箱,每台冰箱的维护每年都将花费6000美元。即使使用保存生物分子和活细胞的最佳冷冻方式保存,组织的外观也会失真。


为了削减存储开支,大部分研究者依靠传统技术研究组织形态学,这门技术可以追溯到一个多世纪以前。来源于病人的组织样本被浸泡在防腐剂福尔马林保存液中,被浸泡固定的一部分组织样本用于石蜡包埋。位于马里兰州的银泉联合病理中心,有大约2800万份的石蜡样本,一些样本可以追溯到第一次世界大战时期。从这些石蜡样本块中我们可以切下一薄片的组织进行染色,在显微镜下观看不同的视野,发现生物分子并不能被有效地保护。Hewitt解释说:“实际上,组织样本在固定剂中会被‘溺死’”。组织缺氧发生在垂死细胞内部,会降解RNA,也会使蛋白质变性。福尔马林则可以使蛋白质和DNA交联成复合体,也会引起RNA和DNA的断裂。当研究者想要获得生物分子时,去除石蜡的过程会造成生物分子更加严重的伤害。


即使能从石蜡样本中提取到RNA和DNA,质量的好坏也是多样的,分析也是很困难的。Mike Hogan是加利佛尼亚州普莱森顿IntegenX的研究副总裁,那里销售一些在室温条件下保存RNA和DNA的产品。该公司的副总裁Mike Hogan认为,福尔马林固定液能被改良以更好地保存生物分子。他说,引起生物分子降解的主要原因,不是由于福尔马林直接影响,而是由于氧化作用和水解作用。冷冻工作之所以有效,就是因为在低温环境中,促使降解的化学反应发生的非常缓慢。在IntegenX的科学家和北卡罗来纳州大学的科学家ChapelHill 正尝试通过去除水分和活性含氧分子的技术来减缓水解作用和氧化作用。如果这项技术有效,研究者可以按照已经发展的染色流程,在保证样本形态学的标准下,使用经过福尔马林固定超过几十年的样本研究生物分子。


其它方法主要集中在去除福尔马林的过程中。位于德国希尔顿的Qiagen公司在2009年发布了一个拥有所有权名叫PAXgeneTissue的产品,该产品采用了一个以酒精为基础的固定液来保护生物分子,而且能够使组织样本被包埋在石蜡中。德国凯杰的资深科学家Daniel Groelz说,这个产品可以使生物样本在室温中保存七天,4℃保存四周,-20℃保存数月,且依旧能保障生物样本的形态学和生物分子质量不受破坏。研究者在研究能够使病理学家得以分析,通过多种不同方式PAXgene保存组织样本的方法。Groelz说:“针对福尔马林,要有大量的被优化的专业染色技术”。他解释说,公司正在针对PAXgene,调整相关的操作流程,特别是以抗体为基础的染色过程来去除染色蛋白。


这种保存方法一开始被用于深度冻存的地方。一项极为热望的收集样本研究计划,利用四种不同保存方法,检测了超过20种不同类型的生物样本,其目的在于探索多种组织样本类型中基因表达和普通基因的变异情况。


组织表达基因型的研究项目(GTEx),是美国国家卫生研究院和学术机构几个研究团队共同参与的研究项目,最终该项目选择了PAXgene。在美国马里兰州贝塞斯达,国家人类基因组研究所的项目负责人JeffreyStruewing说,他从事的这项项目,说明了这项技术不仅能有效地保护RNA,而且还在物流上有效地解决了超低温保存样本转运的困难。但Stuewing说无法提前预知PAXgene在多年后是否有效,或者对诸如蛋白质一类的生物分子的保存是否有效。现在还需要时间去验证它。他说:“目前还没有进行这方面的工作,针对每份样本的每项分析来保存每份样本”。 


收集质量


OBBR第一届的主管,现为亚利桑那州图森市一家主要为促进药物发展的非营利机构研究所的执行官Carolyn Compton认为,在保存样本前就已经出现一些特别棘手的问题。他说:“生物样本是人体的一部分,当它离开人体后,这些保存的生物样本正经历着原来体内环境中从未经历过的压力”。当样本切断血液供给并暴露在突然变化的温度环境下,细胞的状态就变得难以预测了。基因表达和蛋白质磷酸化水平也会发生剧烈的波动,细胞凋亡途径也有可能会被激发。Compton说,研究者应该反思一下,样本的研究结果是否反映了患者体内的生物学特征。他说:“你也许认为做了一次完美的实验,但有可能却得到了一个错误的结果。”


组织样本即使能被很好地保存,也不能完全反映体内的所有生物学来历。Hewitt说:“问题不仅仅是患者死亡尸检后收集样本的时间间隔,即使是死前取得的样本也都缺乏活性。”从使用呼吸机患者身上收集的组织样本和从健康患者身上收集的组织样本是不一样的。“在早上,我经历划船运动后,取出的手臂肌肉组织的活检样本和我休息一会儿后,收集的的手臂肌肉组织活检样本,其RNA状态会有很大差别”,Hewitt说:“你必须在限定的范围内,得到你能说明问题的数据。”


血液、尿液和唾液样本的收集可以通过预约的方式从非住院志愿者身上收集。但是固体组织样本的收集,通常是作为必要的更进一步治疗程序的一部分在医院收集。药物治疗、麻醉反应和组织断血的方式和时间,这些所有影响样本质量的因素都被忽略了。同样,样本在冷冻前暴露在室温的时间,固定时间和固定剂的种类、冷冻效率和样本块的大小形状也同时在某种程度上被忽略了。


医务人员总是把精力集中在手术台上,而我们更应该需要具备样本对医学研究和诊断有重要影响的意识。在2012年2月由OBBR组织的一次会议上,来自奥马哈内布拉斯加卫理公会医院的病理学家Gene Herbek分享了一次与外科团队共同合作的经历,使得样本在被切除后的一小时内便抵达了病理学实验室。


位于德国汉堡的Indivumed生物技术公司,通过手术团队内指定护士的协助,在样本被切除的十分钟内便完成了对它的收集。这些护士和手术团队中的其他人一起做术前准备,收集病人的治疗信息和状态。一旦组织样本被切除,便立即被转移至手术室临近的房间里进行分装、固定和冻存。该公司的管理主任HelgeBastian说:“需要解决的问题不是技术,而是过程。”


Simeon-Dubach说:“经验告诉我们从得到样本开始到处理完成的整个过程的时间应控制在15分钟内”,这是一个非常理想的目标。具体情况则需要根据器官不同来具体确定——例如消化器官中的胃,整个过程则需要更快些。


死亡尸检组织样本的收集时间也很重要。在GTEx项目工作的全体工作人员时刻做好了准备,以便在团队完成器官收集后的第一时间内开始样本采集工作。Struewing说,在这个项目中,超过一半的组织样本,是在死亡后六小时内收集完成的。


GTEx项目的另外一部分工作是将组织运送到国外研究所,目的是分析基因表达情况。在进行基因表达分析前,Ardlie的团队进行了RNA的提取,并将RNA的完整性指数作为标准来衡量RNA的质量和浓度。这种质量检测标准虽不完全,但是研究者剔除RNA完整性指数低的组织样本以保证后续试验的一致性。 


质量评估


Hewitt和rdlie正在试图能够在石蜡包埋样本中检测RNA质量方法。他说,研究者需要更好的样本质量生物分子标记物,来防止在不适当的材料上做昂贵的实验,这样也可以减少人为误差。密歇根州大溪城Van Andel研究中心生物样本科学项目主任Scott Jewell,他正在评估缺氧状态下和各种类型的细胞死亡情况的标记物(如细胞的自噬,细胞凋亡和细胞坏死)。他说,记录样本是如何收集和维持是很重要,但仅做到这些也许也是不够的,研究者需要更加具体的建议。“我们想有一个标记物能说明‘哪一个是质量差的样本,哪一个是质量好的样本’”。这样的过程是很重要的,不仅仅是针对包含特定研究选择样本,而且也能让我们更好的理解如何最更好的保存它们。


很多生物样本库专家发现研究者很少去关注样本的质量。分析了发表在2004年到2009年期间,在开放权限期刊上的发表的125篇探索生物标记物文章的中发现,超过半数的文章没有记录样本是怎么被获取,存储和处理的信息。这也许并不惊奇,近期生物样本库的实践才开始接受审查。OBBR在2005年成立,在2007年首次发布了第一版官方最佳实践指导方案,并在去年(2011年)公布了改善生物样本的研究质量报告,来指导研究者记录生物样本是如何收集,处理和保存的。马里兰州贝塞斯达生物和环境国际样本库协会(ISBER)于2005年发表了第一版的最佳指导实践,在2010年公布了标准分析前期代码系统,来描述收集了什么样组织样本和如何收集样本的。欧联盟已经资助了一个名为,“通用分析前期工具和体外诊断过程的提高与标准化”的四年项目。这是一个由Qiagen公司协调组织的多体系项目,旨在提高和体外诊断的样本处理过程标准化。另外,许多团体正在呼吁,学术期刊在同行审阅时,要求提供这些有关信息。


在伊利诺斯州诺斯菲尔德的专业团体美国大学病理学会(CAP),已经建立了生物样本存储机构的资格认证项目。它在今年(2012年)开始接受申请而且到目前为止反映良好。想要申请认证的机构,会收到一系列实践问题的清单,包括当样本被解冻和冻融的时候是否记录跟踪,是否安装了冰箱警报器。如果申请机构都能满足了清单上的要求,他们就可以申请审查并安排检查验收。俄亥俄州哥伦比亚国家儿童医院生物病理中心主任,同时也是审查组副主席的NilsaRamirez说:“超过十年的时间里,我就已经听了某些人说过,是该有人站出来做这些事了。我认为这样可以使调查者,能够更好的意识到他们所做的事情是如何尽可能提高质量。”


Vaugh的办公室现在正在为评估和发展存储技术颁发捐款,同时也在为维护一家与同行评议的文献相关人工管理的数据库。他认为,这些所做出的努力是有一个难点,那就是这些指导公布,基本都是研究者的主观意识和经验,而不是通过精确的实验,来检测验证保存样本的最佳方式。生物样本库专业人员一般都在初步的实践后,发展一套属于自己的实践细则,也不会去发表他们。他说:“还没有基于确实的研究的国际标准。”


事实上,用于研究的资源和用于保证样本质量的设备都是不足的。Compton说:“人们更想将资金用于研究项目和分析过程,而不是支持这些的基础设施建设。”一项涉及仅仅5万份生物样本的样本库第一年的启动资金就在300万元到500万元之间,还不包括信息软件处理系统。一个样本库十年的运转成本可能会超过1000万元。为持续的开支来筹募资金也是一个挑战:学者们更习惯从同事那里获得样本,而非从样本库中获得高质量的样本。 


保存患者数据 


几个组织机构的存在是帮助研究人员更容易地获得他们的研究所需要的样本。美国国家癌症研究中心发起的人体组织网络合作团体,其中的一个网络部门已遍布美国各大州,目的在于促进人体组织的使用。要求研究者从常规的外科手术和尸检中收集组织和体液。在宾夕法尼亚州费城的国家疾病研究交流中心,也是做着同样的工作。他们专门提供珍贵的样本,例如眼睛。现在,一些国家的政府也已经发起的大型的生物样本库建设项目(参见附件‘英国生物样本和数据资源’)。欧洲生物样本库的一个网络系统中的生物样本库与生物分子研究资源公共建设(BBMRI),现在正在创建一项政策是允许研究者来分享样本和数据。P3G项目是加拿大魁北克人以基因组研究为主旨的公共人口项目,这个项目不仅提供了知情同意的某些方面的文件汇编开源性软件,还提供了样本存储过程和他们收集的相关信息的数据库。Isabel Fortier认为,将来的研究将要求更大数量的样本来满足严谨的统计学分析。Isabel Fortier是P3G的研究和研发主任,同时也是麦克吉尔大学健康中心的研究人员。她说:不要去想“哪怕只有一个研究,甚至是大型的研究项目,会有足够多的样本来满足研究需要。我们需要学会是将我们已经收集的数据赋予它第二次生命的再次利用。”


研究者日益渴望需要得到,关于样本捐献者后续健康状况的信息和生物分子详细分类的信息。这种情况促进了要适当的再考虑研究合适的知情同意和数据政策,同样也促进了在数据上如何保存和发掘的创新。Jewell说:“这种做法确实会成为未来生物样本库的发展潮流,如果不知道如何去管理动态的数据,那么样本库就只会成为一个静止的样本库。我们想的是能持续地不断地更新我们的临床数据。”


一份生物样本可获得的信息越多,被用于其它研究领域的价值就愈大。如果科学家们已经得到了他们感兴趣的基因突变相关肿瘤样本,他们在癌症通路上个别基因的研究的效果上,会节约数年的努力和成千上万美元的成本。辉瑞公司的资深副总裁和BBMRI项目科学委员会成员的David Cox认为,得到生物样本最好的方式,是解决生物样本短缺的方式,不是想着如何获得。期盼着从研究者那里,为了解决各自问题对已经收集的生物样本库的样本中,去找到一些再次利用它们方法。“你不可能去收集和保存每份生物样本这个想法,耗费太大,也不能保证它们质量。”同时,他也说,每个项目组为了收集样本,都去找相关人员协商的做法效率也是低下。他展望‘卓越中心’的宽松协调机制,研究者可以在那里针对他们自己的研究,保存样本和追踪临床信息,但也要针对分享样本和保障它们的质量共同承担建设的义务。


Cox认为有一个问题,那就是谁来支付这笔经费。他说:“人们总是想从他们手中的那部分样本中获得利润,而不是将它们都集中起来”。政府的经费很是紧张,药物公司只愿意去资助那些能研制出新产品的研究,个人捐赠的样本和数据也只愿意为了公益事业,而不是为企业盈利。其中一个想法是调查了在医药公司管理范围内生物样本库基本架构,但这些公司并没有单独享有数据的所有权。无论以何种方式,讨论这种做法是否可行,还为时尚早。我们需要一种连接基础设施和信息的方法。Cox说:“我们正处于生物样本库建设的初期,所以,我们只有能够对生物学有一个更好的理解,才能制造出更好的药品。也许,在这其中最艰难的问题会是建立和维持投资。


英国的生物样本和数据资源


在过去几年里,在英国超过五十万人已经有过被收集尿液,唾液和血液的经历。他们会花几小时的时间来测量体重,血压,记忆力,肺活量,抗压能力的判断和记录体检人员回答的大量的关于他们生活方式的调查问卷。


运营主任Paul Downey说,他们花费了几年的时间来设计决定收集什么样的样本和信息。在2004年,Paul Downey加入了英国UK生物样本库的设计,2005年第一批志愿者开始征集。他说:“从创立那一刻起,他们实时跟踪一千四百万份分装在小管子流动液体的生物样本,也许会保存30年。”每一件事情都要在样本库预算范围内和志愿者能够接受的方式下进行。最初,一些研究者希望获得脂肪活检样本,但那样会打击志愿者的积极性,同时也会增加成本和收集的复杂性。


他们最终决定是收集志愿者尿液,唾液和血液。在对样本进行收集中,有七种包含了不同的有抗凝血剂和防腐剂的采集管,来确保预期的试验。团队决定,在尿液样本和唾液样本中不加将添加剂,因为这些添加剂会增加尿液和唾液样本可变异性或影响未来的研究分析。


通常在样本库工作的一天时间里,要从7000到10000个志愿者身上获得样本。Downey说,一天工作的完成,需要四到五个实验室的工作人员和工作量相当于50个技术人员的十几个的机器人完成这项工作。他说:“看起来有点像科学虚构场景”。一个有六只胳膊的机器人离心血液样本,形成不同的分层,然后再把分离样本的每一层,用移液器转移到它自己的管子里面去。机器人的管子有条形码,为贮存准备。Downey说,机器人还要忙于为特殊类型疾病的样本库的志愿者提供的样本进行处理和随访。


每个捐赠的样本分为两份,被两台仪器分别保存,彼此作为备份。首先,-80℃仪器设备中保存了900万份的样本,实际上是一个约有六台双层巴士一样大小的冷冻箱,包含了一个重达1.5吨的机器人。研究者可以通过条形码来请求想要的样本,机器人便会从样本架上把它们拉出来,把它们带到转移舱口,最大化的减少样本暴露在相对较高的温度下的几率。离此地十九公里外的地方,有一个使用液氮的人工制冷支持系统,在-196℃温度下保存了600万份的样本。这个温度是建议的保存活细胞的最佳温度。这个系统包括了50个圆形的不锈钢箱体,每个箱体的尺寸,差不多都有一辆轿车的大小。Downey说,这种保存方式的建立,能使研究者比较两种保存条件下生物分子生存变化。


Downey说,在具体研究分析过程中,我们也采取了具体保护样本具体实施的步骤。例如,针对检测DNA,RNA和某些蛋白质的一些研究设备中可以现场使用,从而最大化减低转运珍贵的样本给研究者。最终,作为生物样本库本身,也可能会检测出一些可能会使研究人员感兴趣的参数,包括血脂水平。信息系统会使来自于实验室数据被分享。他们将结合针对一批样本研究分析需求,在取出样本时最大化的减少样本被冻融的次数。


英国生物样本库项目,已经运行差不多10年时间,到目前为止耗资大约8500万英镑(1亿3400万美元),但仍然处于它的初期的建设。Downey说, UK生物样本库在三月份(2012年)开始,已经开始接受研究者申请这些样本和关联的数据,在最初的三个星期里已经收到了大约150份应用的申请。世界各国的大学和卫生健康中心的科学家们都有资格申请应用。伴随着数据的不断积累,样本将会越来越有价值。在十年内,估计在最初的样本捐献者中,约有9000名志愿者将会发展为阿尔茨海默症,约有10000名志愿者会患有乳腺癌,28000名患者会死于心脏疾病。



摘自:Nature

编译:四川大学华西医院 王耀賡

转载:ebiobank