用于癌症诊断的尿液及其它体液的多肽组学
“组学(omics)”的出现给人们以新的希望。“组学”是指以能够生成大量数据而著称的高通量技术,“-omic”这个后缀最早来源于“基因组学(genomics)”,随后发展出转译组学、蛋白质组学、代谢组学、表观基因组学和多肽组学等等。
蛋白质组学和多肽组学在疾病诊断上的特点
当基因组学和转译组学出现时,大量的工作均指向了从中能发现有助于风险分析、诊断、预后、及疾病发展监视的生物标志物。但是基于核酸方法(基因组、转录组)的主要限制在于对疾病遗传倾的分析通常不足以鉴定出实际发生的生物过程和发生机制。蛋白质组学的应用可在一定程度上克服上述的局限性。因为蛋白质是生化活动的效应物,从病理生物学的观点出发,遗传分析可以预测疾病发展的风险,但蛋白质组学方法有能力显示疾病过程及疾病在治疗中的反应。
多肽组学(Piptidomics)这个术语产生于1996年,是对分子量大致小于20000的蛋白质(多肽)的全面分析,可以说是蛋白质组学的一部分。
生物系统中的大部分肽并非是合成的,而是来自前体蛋白在内源性酶作用下的裂解,例如与凝血有关的酶和胰岛素等。有些肽可就地生成,但足够小到能通过血管内皮系统被动进入血液,也可以通过因为疾病而改变了渗透性的血管壁而进入。
有理论认为蛋白水解过程对于促进代谢的变化是必要的,这样使个体和种系有可能较好地适应外界的刺激。实际上,体液中的多肽取决于蛋白酶的活性与蛋白酶抑制剂之间的不平衡。内源性蛋白酶以这样的方式分别调节生理和病理现象。因此有理由假设:研究蛋白酶的活性和规律可以改善检测并加深对一些疾病分子机制的理解。
同时,多肽在健康生理学过程中也具有核心作用。这在众多的细胞因子,生长因子和一些经蛋白质组研究显示使无前体蛋白的神经肽都是实例,说明它们都是在神经系统中合成而非其他蛋白质的分解产物。就是有些多肽是由较大的蛋白质分解而来,也会通常显示和其母体分子不同的生物功能和活性。就是许多多肽来自较大蛋白的分解,分析这些多肽也可能能得到更多的信息。
体液多肽组学
虽然许多多肽组的构成尚有待开发,但有可能提供有用的疾病的标志物。值得一提的是:一些多肽生物标志物已经应用于临床。尽管他们都不是用现代的多肽组学方法发现的(表1)。在这些已经在临床使用的生物标志物之中被了解最多的例如脑钠肽(在血清内量测,评定心力衰竭)的氨基端前肽和C肽(用于监视糖尿病患者的内生胰岛素产物)。尿液中的胶原N端肽可做为骨质更新的生物标志物。这些例子是证明体液是大量蛋白质和多肽的来源,其中不乏具有生物标志物作用的分子并值得进一步的开发。表二则从临床应用的角度列举了各种体液做为生物标志物来源的特点,也可看使用尿液其实是具有一定优点的。

血液的多肽组学
血液(血清和血浆)被视为生物标志物说明最有价值的标本(17),因为血液是有机体大多数组织传输分子的传输介质。因此该生物流体可以揭示组织和器官的广谱病理生理学状况。和健康细胞相比,受疾病影响的组织内细胞可以有区别地保护多肽和蛋白质最终将其释放到组织液内并进而释放到血液内。高蛋白含量的血清使其成为多肽组学的目标液体。但是存在于血清内的蛋白质和多肽浓度范围十分广泛,其差别超过10个数量级,高丰度的蛋白质(白蛋白,免疫球蛋白,转铁蛋白,α1抗胰蛋白酶,触珠蛋白)可能妨碍了对低丰度分子的分析。由于血液成分反应整体新陈代谢状态,任何单独器官的病理学改变有可能被遗漏。
已经有了一些使用血清多肽组学用于肿瘤诊断的例子,如对乳腺癌、甲状腺癌等,但大多还需要进一步验证。
脑脊液的多肽组学
脑脊液(CSF)被认为是神经疾病杰出的生物标志物源。脑脊液为大脑神经脉络丛内产生的无色液体,能够提供机械保护,营养供应,废物清除和代谢物传输,CSF也包含许多可以反映中枢神经系统过程的分子。蛋白质组学正在针对CSF的特点进而探索神经变性,神经紊乱,外伤性脑损伤,脑瘤和增龄性条件潜在生物标志物。例如有分析揭示了391个来自91种不同蛋白质的多肽,随后的研究则坚定了626个来自104种蛋白质、小于5000的独新的多肽序列。脑脊液含有较多小分子肽的原因可能是源于血浆的过滤,从而限制了高分子量多肽的进入。
CSF研究一项主要的劣势在于采样程序创口太大,使其不适于做假定健康个体或者神经病理学患者的常规筛查。
唾液多肽组学
唾液是唾液腺(腮腺,下颌下腺和舌下腺)和分布在口腔的分泌其他腺体的主要体液。它能润滑口腔,参与消化和防止感染)。唾液里也会含有细菌,细胞残片,龈沟液和血清成分。作为一种非侵入式采样样品,唾液极具前途。但是蛋白质在进入口腔后立即发生降解,在唾液样品采集后降解仍在进行,该过程导致极大的多肽属性变化。因此对分析的再现性有影响。其他变量如性别,年龄,饮食结构和生物周期节律也在唾液也影响多肽成分的组成。除去以上的劣势,唾液的胰液分析已经用于诸如干燥综合症,口腔干燥和糖尿病在内的多种病理学评估。有报告提出唾液可用于检测口腔癌,检测5种多肽的组合具有90%敏感度和83%特异性。
泪液的多肽组学
泪液是复杂的细胞外液能够用于非侵入性评估。与血浆相似,泪液中蛋白质和多肽的浓度跨越数个量级,其每天之间的变异不大且具有个体特点。泪液多肽组学研究迄今为止描绘了30种内生多肽,其中大多数来源于脯氨酸多肽4,一种功能未知但能产生高浓度泪腺腺泡细胞的多肽。作为一种体液,泪液成分反映潜在组织和器官的病理学状态,并被证明在干眼症,睑板腺功能紊乱和干燥综合症的目镜和系统病理学评估中能够发挥作用。
尿液作为一种生物标志物源的作用
尿液在肾脏中的血浆超滤作用下生成,以排出代谢废物。由于尿液在排出以前储存在膀胱中数小时,内生蛋白酶产生的蛋白质降解已基本完成。由于有多种蛋白酶存在,会形成多种不同内生多肽组合,因此尿液在膀胱内的存留时间具有关键作用。清晨取尿是比较好的,因为可以记录前次排尿与本次排尿之间的时间并加以标准化。除去这些变数,尿液可视为最稳定的体液,尤其与血液相比。我们知道,抽血时和抽血后蛋白酶激活,因此会生成一定量的分解产物,这些产物会使多肽组学及其方法产生误差。
尿液已经被使用了很长时间,不仅用于生物标志物研究,还用于临床诊断研究。主要因为,尿液可以以非侵入的方式大量获得。尿液已用于不少常规分析。例如:尿液儿茶酚胺量测以及代谢物有助于评估嗜铬细胞瘤,同时评估蛋白尿是小球功能的重要指标。
当计划用尿液进行试验时,需要考虑一些因素。尿液有来源于内源或外源影响下造成的日常变化。饮食结构,运动和饮水是影响尿液质量和样品相似度的3个主要因素。尿液不仅包含来自肾脏和膀胱的成分还包括来自其他器官的成分,生理过程可以对其成分的波动产生很大的影响,甚至心血管,自身免疫和感染疾病都会影响到尿中一些蛋白质分子的浓度和存在。
尿液多肽组学
虽然尿液中的蛋白含量并不高,但研究尿中的蛋白质与健康和疾病的关系仍然是蛋白质组学研究中很具吸引力的课题。1997年,Heine等人报告了人类尿液中含有的13种蛋白质。但随着方法学的进展认识不断深入,2004年利用双向电泳识别了1400个蛋白斑点,引入液相色谱法后,点的个数又有增加。Adachi等人在对从健康捐献者处取得尿液中进行研究后声称尿液中至少含有1543种蛋白质。与血浆相比尿液的低蛋白含量降低了高丰度蛋白质掩盖潜在生物标志物的可能性。研究还证明尿液含有高浓缩小分子肽可能由于可能是由于小分子肽易于通过肾小球。
多肽组的检测与分析
样品制备
样品制备是分析的重要一环,需有稳定的标准采样程序。多肽组学集中研究低分子量蛋白,因此在样品制备时可采用超滤等方法富集分子量小于20000的多肽。由于蛋白质组学成分在尿液内相对稳定,一般在室温环境下可储存6小时及或在-20℃储存更长的时间,有报道说可达几年。反复冻融对样品的稳定性不利,因此尽量使用一次解冻的样品。
人类肾脏及尿液蛋白质组国际合作项目(http://www.hkupp.org)及欧洲肾脏及尿液蛋白质组合作(http://www.eurokup.org)都致力于促进肾病及尿液的蛋白质组研究,为各国科学家提供交流的机会与标准化的程序可供参考。
质谱是多肽组学的主要研究手段
质谱是蛋白质组学的主要研究手段,对多肽组学也不例外。双向电泳虽然被广泛应用,但其重现性是很不稳定的,对于分子量在10000以下的多肽更是难以分析。质谱法的优势在于复杂生物样品的识别和定量,有助于促进新型生物诊断方法的发展。不仅对于癌症,同样适用于其他疾病。
最适合进行尿液多肽分析的平台之一是SELDI- TOF和MALDI-TOF,这两种方法特别适合鉴定分子量在1000-20000之间的多肽,固化是分析中的关键步骤。液相色谱-串联质谱法(LC-MS/MS)是另一种对多肽组研究十分重要的手段,能够提供大量高再现性信息并具有良好的重现性,可以提供准确的定量结果。同时在串联质谱上还可以使用MRM技术,直接监测某一靶标分子的母离子和子离子,同时检测多个靶标。除了液相色谱与质谱联用外,毛细管电泳也可以与质谱联用并产生稳定的结果,但是缺点是每次分析的时间太长。
质谱法除了用于发现新的生物标志物外,也可以用在对候选生物标志物的验证和确认。质谱法可以测定蛋白质和多肽的主干结构也可测出对它的修饰。与其他平台相比最具优势之处在于:在不需要预先有知识储备和了解相关病理学条件的前提下,能够定量筛查数以千计的分子。在多肽的定量测定中,通常会使用标记的稳定同位素分子作为内标准。这样能克服样品制备和设备波动期间基质影响和变异的问题。这些同位素标记应该尽早引入到测定流程中增加排除各种因素对测定的干扰。由于不同外界条件(如饮食和饮水)及不同时间采用的尿液其内含物的量会有很大的变化,可以采用定时采样或从24小时收集到的尿中取样,减少饮食和运动影响结果的变异,并可通过测定肌酐等方法进行校正。
数据处理和生物信息学
多肽组学和蛋白质组学要求庞大的计算能力来获取统计学显著数据和再现性数据。多肽识别是最具挑战的技术层面。在线数据库包含众多体液和无数疾病状况的多肽测序结果,可以作为解析、验证备用生物标志物的辅助通用平台。但是应该知道,目前相当大比例的人体尿液蛋白质组学数据库是由肾脏移植和肾脏疾病的评估研究而来,来自前列腺肾脏和膀胱癌的数据以及嗜铬细胞瘤的数据目前还并不多。
多肽组学中一个特殊的问题是肽末端非特异性,这造成在分析结果是大幅增加了需要考虑的序列数量量(可能会增加1000倍之多)。这一点与一般的蛋白质组学不一样,因为蛋白质组学使用了特异性的蛋白酶消化,从而形成特异性的终端。也由于这个原因,多肽组学需要更多地考虑假阳性率。
尿液多肽组学诊断疾病
泌尿生殖器恶性肿瘤是导致癌症死亡人数中在癌症死亡病例中,有1/6的男性和1/10女性是由于泌尿生殖系肿瘤。
卵巢癌
卵巢癌是最致命的妇科肿瘤。当前的诊断策略基于量测血清内糖抗原125(CA125)和阴道超声波检查。但CA125用于早期诊断时缺乏诊断敏感度和特异性,后来又发现了一些可考虑用于作诊断的蛋白质和多,证实可用肽分子,如附睾分泌性蛋白质4和骨桥蛋白,尽管它们没有一个超过CA125。几年前有一项对血清多肽组学研究曾经非常出名,通过分析和识别血清多肽谱来区别非恶性肿瘤和卵巢癌,号称具备100%敏感性和95%特异性,可惜后来被证实无效。
前列腺癌
前列腺癌,男性中最普遍的恶性肿瘤,致死性排名第二。需要具备较高的诊断敏感性和特异性的非侵入性检测标志物。尽管PSA有关的检测及其核糖核酸标志物PAC3(前列腺癌抗原3)在一定程度上提高了诊断的特异性,但是还未能符合预期的要求。使用双向凝胶电泳和MALDI-TOF质谱法指纹技术,还发现了一些可供候选的生物标志,如高亮钙粒蛋白B/MPR8、基质金属蛋白酶和engrailed-2等,但也还都需要进一步验证。在假设首次排空尿液症包含前列腺液的前提下,有报告使用毛细管电泳质谱联用,发现由12种多肽的组合,该报告认为将此组合与PSA合用能改善对前列腺癌的诊断,但也尚在验证中。
膀胱癌
膀胱癌排在西方社会最常见癌症第五位。当前诊断策略基于细胞检查和尿液细胞学。但这些方法在不同的检验者志建之间往往会有不一致的观察结果。。由于尿液从肾脏产出后与膀胱紧密接触,对其蛋白质和多肽生物标志物已做了许多研究,但发现的多肽似乎大多为高含量蛋白质的片段。有工作提出了一种22多肽的组合做为高敏感性和高特异性的尿道恶性肿瘤的诊断指标,特别是血纤维蛋白肽A的潜在诊断意义。另有工作提到8种多肽,他们的浓度变化与肿瘤的是否侵蚀到肌肉层有关,这些多肽多来自白蛋白,血红蛋白和前白蛋白这些高丰度蛋白质。
其他癌症
解剖学上远离尿道的肿瘤也有可能影响到尿液的组成,,例如肺癌和胃肠癌。使用SELDI质谱,有报告属与小钙结合蛋白家族的蛋白S100,该蛋白上消化道系统肿瘤生长相关但需要进一步验证。
多肽组学的临床转化
虽然做了极大的努力,蛋白质组学和多肽组学中尚没有分子进入临床使用。有时候,最初的研究基于小众,显示出统计学显著性,因为患者的选择和其他的混杂因素导致在后续研究中趋于失败。这些经验教训有助于改进未来策略的计划。
近来一种超越经典蛋白质组学和多肽组学的新观点认为,对个别或全部蛋白酶的的研究有可能对疾病的诊断有所帮助,并将其命名为 “功能多肽组学”。其研究基于这样的事实,即肿瘤的进展和侵蚀可能导致蛋白酶的产生和分泌的变化,对它们功能的研究不仅仅反映机体的生理和病理的状态,而且可以克服与分析前变量有关的重演性问题。这种方法仍在其开始阶段,进一步的结果还有待观察。
挑战未来
高通量生物学的骄人增长已经在前一个十年中广受注意,这主要归功于新技术的发展。蛋白质组学的正努力把重点放在在对诊断生物标志物的发现和确认上。深度的生化和病理生理学知识是解决临床问题的关键,程序的每一步必须一丝不苟地进行计划和执行。标准处理程序希望有助于得出有价值的临床和再现性数据。
多肽组学是相对新的领域,虽然目前还没有强大的证据证明多肽组学将产生比蛋白质组学更好的结果,但是生物和化学的理论支持工作正朝着这个方向努力。显而易见,蛋白质组学毫无疑问是基因组后时代的领先技术,而多肽组学则代表着前方未竟的事业和巨大希望。
本文素材部分取自Bauca J.M.等 “Peptidomics of urine and other biofluids for cancer diagnostics”。
编译:检验世界网
审校:姚志建