从质谱到智谱 —— 历史与未来

作者:北京毅新博创生物科技有限公司 供稿 9817
2021-12-16

摘要:2016年10月,GOOGLE提出了IT技术发展的4个阶段:PC-互联网-移动-人工智能。人工智能自1956年正式提出以来,至2016年ALPHA GO战胜人类围棋冠军李昌镐,IBM WATSON HEALTHCARE获美国医生执照,人工智能技术正在改变整个世界,也必将改变质谱技术,为质谱技术的发展提供新的路线。智谱,将传统质谱与人工智能结合,实验技术方法承接成熟的传统质谱,而实验数据的处理和分析应用近年来飞速发展的人工智能的崭新的、跨学科分析方法。其主要技术指标为谱图稳定性与谱库分辨率。智谱可以智能读取质谱产生的数据并做出判定,实现了效率的极大提升,大量节省了医疗成本,实现医疗资源分配的最优化。智谱相较于传统质谱的优化,使其有望得到广泛应用并解决目前质谱难以解决的临床医学领域的基础问题。


引言:1897年汤姆森实验发现并证明了电子的存在,获得诺贝尔奖,开创了质谱技术的时代。2002年,MALDI和ESI技术同时获得诺贝尔奖,突破了生物大分子质谱分析的难题。过去110年来,质谱技术获得了7个诺贝尔奖,解决了元素分析、小分子分析、大分子分析等科学问题,为人类发展做出了重要贡献,见图1。

61.png

从19世纪末GOLDSTEIN在低压放电实验中观察到正电荷粒子开始,质谱技术的发展经历了漫长的一个世纪,见图2。创新技术的进一步发展正在推动MALDI-TOF迈向更光明的未来,质谱开始应用于生命科学及临床医学领域,用于检测生物多肽组、蛋白组、DNA、RNA等成分,在基础及临床方向对人体健康、疾病等方面的研究中发挥了重要的支持作用。

62.png

质谱的分辨率、灵敏度也从几十发展到几千万,已经逼近技术发展的物理极限。而现今的医学基础与临床研究中,研究者所面对的未知问题越来越多。因此,研究人员需转换思路与研究方向,才能将质谱技术更好地应用于目前日新月异的大数据基础与临床医学研究中,这是质谱在医学研究领域中急需解决的问题。


值得庆幸的是,在“互联网+”的时代,人工智能(AI)、大数据、云计算、物联网技术不断渗入医疗领域和大健康领域,图像识别、深度学习、神经网络等关键技术得到突破,推动了AI与质谱技术相结合。面对海量的质谱数据,AI在图像识别的速度和精度上,具有质的提升。同时,针对质谱检索和解析的复杂性,把AI中的逻辑推理和分析解析过程中的数值计算有机地集成起来,使之较普通的质谱检索系统更为优越,处理性能得到极大改善,具有更强的解决实际问题的能力。笔者相信在不久的将来,AI与质谱技术将走进实验室,迎来商业化浪潮,质谱智能化时代将全面开启。


1. 信息技术(IT)与AI的发展技术特点

1.1 IT

IT是主要用于管理和处理信息所采用的各种技术的总称,应用计算机科学和通信技术来设计、开发、安装和实施信息系统及应用软件。目前,IT的发展日新月异,以物联网与云计算为代表。物联网是新一代IT的重要组成部分,云计算通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的系统。


1.2 AI 

1956年,MCCARTHY在DARTMOUTH学会上正式提出AI的概念,并将其定义为“为研究人类智能活动的规律,构造具有一定智能行为的人工系统”。AI是计算机学科发展的一个重要分支。传统质谱具有一定的局限性。一方面,传统质谱单仪器间无法实现数据相联、共享,从而无法进行实验数据等信息的交换与通信;另一方面,多个质谱仪器的实验数据信息量将会十分庞大,若与人类生物成分信息组库相连则更是如此,传统仪器在处理、分析如此庞大的数据时能力不足。因此,传统质谱进行改变和优化,突破上述两大局限之处,即智谱(IMASS)的创新与优化之处。


2. IMASS

2.1 IMASS简介

IMASS,即将传统质谱与AI结合,实验技术方法承接成熟的传统质谱,而实验数据的处理和分析采用AI的崭新的、跨学科的分析方法。IMASS与传统质谱的对照见表1所示。应用IMASS方法的目的是在医学及生物领域以大、小生物分子组分分析为基础的各类基础和临床问题中,以新的思路应用质谱方法进行研究,解决目前质谱难以解决的问题。

63.png

2.2 IMASS出现的背景

从上文对传统质谱水平发展速度与空间的分析中可以看到,目前传统质谱在延续了几十年的经典研究思路上已经接近发展极限。因此,若希望质谱能在不断涌现的医学和临床问题中发挥不可替代的作用,就必须对质谱进行分析思路的调整、改变与优化。因而,研究者需首先分析发展至今,传统质谱在进行医学、生物研究分析中存在的明显问题,思索改变,优化方法。基于上述背景,笔者提出了IMASS的概念。


2.3 IMASS的优势

(1)IMASS谱图稳定性、谱库分辨率更优

谱图稳定性与谱库分辨率是IMASS的两项重要指标,相对于传统质谱更优化。


谱图稳定性,指同一个样品质谱检测多次所得谱图的一致性。传统质谱多次测试同一个样品,谱图往往难以达到完全一样,变异系数(CV)较大;谱库分辨率,指在质谱数据库的大量谱图中区分两张相似谱图的能力。传统质谱的谱库分辨率有限,一方面是因为谱图的稳定性有限,导致同一样品的谱图CV值较大,相似谱图易混淆;另一方面,传统质谱为单机器操作,所得质谱结果谱图数较为有限,对谱库分辨率的需求也较低。


IMASS将传统质谱与AI算法结合应用,可以很好地解决此类问题。应用传统质谱获得的原始实验数据经强大的智能算法进行有效的数据标准化处理,因所得分析结果变异系数减小而更为稳定,对谱图的分辨率更高,更为精确,有助于研究者解释复杂的临床现象,解决临床与基础医学问题。


(2)IMASS谱图容量更大

因结合了AI算法,IMASS的此项优势较易理解。智能算法以云计算作为方法支持,相较传统质谱有更大的谱图容量,适用于进行大样本分析。目前已有研究者尝试将传统质谱与云计算进行联合,虽然研究有限,但其实验结果显示质谱与云计算的联合使用对于大样本的研究分析十分有益,实验分析结果更为精确,可作为将来质谱调整优化的方向之一。IMASS考虑到并应用了这一点见表1。


(3)IMASS可与人类蛋白组库相连接

传统质谱对于人类多肽、蛋白组分的分析研究结果若与人类蛋白组库的结果进行对比,其准确性有限。IMASS将传统质谱与AI算法联合应用,IMASS与人类蛋白组库相连接,质谱实验所得数据直接由AI算法进行与人类蛋白组库中的蛋白组分数据相比对,效率更高,结果更准确,甚至有望实现谱图到疾病诊断的突破。


3. IMASS的展望

目前,AI算法发展极其迅速,前景广阔,将传统质谱与其联合应用可行性强。IMASS将成为质谱技术发展的里程碑。研究者对质谱的要求从追求高分辨率、高灵敏度到追求高稳定性、高可重复性,从聚焦于单个谱峰的技术指标到关注整个谱图的技术指标,从单台质谱操作到质谱云中心联机,质谱仪从展示质谱图的软件到成为能够解决应用问题的智能操作系统,这些革命性的进步与创新都有赖于IMASS的提出与实现。传统质谱未来若能与阿里云、IBM WATSON等智能算法系统/平台合作,由智能算法系统/平台进行相关算法的开发,应用于质谱获取的实验数据处理、分析,将开创IMASS应用于医学基础和临床领域的新篇章。这是广大医学研究者所期待的,也是传统质谱应用于现今及今后医学基础和临床领域所应做出的改变与优化。


智能辅助诊断系统,一套用药方案、一个数学模型,不光可用在医疗领域,也可能用在其他领域。医疗领域给出的是一个概率——患病或没有患病的概率。在具体的应用场景方面,IMASS可以智能读取质谱产生的数据并且依据质谱数据进行判定,大量节省了医疗成本,解放了医生,且实现了效率的极大提升,改善了用户体验,同时降低医疗成本,实现医疗资源的合理使用,这是IMASS在医疗方面的布局。


(本文摘选自刊登于《国际检验医学杂志》2018年39卷22期质谱专题,参考文献略,详见原文。)


 北京毅新博创生物科技有限公司 供稿