深度学习人工智能在尿液有形成分 分析中的应用和突破

作者:吴治俭 10230
2021-12-16


【摘要】对尿液有形成分的自动化、智能化快速准确识别一直是临床检验工作中的一大难点。深度学习人工智能擅长处理复杂的分类问题,这种技术应用在尿液有形成分分析中,显著提高了各类有形成分的识别率,并有望实现对亚类粒子的智能识别。


一、深度学习(Deep Learning)人工智能异军突起

近年来,随着计算机处理器的加速迭代和人工智能的技术突飞猛进,一种新的人工智能技术——深度学习异军突起,迅速在复杂数据模型处理、图像分析、声音分析、模糊决策等方面得到了广泛应用,不断刷新相关行业的创新记录。


2016年3月,谷歌旗下深思团队(Deep Mind)开发的围棋人工智能Alphago在韩国首尔以4:1轻松战胜围棋世界冠军李世石九段,瞬间震惊了科技界和围棋界。围棋,这一被誉为人类智力王冠上最璀璨明珠的竞技项目,在深度学习人工智能面前轰然倒下。


以此为标志,深度学习AI开始迅速进入复杂数据模型处理的诸多领域。2019年8月,谷歌在顶级学术期刊《自然·医学》上发表文章,宣布通过给普通显微镜装上人工智能构建的实时增强系统,实现无延迟地圈出病理切片的可疑区域,帮助使用者准确地识别病理特征,对疾病的及时诊断、危险分层以及用药指导具有重要意义。在应用该系统对前列腺样本的检测中,20倍镜下曲线面积达到了0.99,准确率令人惊叹!


二、深度学习人工智能的技术原理

深度学习是通过大量原始数据对卷积神经网络(Convolutional Neural Network,CNN)进行训练,从而获得经验、能力的一种人工智能。深度学习最大的特点就是多层卷积神经网络(Convolutional Neural Network,CNN)、数据扩增(data augmentation)与迁移学习(transfer learning)、过拟合解决(overfitting solution)。

49.png


 多层神经网络是模拟人类大脑对信息的处理结构,通过训练多层神经网络,深层次掌握数据的特征,自主形成分类规则,获得对复杂数据分类的能力。


扩增学习主要是通过对数据的仿射变换、切割、旋转、加噪等手段增加训练集,生成更多训练样本。迁移学习就是举一反三,指一种学习对另一种学习的影响,或习得的经验对完成其他活动的影响,目的是提升对复杂、异常数据的识别能力。


过拟合解决是指在深度学习中,通过增大数据集和降低模型的复杂度等方式,解决拟合过度引起的训练误差(经验误差)和泛化误差,以提升仪器对数据的模糊处理能力和准确度。


三、目前尿液有形成分分析的现状和不足

尿液有形成分的快速、准确识别一直以来是临床检验工作中的难点。人工镜检耗时长、效率低;仪器法图片比对准确度不高,2015年国家食品药品监督管理总局颁布的行业标准YY/T 0996-2015《尿液有形成分分析仪(数字成像自动识别)》中,对红细胞、白细胞、管型的符合率仅要求分别大于等于70%、80%和50%,反映出行业的整体水平仍然不高;有的仪器阳性标本还需要人工镜检复核,操作繁琐费时。尤其对于大型医院检验科而言,迫切需要找到能既快速又准确地进行尿液有形成分识别的办法。


四、深度学习在尿液有形成分分析中的应用

国内研发人员使用通过专家审核鉴定的大量尿液有形成分图片对多层神经网络进行学习和训练,使多层神经网络自主形成对各类有形成分的识别规则。训练中,通过对训练图片进行随机切割、翻转、遮挡、加噪等方法增加训练集,以实现扩增学习和迁移学习。通过降低自建模型的复杂度,解决过拟合过度引起的训练误差和泛化误差,实现了对有形成分的模糊化、智能化识别,有效提升了识别准确率。

50.png

五、深度学习尿液有形成分识别系统的性能验证

研发人员设计实验,对深度学习尿液有形成分识别系统与人工镜检结果进行对比,按照下列公式计算红细胞、白细胞、草酸钙结晶、酵母菌、管型的识别率。

识别率 = T / S × 100%

T —— 所有测试结果单项正确细胞数

S —— 所有测试结果单项细胞总数


具体要求如下:

1、临床样本例数不少于200例,红细胞和白细胞阳性标本各不少于90例、草酸钙结晶和酵母菌阳性标本不少于60例(单个标本多个项目均为阳性时分别各计1例);

2、每天临床比对测试前进行质控液测试,监控仪器运行状态;

3、上机测试前需将样本混匀,避免底部沉渣因为时间过长沉积成垢;

4、在分析仪上测试,记录测试结果;

5、按照人工审核筛查标准审核分析仪的测试结果,并记录。

51.png

通过实验,可以看到深度学习尿液有形成分识别系统对上述粒子识别准确率令人满意,对比国家食品药品监督管理总局2015年颁布的行标YY/T 0996-2015均有大幅提升:

52.png

六、深度学习尿液有形成分识别系统的进化和升级

随着实测数据图片的快速丰富,深度学习尿有形成分识别系统可快速进行迭代升级,进一步提升识别率和准确度。更重要的是,目前难以解决的对亚类粒子的自动化识别,有望在深度学习尿液有形成分识别系统中得到实现。当更多的亚类粒子,比如红细胞管型、白细胞管型、上皮细胞管型、颗粒管型、脂肪管型等的图片快速丰富,多层神经网络可通过对上述图片的学习进一步掌握各亚类管型的识别规则,实现对亚类粒子的自动化识别,极大地解放人力,为临床快速提供更多准确诊断依据。


为保证系统的准确性和稳定性,对多层神经网络的训练只在研发端进行,不在用户端开放,这样做有效避免了因为使用者的不同造成的性能偏差。


七、深度学习尿液有形成分识别系统的产业化现状和展望

目前,已有国内企业实现了深度学习尿液分析系统的产业化,并已投入市场。通过结合鞘流高速拍照技术,检测大通量标本;搭载前后处理系统,实现自动扫描和LIS双工;智能标本分流系统,各检测功能模块化,可根据实验室的空间和对速度的要求进行自由组合和定制,满足大型实验室的对尿液检测流水线的需求。

 

相信随着深度学习人工智能技术的进一步完善,各类实测尿有形成分粒子图片特别是亚类粒子图片的快速累积,对尿液有形成分的全面自动化、智能化快速准确检测一定能在不远的将来得到实现。