赞
踩
本文介绍了医疗保健领域的深度学习技术,重点讨论了计算机视觉(CV)、自然语言处理(NLP)、强化学习(RL)和通用方法方面的深度学习。我们将描述这些计算技术如何影响医学的几个关键领域,并探讨如何构建端到端系统。我们对CV的讨论主要集中在医学成像上,对NLP的描述主要在电子健康记录数据等领域。同样,在机器人辅助手术的背景下也讨论了RL,同时讨论了通用方法的深度学习在基因组学的应用。
深度学习(Deep learning)是机器学习(ML)的一个子领域,在过去6年里由于计算能力的提高和大规模新数据集的可用性经历了一次戏剧性的复兴。这个领域见证了机器在理解和操作数据方面的惊人进步,包括图像、语言和语音。由于生成的数据量巨大(仅在美国就有150艾字节或1018字节,每年增长48%),以及越来越多的医疗设备和数字记录系统,医疗和医学将从深度学习中受益匪浅。
ML与其他类型的计算机编程的不同之处在于,它使用统计的、数据驱动的规则将算法的输入转换为输出,这些规则自动派生自大量示例,而不是由人工显式指定。从历史上看,构建ML系统需要领域专家和人工工程来设计特征提取器,这些特征提取器将原始数据转换为合适的表示形式,学习算法可以从中检测模式。相反,深度学习是一种表示法学习,在这种学习中,机器得到原始数据,并开发自己的表示法,这是模式识别所需要的表示法,它由多层表示形式组成。这些层通常是按顺序排列的,由大量原始的非线性操作组成,这样一来,一层的表示(从原始数据输入开始)就被输入到下一层,并转换为更抽象的表示。当数据流经系统的各个层时,输入空间会不断地扭曲,直到数据点变得可识别为止(图1a)。用这种方法,可以学习高度复杂的函数。
DL模型能够扩展到大型数据集,部分原因是它们能够在专门的计算硬件上运行,并随着更多的数据不断改进,使它们能够超越许多经典的ML方法。深度学习系统可以接受多种数据类型作为输入,作为异构医疗数据的特定关联的一个方面(图1b)。最常见的模型是使用监督学习进行训练,其中数据集由输入数据点(如皮损图像)和相应的输出数据标签(如良性或恶性)组成。强化学习(RL)是一种通过反复试验或专家演示进行学习的计算代理,随着深度学习的采用而不断发展,在游戏(如Go6)等领域取得了非凡的成就。当学习需要医生的示范时,RL在医疗保健中很有用,例如学习如何缝合机器人辅助手术的伤口1。
图1 DeepLearning. a, 一个简单的多层深度神经网络接受两类数据,用不同的颜色表示,当数据从一层流向另一层时,通过不断迭代地扭曲数据,使它们线性可分。最后一个输出层作为分类器,输出其中一个类的概率。这个例子说明了大型网络使用的基本概念。经同意改编的概念图来自:http://colah.github.io/. b, 例如,大型网络接受各种数据类型(图像、时间序列等)作为输入,并为每种数据类型在其低层塔中学习有用的特性。然后,来自每个塔的数据被合并并流经更高的级别,从而允许DNN跨数据类型执行推理——这一功能在医疗保健中越来越重要。
深度学习的一些最大的成功是在CV领域。CV侧重于图像和视频的理解,处理对象分类、检测和分割等任务,这些任务在确定患者的x线片是否含有恶性肿瘤时非常有用。卷积神经网络(CNNs),一种用于处理具有自然空间不变性的数据的深度学习算法(例如,图像,其含义在翻译时不会改变)已经成为该领域的核心。
例如,医学成像可以从最近在图像分类和目标检测方面的进展中得到很大的好处2。许多研究表明,在皮肤病学(9、10)、放射学(11-14)、眼科(15-17)和病理学(18-21)(图2)的复杂诊断方面,有很好的结果。DL系统可以通过提供第二意见和标记图像中的区域来帮助医生。
在使用基于CNN的方法方面,图像级诊断已经相当成功(图2)。这在很大程度上是由于CNNs在对象分类任务中实现了与人类水平相当的性能,在该任务中,CNN学习对包含在图像中的对象进行分类。通过在大量与目标任务无关的数据集(eg. ImageNet:数百万个日常对象组成的数据集)上训练,再通过与目标任务相关的数据集(eg. 医学图像)进行微调,迁移学习展现出了非常好的效果。在第一步中,该算法利用大量数据来学习图像中的自然统计信息——直线、曲线、颜色等。在第二步中,对算法的higher-level层进行再训练,以区分诊断病例。类似地,目标检测和分割算法识别图像中与特定对象对应的特定部分。CNN方法以图像数据为输入,通过一系列卷积和非线性操作迭代扭曲,直到原始原始数据矩阵转化为潜在图像类(如医学诊断病例)的概率分布(图2)。
图2:医学成像。CNNs可以训练多种医学图像,包括放射学、病理学、皮肤病学和眼科。信息从左到右流动。CNNs使用简单的操作(如卷积、池化和完全连接的层)将输入图像按顺序转换为扁平向量。输出向量(softmax层)的元素表示疾病存在的概率。在训练过程中,对网络层的内部参数进行迭代调整,以提高训练精度。通常,较低的层(左)学习简单的图像特征—边缘和基本形状—这些特征影响高级表示(右)。预测任务包括对图像的分类(即恶性与良性)以及肿瘤等医学特征的定位。
值得注意的是,深度学习模型在各种诊断任务,包括识别痣与和色素瘤、糖尿病性视网膜病变、心血管疾病风险、眼底筛查、X光的乳腺疾病监测和脊髓磁共振图像分析上,都取得了physician-level准确性的。一个单一的深度学习模型甚至被证明在跨医学模式的诊断中是有效的(如放射学和眼科)。
然而,在比较人类和算法性能的研究中,一个关键的限制是缺乏临床背景——它们限制了诊断只能使用手头的图像。这常常增加了人类读者的诊断任务的难度,在真实的临床环境中,他们可以访问医学图像和补充数据,包括患者历史和健康记录、附加测试、患者证词等。
诊所开始对一些紧急且容易漏诊的病例,如在永久性脑损伤发生前的有限时间(几分钟)内,利用放射学图像来标记大脑中的大动脉阻塞,在图像中进行目标检测和分割。此外,癌症组织病理学要求人类专家费力地扫描和诊断十亿像素图像(或相当大的物理幻灯片),可辅以训练有素的CNNs,以检测有丝分裂细胞或肿瘤区域。他们可以通过训练来量化组织病理学图像中PD-L1的含量,这一任务对于确定患者会接受哪种类型的免疫肿瘤药物非常重要。结合像素点分析,CNNs甚至被用来发现与生存概率相关的组织的生物学特征。
为新的医学成像任务构建监督深度学习系统的主要限制是访问足够大的标记数据集。针对特定任务的小型标记数据集更容易收集,但会导致算法在处理新数据时性能较差。在这些情况下,大量数据增强技术已被证明在帮助算法泛化方面是有效的。同样,大型但未标记的数据集也更容易收集,但需要转向改进的半监督和非监督技术,比如生成对抗性网络。
自然语言处理(NLP)侧重于分析文本和语音,从单词中推断意义。递归神经网络(RNNs)的深度学习算法在处理顺序输入(如语言、语音和时间序列数据)方面发挥着重要作用。NLP的显著成功包括机器翻译、文本生成和图像字幕。在医疗保健领域,有序的深度学习和语言技术在电子健康记录(EHRs)等领域的有有效的应用。
电子病历正迅速普及。大型医疗机构的EHR可以在10年内捕获超过1000万名患者的医疗交易。仅一次住院治疗通常就会生成约150,000个数据。这些数据的潜力是显然的。总而言之,这种规模的EHR代表了20万年的医生智慧和1亿年的患者结局数据,涵盖了过多的罕见疾病和疾病。因此,将深度学习方法应用于EHR数据是一个快速发展的领域34。
图3概述了为EHRs构建深度学习系统的技术步骤。原始数据首先跨机构进行聚合,以确保构建了一个可泛化的系统。然后,这些数据被标准化,并在患者之间进行时间和跨患者的分析,这使得它们适合于深度学习培训。由此,我们可以推断出高层次的医学问题的答案,如过去的病史与病人目前的诊断有关吗?,病人目前的问题是什么?,有什么机会进行干预?
图3:使用电子病历进行预测。a,非结构化EHR数据。医疗记录以特殊的数据结构和格式存储,因此基于给定医院记录的模型不一定能处理来自不同医院的数据。b、数据标准化。通过将来自多个站点的数据映射到基于FHIR的单一格式,数据被标准化为同构格式。c,排序。通过将所有数据按时间顺序排列到患者时间表中,基于时间的深度学习技术可以应用于整个EHR数据集,从而对单个患者进行预测。
在进行预测时,迄今为止的大多数工作都是在有限的结构化数据集上使用监督学习,包括实验室结果、生命体征、诊断代码和人口统计数据。为了解释电子病历中包含的结构化和非结构化数据,研究人员开始采用无监督学习方法,如自动编码器——在自动编码器中,网络首先经过训练,通过压缩和重构未标记的数据来学习有用的表示,从而预测特定的诊断5。最近使用深度学习模型对病人病历中发生的结构化事件的时间序列进行CNN和RNN的建模,以预测未来的医疗事件6789。这项工作的大部分集中在重症监护数据的医疗信息集(MIMIC)(如脓毒症的预测),它从一个中心获得重症监护病房(ICU)患者。虽然ICU患者比非ICU患者产生更多的EHR数据,但非ICU患者的EHR数据明显多于非ICU患者。因此,目前还不确定从这些数据中得到的技术将如何推广到更广泛的人群。
下一代的自动语音识别和信息提取模型可能会开发出临床语音助手来准确记录病人的就诊情况。医生们通常在一天11小时的工作里花6个小时处理EHR文件,这会导致精力耗尽,减少与病人相处的时间。自动抄写将缓解这一问题,并促进更廉价的抄写服务。考虑基于RNN的语言翻译,它使用端到端技术将一种语言的语音直接翻译成另一种语言的文本。与EHRs相适应,这种技术可以将患者提供者的对话直接转换为转录文本记录。关键的挑战在于从对话中对每个医疗实体的属性和状态进行分类,同时准确地总结对话。虽然这些技术在早期的人机交互实验中很有前景,但还没有广泛应用于医学实践。
未来的工作可能集中在开发算法,以便更好地利用电子病历中一些信息丰富但非结构化的数据。例如,在开发预测系统时,临床记录常常被省略或修改。在这方面,大型的RNNs开始通过半监督的方式将结构化和非结构化数据结合起来4,并展示出令人印象深刻的预测结果。这种数据组合使他们能够从更广泛的、更多样化的数据类型的流行中学习,在死亡率、再入院率、住院时间和诊断预测等任务上都优于其他技术。
强化学习(RL)是一种旨在训练agent成功地与其环境进行交互的技术,通常是为了实现特定的目标。这种学习可以通过反复试验、演示或混合方法来实现。当一个agent在其环境中采取行动时,奖励和结果的迭代反馈训练使得agent可以更好地完成手头的目标。从专家演示中学习,既可以通过监督学习直接预测专家的行为(即:模仿学习),也可以通过推断专家的目标来实现(即:逆RL)。要成功地训练一个agent,关键是要有一个模型函数,它可以从环境中获取感官信号作为输入,并输出agent接下来要采取的动作。以深度学习模型作为模型函数的Deep RL显示了良好的前景。
一个可以从深度RL获益的医疗领域是机器人辅助手术(RAS)。目前,RAS在很大程度上依赖于一名外科医生指导机器人进行远程操作。深度学习可以通过计算机视觉模型(如CNNs)感知手术环境,通过RL方法学习外科医生的身体动作,增强RAS的鲁棒性和适应性。1011
这些技术支持自动化和速度的高度重复和时间敏感的手术任务,如缝合和打结。例如,计算机视觉技术(如cnn的对象检测/分割和立体观察)可以从图像数据重建开放创面的景观,通过解决路径优化问题来生成缝合或打结轨迹,该问题可以在考虑关节极限和障碍物等外部约束的同时找到最优轨迹12。同样,经过图像训练的RNNs可以通过从外科医生那里学习一系列事件(在本例中是身体动作),学会自主打结13。
这些技术对于全自动机器人手术或微创手术特别有利。考虑一下现代腹腔镜手术(MLS),在这种手术中,几个小的初始阶段被用来将一些仪器插入身体,包括摄像机和手术工具,然后外科医生就可以通过遥控操作了。深度模仿学习、RNNs和轨迹转移算法可以完全自动化手术过程中的某些远程操作任务1。在MLS中,重复任务的自动化甚至比开放式手术的时间要求更严格。例如,在MLS中,打一个结可能需要3分钟,而不是像在开腹手术中那样需要几秒钟。
半自主遥操作的主要挑战之一是在手术场景附近正确定位仪器的位置和方向。在这里,使用改进的U-Net结构CNN14开发的像素级仪器分割技术开始显示出潜力15。外科机器人深度学习的另一个挑战是数据收集。深度模仿学习需要大量的训练数据集,每个手术动作都有很多例子。考虑到许多手术都是细致入微和独特的,因此仍然很难收集足够的数据来完成更泛化的手术任务。此外,自治系统仍然难以适应完全未知和未观察到的情况,这些情况与以前所见的任何情况都非常不同,例如异常的外科事故。
除了CV、NLP和RL任务之外,深度学习还适用于输入数据非常细微且需要专门处理的领域。为了说明起见,这里我们考虑基因组学,在这个示例领域中,深度学习已经超越了传统(例如,基于CNN或RNN)的方法,而用独特的(例如,非图像、非时间)数据表示。
现代基因组技术收集各种各样的测量数据,从个体的DNA序列到血液中各种蛋白质的数量。有很多机会可以通过深度学习来改进分析这些测量数据的方法,这将最终帮助临床医生提供更准确的治疗和诊断。构建基因组学深度学习系统的典型途径包括获取原始数据(如基因表达数据),将这些原始数据转换为输入数据张量,然后通过神经网络将这些张量送入神经网络,为特定的生物医学应用提供动力(图4)。
图4:基因组学中的ML。a、输入数据。基因组数据由实验测量数据组成,从中可以预测某些特性或感兴趣的结果。这些数据通常是多种多样的,可能包括序列、基因表达、功能数据以及其他形式的分子数据。b、数据张量的例子。需要将原始的实验测量数据转换成适合深度学习算法使用的形式,深度学习算法将多维数据张量和相关目标标签作为输入。c、DNN。已标记的张量用于训练神经网络来预测输入数据标签。d、生物医学应用。经过训练的DNNs可用于生物医学应用,如预测以前未见过的数据张量的标签或检查输入数据和输出标签之间的关系。应用示例包括解释实验数据(例如,从测序仪的输出推断DNA序列或推断DNA突变对基因剪接的影响)和分子诊断(例如,预测基因突变对疾病风险或药物反应的影响),以及其他许多应用。
其中一组机会集中在全基因组关联(GWA)研究上,即大型病例对照研究,旨在发现影响特定性状的因果基因突变。分析GWA的研究需要算法可以扩展到非常大的患者群体,并处理潜在的混杂因素。这些挑战可以通过为深度学习开发的优化工具和技术来解决,这些工具和技术包括随机优化和其他现代算法,并结合并行计算的软件框架,以及处理未知混杂因素的建模技术。在不久的将来,将外部模式和额外的生物数据来源整合到GWA研究中的模型,例如医学图像或剪接和其他中间分子表型的测量,也可能从深度学习中受益,从而更准确地识别疾病相关的因果突变。
了解疾病的遗传学使临床医生能够改进治疗并提供更准确的诊断。医生面临的一个关键挑战是确定病人基因组中的新变异是否与医学相关。在某种程度上,这一决定依赖于预先判断突变的致病性,一项已经使用蛋白质结构和进化守恒等特征来训练学习算法的任务。由于深度学习技术具有更强的能力来有效地整合不同的数据类型,因此它很可能提供比现在更准确的致病性预测。
ML还在从遗传数据中预测表型方面发挥作用,包括复杂的特征,如身高和疾病风险。DL可以进一步的通过集成其他模式,如医学图像、临床历史和可穿戴设备数据增强这些模型16。表型预测的一个特别有前途的方法是预测中间分子的表型即基因表达或基因剪接,然后进入下游疾病预测17。由于更大、更接近的信号和更广泛的训练数据,中间分子状态比人类特征更容易预测。这两个特点使得该问题非常适合深度学习,该方法在预测剪接因子和转录因子方面取得了成功18。
基因组数据也可以直接作为疾病发生和发展的生物标志物。例如,血液中含有从身体其他部位的细胞中释放出来的无细胞DNA的小片段。这些碎片是器官排斥(即,免疫系统攻击移植物细胞)、细菌感染和早期癌症的非侵入性指标。无细胞DNA被成功地用于产前诊断:存在于母亲血液中的胎儿DNA表明染色体畸变,可以揭示胎儿的整个基因组。生物标志物的数据往往是嘈杂的,需要复杂的分析(例如,确定无细胞DNA是否表明癌症);深度学习系统可以提高针对DNA序列、甲基化、基因表达、染色质谱和许多其他测量的生物标志物检测的质量。
Yohannes Kassahun, et al. Surgical robotics beyond enhanced dexterity instrumentation: a survey of machine learning techniques and their role in intelligent and autonomous surgical actions. Int. J. Comput. Assist. Radio. Surg. 11, 553–568 (2016). ↩︎ ↩︎
Litjens, G. et al. A survey on deep learning in medical image analysis. Med. Image Anal. 42, 60–88 (2017). ↩︎
Shickel, B., Tighe, P. J., Bihorac, A. & Rashidi, P. Deep EHR: a survey of recent advances in deep learning techniques for electronic health record (EHR) analysis. IEEE J. Biomed. Health Inform. 22, 1589–1604 (2017). ↩︎
Rajkomar, A. et al. Scalable and accurate deep learning with electronic health records. NPJ Digit. Med. 1, 18 (2018). ↩︎ ↩︎
Miotto, R. et al. Deep patient: an unsupervised representation to predict the future of patients from the electronic health records. Sci. Rep.6, 26094 (2016) ↩︎
Liu, V., Kipnis, P., Gould, M. K. & Escobar, G. J. Length of stay predictions: improvements through the use of automated laboratory and comorbidity variables. Med. Care 48, 739–744 (2010). ↩︎
Choi, E. et al. Doctor AI: predicting clinical events via recurrent neural networks. In Machine Learning for Healthcare 301–318 (2016). ↩︎
Che, Z. et al. Recurrent neural networks for multivariate time series with missing values. Rep. 8, 1–12 (2018). ↩︎
Suresh, H. et al. Clinical intervention prediction and understanding with deep neural networks. PMLR 68, 322–377 (2017). ↩︎
Abbeel, P. & Ng, A. Y. Apprenticeship learning via inverse reinforcement learning. In Proceedings of the Twenty-First International Conference on Machine Learning 1 (ACM, 2004). ↩︎
Ratli, N. D., Silver, D. & Bagnell, J. A. Learning to search: functional gradient techniques for imitation learning. Autonomous Robots 27, 25–53 (2009). ↩︎
Schulman, J. et al. A case study of trajectory transfer through non-rigid registration for a simplied suturing scenario. In 2013 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 4111–4117 (IEEE, 2013). ↩︎
Mayer, H.et al. A system for robotic heart surgery that learns to tie knots using recurrent neural networks. Adv. Robot 22, 1521–1537 (2008). ↩︎
Ronneberger, O., Fischer, P. & Brox, T. U-net: Convolutional networks for biomedical image segmentation. In International Conference on Medical Image Computing and Computer-Assisted Intervention (2015). ↩︎
Shvets, A., Rakhlin, A., Kalinin, A. A. and Iglovikov, V. Automatic instrument segmentation in robot-assisted surgery using deep learning. Preprint at https://arxiv.org/abs/1803.01207 (2018). ↩︎
Dudley, J. T. et al. Personalized medicine: from genotypes, molecular phenotypes and the quantied self, towards improved medicine. In Pacic Symposium on Biocomputing 342–346 (2014). ↩︎
Leung, M. K. K., Delong, A., Alipanahi, B. & Frey, B. J. Machine learning in genomic medicine: a review of computational problems and data sets. Proc. IEEE 104, 176–197 (2016). ↩︎
Xiong, H. Y. et al. e human splicing code reveals new insights into the genetic determinants of disease. Science 347, 1254806 (2015). ↩︎
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。