机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它是人工智能核心,是使计算机具有智能的根本途径。下面我们就为大家介绍几篇关于机器学习论文范文,供给大家参考。
机器学习论文范文第一篇:机器学习算法在脑卒中诊治中的应用现状及展望
作者:武胜勇 何倩 郭轶斌 吴骋
作者单位:海军军医大学卫生勤务学系军事卫生统计学教研室
世界卫生组织统计表明,目前脑卒中已在全球死亡原因中跃升至第二位[1].据美国心脏协会(American Heart Association, AHA)统计,在美国,脑卒中是死亡的第五大原因,每年有79.5万美国人经历一次新的或复发性脑卒中[2].而在中国,脑血管疾病已成为排名第三的死亡原因,对脑卒中防治的重要性已成为业内共识[3].脑卒中发病的原因涉及先天遗传因素、后天影响因素[4]等,同时也受诸多不可控事件的影响,故其发病过程具有较大的异质性[5].因此,迫切需要在脑卒中的预防和治疗过程中,通过简化医疗操作过程和改进诊疗技术来解决其治疗过程中产生的诸多复杂问题,降低不断上升的医疗成本[6,7].
近年来随着生物医学研究的发展,对于脑卒中的研究日益深入,在基于"组学"数据[8,9]、实时风险预测等方面的研究对统计学工具的要求不断提高。传统统计学方法对这些高维、海量、结构复杂的大数据集分析效果并不理想,同时面对真实世界中取样异质性低、缺失值多、复杂程度高等问题,也难以找到合适的处理方式[10].机器学习(machine learning, ML)主要研究如何使计算机通过实验从数据中学习,是预测分析的一项主要内容[11],作为传统统计学方法的补充,目前医学研究中采用机器学习的趋势日益明显。
围绕机器学习在脑卒中研究方面的应用,本文综述了支持向量机、随机森林及深度学习方法,描述了其主要思想,分析了其优点和不足,以期对机器学习未来在脑卒中患者诊疗中的应用起到一定助力作用。
机器学习算法与传统预测模型的比较
由于脑卒中发病位置的特殊性,导致其对身体各个部位的影响范围、程度都远超其他疾病,故即使是具有丰富经验的临床医师也很难对其各方面预后做出准确评估。一般认为初始运动障碍和皮质运动系统缺陷较少的患者治疗结束后可能有更好的运动能力,在实际预后评估中,这些普遍被接受的相关性并不总是正确[12].因为在脑卒中患者病情进展中,其影响因素包括各类临床特征、后续治疗甚至患者发病前后的生活习惯等[13],但由于这类特征数据类型多、数据量大,使得这些复杂的相互作用很难使用传统模型进行评估。机器学习模型能够模拟复杂系统的结果,具有传统统计学模型不具有的优势,对比见表1.
表1 传统和机器学习模型比较
鉴于机器学习方法相较传统预测模型的诸多优点,目前研究已证实了使用机器学习方法预测卒中结局的预后模型能够取得较准确的结果[14,15].机器学习算法能够帮助医生做出更好的临床决策,为患者赢得更好的生活质量和预期寿命[16].
常用机器学习算法及其在脑卒中诊治中的应用案例
1.支持向量机
支持向量机(support vector machine, SVM)是通过将数据升维,映射到一个更高维的特征空间里,在高维空间里建立最大间隔的超平面,通过对支持向量的训练,对特征空间进行划分得到最优超平面,从而将非线性的分类问题,转变为线性分类的机器学习方法。其对多变且具有较强时间性的分类问题具有较大优势[17],目前已在医学领域取得较广泛的应用[18].SVM的主要优势在于其利用核函数向高维空间进行非线性映射,理论基础较为明确。同时,SVM对数据的预测主要基于少数支持向量,从而对样本进行筛选,不仅简化了算法,避免了算法过度复杂可能带来的过拟合风险;同时也可以对训练集中的样本进行筛选,抓住关键样本,即研究对象的关键特征。
国内张丽娜等,分别通过使用SVM和logistic回归方法对急性出血性脑卒中早期预后进行预测,并对所建立的模型进行比较,证实了SVM在灵敏度、特异度、准确率及Youden指数等方面均优于传统的logistic回归[19].SVM在小样本中的表现也明显优于传统方法。Asadi等开发了一个基于二分法的Rankin修订量表评分(mRS)模型,采用SVM基于一个107例的数据集,使预测精确度达到了70%[20].Bentley等利用116例急性缺血性脑卒中患者的CT脑图像建立了SVM模型,用以识别具有症状性颅内出血风险的急性缺血性脑卒中患者,预测模型的AUC达到了0.744[21].
但SVM也存在较明显的不足,首先就是对大样本数据的训练难以进行,当样本量较大时,将耗费大量的机器内存和运算时间,且无法达到所期望的效果。Heo等以2923名急性缺血性中风患者为研究对象,建立了基于机器学习的模型,发现基于SVM的模型AUC为0.836,基于logistic回归模型AUC为0.842[22],SVM并不具有优势。
此外,SVM的经典算法只能解决二分类问题,然而实际问题中纯粹的二分类问题较少。对于多分类问题,SVM主要使用一对多组合模式、一对一组合模式及SVM决策树进行解决,或通过构造多个分类器的组合来将多分类问题进行转换,对于分类较少的问题效果较好,但对于分类较多的问题易出现分类重叠现象、不可分类现象等,同时运算量也将大幅度增加,随着目前硬件水平的不断提高,相关研究目前也在不断深入。
2.随机森林
随机森林(random forests, RF)是以决策树(decision tree)为基础发展而来的一类高级集成学习方法。决策树是指通过数据之间的相似性对数据进行分类,并将分类的依据设定为节点。决策树最大的优势就是将一个复杂的决定,转化为一系列简单的决定,将一个复杂的问题转化为一系列简单的问题,从而使这一复杂问题得到解决[23,24].随机森林就是用随机的方式构建多个决策树,并对所有决策树的结果进行集成,将众数确定为最终的输出值。
区别于SVM等二进制分类器算法,随机森林本质上是一个多标签分类器,使研究者可以直接通过算法对不同组进行分类,而不需要首先寻找方法将不同类的分组合并在一起(如前文所述的建立多个SVM解决多分类问题)再进行分类[25].因此,在多分类问题上,随机森林的表现优于SVM等二进制分类器[26].其次,随机森林可以有效地处理数据量大且维度高的数据集,并能够在训练结束后将重要特征自动进行总结,不需要在训练前对特征进行筛选。
Jung-Gyu Yoon等一项针对韩国脑卒中患者一般情况与卒中后性功能变化的研究使用随机森林算法,取得了较好的结果[27].文天才等根据卒中相关因素、脑卒中患者所处医疗环境及患者家庭情况等方面,采用随机森林模型对患者31天内非计划再入院的危险因素进行了分析,利用随机森林方法综合考虑各因素对结局变量的影响并进行重要性评分,取得了较好的效果[28].
随机森林也存在一些不足,如最大叶节点数(max leaf nodes)的设定,如果节点过少,会导致拟合不足;如果过多,甚至不对最大叶结点数进行限定,则容易导致过拟合,使模型难以泛化。目前主要采用每棵树都使用一个训练样本子集和一个随机选择的特征子集进行训练,之后将这些单独训练的子集组合在一起,从而提高模型的泛化能力[29].另外就是采用剪枝处理,主要分为预剪枝和后剪枝[30].预剪枝主要是指在训练中对节点划分前后的泛化性进行评估,如果此节点不能提升泛化性,则将此节点标记为叶节点,通过这种方法对节点进行筛选,降低过拟合的风险,也在一定程度上降低了训练所需的计算量,但可能会导致欠拟合;后剪枝则是在决策树训练结束后,对训练出的非叶节点泛化性进行验证,从而选择是否将子树替换成叶节点,后剪枝训练出的模型一般会保留更多的节点,同时其拟合程度也会更高,但其需要的算力也远高于预剪枝[31].
如前文所述,Heo等的研究中,其随机森林模型就出现了过拟合以至于泛化水平下降的现象,在测试集中,随机森林模型的AUC为0.810,而logistic回归模型达到了0.842[22].此外,随机森林还存在运算量较大等问题,但随着计算能力和相关研究的不断进展,问题正在逐步解决。
3.深度学习
深度学习(deep learning),是目前应用最广泛的一类机器学习算法,其主要原理是通过构造多层(通常大于3层)人工神经网络来模拟大脑运行的方式,实现识别、分类、预测等功能[32].
人工神经网络(artificial neural network, ANN),简称神经网络(neural network, NN),可以被认为是机器学习的一个扩展,其善于捕获输入变量和输出变量之间复杂的非线性关系,可以解决传统统计分析的一些限制。在神经网络中,结果和输入变量的关联是使用一个或多个隐含层进行计算的,每个隐含层包含一系列的算法(节点),其从前一节点获取信息并输出新的数据为下一节点提供数据,这一过程类似于大脑的学习过程,因此称为神经网络。其可以运用大型标注数据集,对节点和隐含层进行迭代训练(数千到数百万次迭代)以对算法特征进行调整(如超参数等),从而得到最佳的预测模型[33].
前文所述Heo等人进行的研究,采用ANN模型所得出的算法,其AUC为0.888,优于基于SVM、随机森林及传统logistic分析所得出的模型[22].谭英等分别利用ANN模型和logistic回归,通过对474 患者基本情况、实验室检查结果及就诊医院等其他相关因素进行分析,建立了预测模型;代入115例测试样本后,其中隐层节点定义为9的ANN算法在准确率、灵敏度、约登指数上均优于logistic回归模型,其AUC为0.787,高于logistic回归模型的0.729[34].
但深度学习对数据的分析一般采用非线性处理,且其过程中会经过多层神经网络处理,运算过程作为一个"黑箱",其运算量大,同时很难对结果进行解释。在样本量不足的情况下,深度学习的过拟合现象严重,这也导致了自上个世纪八十年代神经网络算法出现后,一直未受到广泛的应用,直到近几年才开始频繁出现在人们视野中[5].随着当前大数据技术的兴起,数据量在不断扩大;同时算法的革新,使得神经网络过拟合的问题正在逐步被解决;硬件的发展,也使得算力有了大幅度的提升,解决了以上问题后,以神经网络算法为基础的深度学习迅速发展起来,目前在科研中广泛应用。
讨 论
机器学习为解决当前脑卒中诊疗过程中存在的问题提供了新的思路,但其并非是一个完美的解决方案,仍存在以下问题和局限性。
1.结果缺乏可理解性:
传统统计学方法中,对于输入值的每一步处理都具有相对明确而简单的关系。而绝大多数机器学习算法被认为是"黑箱",尤其是深度学习,复杂的网状结构和庞大的参数及超参数数量保证了运算的准确性,也使得输入值和输出值之间的关系难以解释。
2.对数据量要求较大:
正如前文所述深度学习在创造之初不能被广泛应用的情况相同,机器学习做出的预测模型需要不断使用大量医疗数据进行训练以保证其持续有效。但当前的医疗环境并不利于医疗数据的高效共享,目前正在对其进行改革以促进医疗信息交换的可行性并加强对此类交换的监管[35,36],希望在今后的发展中逐步解决这一问题。
3.临床效果有待验证:
对算法最终的评价标准并不应该是这些理论上的准确性,而应是这些工具能够多大程度上辅助临床实践。临床效果的大小不仅取决于这些预测模型的准确程度,同时也取决于在这些临床实践中,怎样安全有效地使用这些工具,以使其最终为患者发挥有益作用。目前这类工具在临床上的研究和应用仍处于起步阶段,未来几十年的应用将证实机器学习能否为临床实践提供有益的帮助。
4.相关知识普及不够:
目前机器学习正在飞速发展,但多数医疗人员对其了解并不深入,在临床应用中也不够专业。随着机器学习融入日常医学实践的进程不断推进,我们应该推荐医疗人员接受相关训练,从而更好地分析、整合信息并在相关算法的辅助下做出临床决策。因此,在可预见的未来,医学的发展需要对相关从业者进行技术、方法、数据科学背景知识和预测分析伦理学问题等方面的培训。
5.伦理问题逐渐凸显:
随着机器学习的广泛应用,其为传统临床科研带来的变化也逐步涉及伦理问题,并带来一系列难以解决且复杂的伦理困境。关于患者隐私、数据歧视等伦理问题已经显而易见。同时,算法应用中出现误判带来的损失由谁承担等一系列问题,在将来的研究和临床实践中会逐渐凸显出来[37].在机器学习应用的其他领域,伦理学的挑战已经较为明显,故我们需要在生物伦理学上做进一步研究以促进机器学习可持续发展和应用[35],脸书和剑桥分析的失败就是对临床相关机器学习以及预测分析的一个重要提醒。如今的医疗设备和可穿戴设备几乎可以收集人类行为的所有数据,因此这些数据可以创建每个个体独特的"数据指纹",并对其之后的行为进行预测,这就难免会对患者的隐私有一定的侵犯。更重要的是,它可以不断地将个体"推到"预设的行为路径上去,使人做出规定的行为,这一问题显然已经超出了当前伦理问题的范畴[33].因此,一些倡导者呼吁研究人员和机构尽快探讨和采用新的人工智能和机器学习道德准则,避免因为伦理学问题损害患者利益。
展 望
在应用中最大的障碍之一,是当前机器学习算法的复杂性,使得不具备Python或其他编程语言技能等相关计算机科学知识的医疗人员,很难理解并加以应用。近几年,随着相关研究的深入,不少医疗工作者开始学习相关知识,同时,机器学习社区也正在努力设计更简易的机器学习工具(如Keras或Lasagne等简单接口),使其对研究者的编程能力要求更低,而基于用户界面的图形工具(如英伟达公司的DIGITS深度学习工具),可以使不具备编程语言基础的用户实现深度学习的基本功能,更加降低了机器学习的入门门槛。
由于篇幅原因,还有一些已有应用的机器学习算法,如朴素贝叶斯分类器[38]、算法梯度提升树[39]等,未能做详细描述,有兴趣的读者可参阅相关文献。目前机器学习已广泛应用于脑卒中的诊疗过程中,并在疾病诊断、趋势预测等方面取得了较好的成绩。未来的医学研究,将会更加注重多种来源数据的整合分析,其数据量更大、数据结构更复杂,从而导致对分析方法的要求也更高。机器学习在处理这些类型数据中具备传统统计学方法不具备的优势,正逐步成为医疗科研中不可或缺的一部分,未来也将在脑卒中防治领域发挥更大的作用。
参考文献
[1] Global Burden of Disease Study 2013 Collaborators. Global,regional,and national incidence, prevalence , and years lived with disability for 301 acute and Chronic diseases and injuries in 188 countries, 1990-2013:a systematic analysis for the Global Burden of Disease Study 2013.Lancet,2015,386(9995):743-80.
[2] Emelia B,Salim V,Cliton C,et al. Correction to:Heart Disease and Stroke Statistics- 2018 Update:A Report From the American Heart Association.Circulation,2018,137(12):e493.
[3]孙海欣,王文志中国60万人群脑血管病流行病学抽样调查报告中国现代神经疾病杂志, 2018, 18(2):83-88.
[4]宋伟才,吴建盘,李杨,等脑卒中发病与年龄、职业、时间、气候等方面关系的统计分析中国卫生统计, 2014,31(4):648-650.
[5] Chayakrit K,Hongju Z,Zhen W,et al.Artificial Intelligence in Precision Cardiovascular Medicine J Am Coll Cardiol,2017 ,69(21):2657-2664.
[6] Haris K,Victor L,Sunil S .Machine Learning in Acute Ischemic Stroke Neuroimaging.Front Neurol,2018,9:945.
[7]潘群,王丽琼脑卒中高危人群实施健康管理效果评价分析中国卫生统计, 2017 ,34(3):443-444.
[8] Kumardeep C,Olivier P,Liangqun L.et al. Deep Learning-Based Multi-Omics Integration Robustly Predicts Survival in Liver Cancer.Clinical Cancer Research,2018,24(6):clincanres. 0853 .2017.
[9] Bin Z,Nan s,Ronglai S,et al.Integrating Clinical and Multiple Omics Data for Prognostic Assessment across Human Cancers,2017.7(1):16954.
[10] Daniele R,Charence W,Fani D.et al.Deep Learning for Health Informatics. IEEE Journal of Biomedical & Health Informatics 2017,21(1):4-21.
[11] Rahul D.Machine Learning in Medicine .Circulation,2015,132(20):1920-1930.
[12] Bokkyu K,Carolee W.Can Neurological Biomarkers of Brain Impairment Be Used to Predict Poststroke Motor Recovery?A Systematic Review. Neurorehabil Neural Repair,2017,31(1):3-24.
[13]李浩,陈绯,高青,等。心理护理综合干预对脑卒中患者生命质量及主观幸福感的影响中国卫生统计, 2017,34(5):741-744.
[14] Chingheng L,Kaicheng H.,Kory J,et al. Evaluation of machine learning methods to stroke outcome prediction using a nationwide disease registry.ComputMethods Programs Biomed,2020, 190: 105381.
[15] Kalung C.Xinyi L.Wei Z.et al. Early Identific ation of High-Risk TIA or Minor Stroke Using Artificial Neural Network.Front Neurol,2019,10:171.
[16] King H,William s,Haoyue Z.et al.A Machine Learning Approach for Classifying Ischemic Stroke Onset Time From Imaging.EEE Trans Med Imaging,2019,38(7):1666-1676.
[17] Konstantina K, Themis E.Konstantinos E, et al.Machine learning applications in cancer prognosis and prediction.Comput Struct Biotechnol J,2015,13:8-17[18] Andrew H,Omar E,Rebecca M.et al.A support vector machine for predicting defirillation outc omes from waveform metrics. Resuscitation,2014,85(3):343-349.
[19]张丽娜,李国春,周学平,等基于支持向量机的急性出血性脑卒中早期预后模型的建立与评价南京医科大学学报(自然科学版),2016,36(1):80-84.
[20] Hamed A,Richard D,Bernard Y,et al.Machine learning for outcome prediction of acute ischemic stroke post intra-arterial therapy.PLoS One,2014,9(2)-e88225.
[21] Paul B,Jeban G,Anoma J,et al.Prediction of stroke thrombolysis outcome using CT brain machine learning.Neuroimage Clin,2014,4:635-640.
[22] Paul B,Jeban G .Anoma J,et al.Machine Learning-Based Model for Prediction of Outcomes in Acute Stroke Stroke ,2019,50(5): 1263-1265.
[23] Vera H.Henrik N,Julia H,et al.A Novel Easy-to-Use Prediction Scheme for Upper Gastrointestinal Bleeding:Cologne-WATCH(C-WATCH)Risk Score.Medicine(Baltimore),2015,94(38):e1614.
[24]郭长满,郭敏,刘媛媛,等机器学习算法在预测男男性行为人群中HIV感染的应用中国卫生统计, 2019,36(1):28-31,35.
[25] Li W,Yaozong G,Feng S,et al.LINKS:learning-based multi-source IntegratioN frameworK for Segmentation of infant brain images Neuroimage,2015,108:160-172.
[26] Anna B,Andrew Z,Xavier M.lmage Classific ation using Random Forests and Ferns.IEEE 11th International Conference on Computer Vision,ICCV 2007,Rio de Janeiro, Brazil,October 14-20,2007.
[27] Junggyu Y,Neda Z,Sang S. Interrelationship between the general characteristics of Korean stroke patients and the variables of the sexual functions.random forest and boosting algorithm.J Phys Ther Sci,2017,29(4):613-617.
[28]文天才,刘保延, 张艳宁缺血性脑卒中患者31天内非计划性再入院风险因素研究:随机森林模型中国循证医学杂志,2019,19(5):532-538.
[29] Antonio C,Jamie S,Ender K. Decision Forests:A Unified Framework for Classific ation,Regression,Density Estimation,Manifold Learning and Semi-Supervised Learning.Foundations & Trends in Computer Graphics & Vision,2012.7(2-3):81-227.
[30]徐继伟,杨云集成学习方法:研究综述云南大学学报(自然科学版),2018,40(6):36-46.
[31]陈伽洛,陈龙然决策树与随机森林。信息与电脑(理论版)。2019,17:43-45.
[32] Mir H,Gillian S, Pavel H,et al.Machine Learning Approaches in Cardiovascular Imaging.Circ Cardiovasc Imaging,2017, 10(10):e005614.
[33] Hamidreza S,Melek S, Gary R,et al.Predictive analytics and mac hine learning in stroke and neurovascular medicine. Neurol Res ,2019,41(8):681-690.
[34]谭英,耿德勤,黄水平用人工神经网络建立缺血性脑卒中复发的预测模型中国卫生统计, 2013,30(5):687-689.
[35] Danton C,Nigam S,David M.lmplementing Machine Learning in Health Care - Addressing Ethical Challenges .N Engl J Med,2018,378(11):981-983.
[36] Howard B,Robert G,Phil F.Data Sharing:An Ethical and Scientic Imperative .JAMA,2016,315(12):1237-1239.
[37] Eunjae L,Yonghwan K,Namkug K.et al. Deep into the Brain:Artificial Inelligence in Stroke Imaging.J Stroke,2017.19(3):277-285.
[38]葛金卓,彭雪楠,赵春华,等基于贝叶斯多水平模型的平均血糖构建与应用。卫生研究, 2019.48(4):664-667.
[39]巩晓文,凤思苑,崔壮,等。基于SVGD分类预测的梯度提升机与随机森林的性能比较中国卫生统计, 2019,36(5):674-677.
文献来源:武胜勇,何倩,郭轶斌,吴骋。机器学习算法在脑卒中诊治中的应用现状及展望[J].中国卫生统计,2021,38(03):464-467.
机器学习论文范文第二篇:机器学习CNN模型在心血管疾病诊疗中的临床应用及研究进展
作者:艾克力亚尔·艾尼瓦尔 马翔
作者单位:新疆医科大学研究生院 新疆医科大学第一附属医院
摘要:近年来随着计算机技术的发展,机器学习领域的发展越来越迅速,因其具有模仿人脑解释数据的功能,借助计算机强大的整合数据的能力,被广泛地应用于临床,为疾病的诊断、预后分析、诊疗决策的制定等方面提供了方便。现简要概述用于构建推论和预测数据驱动的CNN模型在心血管疾病诊疗中的临床应用及研究进展,分析该模型在心血管疾病应用上的优势以及不足。
Abstract:In recent years,with the development of computer technology,the field of machine learning is developing more and more rapidly.With the function of imitating human brain to interpret data and the powerful ability of computer to integrate data,machine learning has been widely used in clinical practice,which provides convenience for prognosis analysis,diagnosis and treatment of diseases. In this review,we briefly summarized the clinical application and research progress of the machine learning CNN model used to construct inference and prediction data-driven model in the diagnosis and treatment of cardiovascular diseases,and analyzed its advantages and disadvantages in the application of cardiovascular diseases.
Keyword:Machine learning; Deep learning; Convolutional neural network; Cardiovascular diseases;
人工智能自20世纪60年代提出以来,发展迅速,机器学习作为实现人工智能的方法,用来解析和学习数据,通过算法完成数据整合任务。深度学习是目前最前沿的机器学习模型,其独有的自动提取特征的特点,使人工算法为临床所用。中国心血管疾病人群庞大,临床医生数量缺口大,往往无法满足患者就医需求,因此机器学习被应用到心血管疾病诊疗中。
1 机器学习
1.1 机器学习概述
机器学习近年来被广泛应用在临床诊疗中。深度学习属于机器学习的一种,通过"黑匣子"[1]自动学习数据的特征和关系,在阅读医学图像数据,诊断疾病及疾病危险分层等方面具有巨大潜力[2,3].
机器学习通过组成简单但非线性的模块来获得,每个模块将一个层次的信息转换为一个更高、稍微抽象的层次的表示。在临床常应用的模型是卷积神经网络(convolutional neural network,CNN)模型[4,5],应用于X射线、CT、MRI和超声心动图等影像学检查,也可用于心电图的辅助诊断[6,7,8,9].其识别图像的基本步骤为:识别图像特征,图像分类,对图像进行分割,评估图像形态结构的测量和量化、识别图像[10].
1.2 CNN
CNN是一类指导学习网络,可以自主感知输入与输出之间的映射关系,从而分析和处理数据[11].为了建立CNN模型,需要收集大量临床信息、影像学资料和随访资料,并根据资料特征分类。以影像学资料为例,在训练过程中(见图1),CNN[4]模型首先会看到一幅图像即输入层,计算机理解为输入若干个矩阵,会把图片光栅化,以像素形式存在,并以分数向量的形式输出结果,进入卷积层,通过多个可训练的滤波器和加权偏置进行卷积,卷积后进入池化层产生若干个映射图,特征映射图中每组多个像素进行求和、加权值和加偏置,紧接着通过一个函数得到多个下一层的特征映射,并通过与上一层相同的方法产生下一层映射,每一层都可提取上一层的局部特征,局部特征的确定意味着两层间关系的确立,最终通过特定排列检测图像边缘,将图案组合匹配更大的图案组合得到输出结果[12].卷积层与池化层的组合可以在隐藏层出现很多次,出现次数是根据模型的需要而来的。选取的函数是根据对默认参数和二进制交叉熵的要求来进行选定,常用函数有RELU函数和sigmoid函数等。最后一次池化结束后,进入全连接层,将分布式特征映射到样本标记空间,实现对图形分类并输出结果。以上就是CNN模型对影像学资料深度学习的基本流程,对于临床资料的学习,可省去图片光栅化的过程,后面的流程与影像学资料学习过程一致。
图1 CNN模型示意图
2 在心血管疾病方面的应用
2.1 在辅助检查的应用
2.1.1 CT
CT在临床上常用于先天性心脏病、主动脉夹层和冠心病等的诊断,然而主要为二维成像,且心脏具有特殊结构,导致CT扫描无法显示清楚,对临床诊断造成干扰。Tatsugami等[13]通过深度学习混合迭代重建方法改善冠状动脉CT血管成像图像质量,Bruns等[14]使用深度学习模型,在冠状动脉CT血管成像中进行全心分割,量化心脏测量结果。深度学习模型通过训练大数据,对图片上极小的像素位置差异进行识别,也可优化影像学资料,为疾病的诊断提供极大的帮助。
2.1.2 超声心动图
超声心动图是利用超声技术获取心脏及其周围结构的高时空分辨率图像,然而心脏的结构复杂,图像固有的斑点噪声,超声图像相位及心脏轮廓模糊等因素,为临床诊疗带来不便。CNN模型可对超声心动图进行合适的分割[15],自动测量左室射血分数,对心尖二腔切面和心尖四腔切面进行准确分割,并可识别节段性室壁运动异常[16],且判读能力优于低年资医生,并达到专家水平。该模型[17]甚至可以通过超声心动图自动检测肥厚型心肌病、心脏淀粉样变和肺动脉高压(见表1)。
2.1.3 心电图
心电图是一种常用诊断心血管疾病的工具,但偶尔会发生漏读或误读[18].近年来,不少研究通过深度学习模型阅读心电图[19].心电图的自动分析依赖于两阶段的方法,首先需要人根据原始心电数据提取特征[20],然后部署决策规则或其他机器学习方法来生成最终结果。心电图还具有容易受干扰的特点,因此去噪成为了深度学习所要克服的另一大难题。Zhao等[21]采用了一种广泛应用的深度学习技术来进行心电去噪。除此之外,心电图具有一维图像的特点,分类常用的CNN有两种:一维CNN[22]和二维CNN[23].这些模型可以做到心律失常的检测[24,25]和分析ST段的变化[26].深度学习模型擅长阅读二维的图片如CT和MRI等,由于心电图的特殊性,往往需要必要的手段对图片进行加工或使用专用模型才能阅读。由于这些因素的限制,目前的手段只能让深度学习模型阅读简单的心电图结果,随着计算机科学的发展,在不久的将来会出现适合阅读复杂心电图的深度学习模型。
表1 CNN模型辅助检查利用
2.2 在心血管疾病危险分层的应用
在日常对心血管疾病的诊疗过程中,对心血管疾病的危险分层尤为重要,临床上常使用TIMI评分、GRACE评分及ACTION评分,然而传统评分过分依赖于实验室指标,往往无法早期评估病情[27].心血管疾病治疗方法的发展,以及新的心血管药物的出现对心血管疾病的危险分层带来新的挑战,因此,借助深度学习模型探索心血管疾病危险分层的新方法成为近年来的热点(见表2)。Kwon等[28]对急性心肌梗死患者的数据进行分析,使用CNN模型对其危险度进行分层(DAMI评分)的表现与GRACE评分、ACTION评分以及TIMI评分进行了比较。结果发现模型评估ST段抬高心肌梗死和非ST段抬高心肌梗死危险分层的能力明显优于这三种评分。除此之外,在6个月的随访中,由DAMI定义的高危组的死亡率显著高于低危组。Huo等[29]提出了一个机器学习模型,通过分类分析将以往确诊和误诊的主动脉夹层进行分类,可帮助医师快速发现所有误诊的主动脉夹层阳性患者,评估入院后病情进展。通过对实际病例数据的训练,该预测模型可以确定患者的优先等级。深度学习参与对心血管疾病危险分层准确性更高,但在一定程度上依赖于心血管医生对患者临床信息的掌握,准确及全面的疾病信息可以使深度学习模型发挥出更好的作用。传统评分已通过大量临床病例考验并沿用至今,深度学习模型病例数较少,还需要大量临床实践验证其临床实用性。
表2 疾病风险估计及预后预测
2.3 在评估心血管疾病预后的应用
心血管疾病一级预防的关键策略是"预测",以往用来预测心血管疾病的手段甚少,常用的心血管疾病预测手段也并非十分准确[30].深度学习模型可以发现临床医生无法察觉的细微病情变化,并使用大数据模型很好地预测病情。Wu等[31]收集了急诊就诊的胸痛患者的数据,建立一个深度学习模型来预测患者的非ST段抬高心肌梗死。Kwon团队[32]借助深度学习模型对心力衰竭患者进行预后分析的一项研究发现,与现有的风险评分和其他机器学习模型相比,他们的这个模型能更准确地预测急性心力衰竭患者的住院和长期死亡率。Zack等[33]为了确定深度学习模型是否可以更好地预测经皮冠状动脉介入治疗后存在死亡或充血性心力衰竭再住院风险,评估了11 709例不同的患者,研究发现深度学习模型具有更好的预测能力。Commandeur等[34]在一项前瞻性研究中用CNN模型评估了心外膜脂肪组织,评估冠状动脉钙化分数,并纳入了必要的临床指标,将这些临床资料用来训练机器学习模型,用模型给受试者评分,将得分与动脉粥样硬化风险评分相比较,发现机器学习评分有更好的预测能力。心血管疾病具有发病迅猛的特点,因此通过心血管疾病危险因素预测心血管疾病的发生尤为重要,以往只能通过疾病危险因素来判断疾病发生的可能性,将深度学习模型引用到疾病预测的手段当中,可以量化疾病风险,甚至可以提前发现最危险因素,并在未病阶段进行有效干预,为疾病治疗赢取时间。然而,深度学习模型需要依赖检查结果,无法像人那样仅根据临床表现对疾病预后进行评估,该模型目前阶段仅适用于可以完善初期检查的病情变化较缓慢的疾病。
3 总结与展望
使用机器学习模型对各类心血管疾病的诊断以及评估是一种非常客观的方法,在模型训练准确的情况下,不会出现因评估医生能力不同而产生误差的情况,且这类模型对各种辅助检查图像的改善、图像的解读、心电图的阅读具有优秀表现。模型对疾病轻重缓急可以进行迅速评估,准确度普遍高于传统的评分标准,为临床治疗赢取时间。模型还可以减少临床医生的负担,提升基层医院诊断水平。深度学习模型另一个潜在应用可以将实时图像与之前影像学检查的图像进行自动比较,从而使解读的医生能够更直观地了解疾病进程。
然而,目前的模型还需更多的试验去验证,深度学习的方法是一个"黑匣子",无法准确了解计算机模型中各个临床指标的实际作用,这种未知因素会带来一定的风险甚至会带来医疗纠纷。深度学习模型的建立往往需要大量的临床资料,而由于罕见病临床资料较少,因此机器学习模型可能无法适用于罕见病。模型对录入数据要求高,如果输入的数据质量较差或有偏差,解释的质量也会较差,此外,必须强调创建数据的统一标准,从而允许不同算法之间的集成,允许算法在不同的设备上运行。
2020年,谷歌的研究人员[35]宣布已找到破解深度学习"黑匣子"的方法,也许在不久的将来,深度学习模型会变得更加安全,机器学习将来仍是一种不可忽视的辅助医疗力量,其现有的缺点也将会渐渐被改进。
参考文献
[1] Lee G,Fujita H. Deep learning in medic al image analysis.challenges and applications[M]. Berin. Germany:Springer International Publishing,2020:18-19.
[2] Lin S,Li Z,Fu B.et al. Feasibility of using deep learning to detect coronary artery disease based on facial photo[J]. Eur Heart J,2020.41(46)。4400-4411.
[3] Avram R,Olgin JE, Kuhar P,et al. A digital biomarker of diabetes from smartphone based vascular signals[J]. Nat Med,2020,26(10):1576-1582.
[4] Srinivasan S, Greenspan RJ,Stevens CF,et al. Deep(er)L earning[J]. J Neurosci,2018,38(34):7365-7374.
[5] Le Cun Y,Bengio Y.Hinton G. Deep learning[J]. Nature. 2015,521(7553):436-444.
[6] Kolossvary M,de Cecco CN.Feuchtner G,et al. Advanced atherosclerosis imaging by CT:radiomics,machine learning and deep learning[J]. J CardiovascComput Tomogr,2019,13(5):274-280.
[7] Lundervold AS,Lundervold A. An overview of deep leamning in medic al imaging focusing on MRI[J]. Z Med Phys ,2019,29(2)-:102-127.
[8] Gandhi S ,Mosleh W,Shen J,et al. Automation,machine learning, and artificial intelligence in echoc ardiography:a brave new world[J]. Echocardiography,2018,35(9):1402-1418.
[9] Khatibi T,Rabinezhadsadatmahaleh N. Proposing feature engineering method based on deep learning and K-NNs for ECG beat classification and arrhythmia detection[J]. Australas Phys Eng Sci Med,2019 Nov 26. DOl:10. 1007/s13246-019-00814-W.
[10] Kusunose K. Radiomics in echocardiography:deep learning and echocardiographic analysis[J]. Curr Cardiol Rep,2020,22(9):89.
[11] Rawat W,Wang Z. Deep convolutional neural networks for image classific ation:a comprehensive review[J]. Neural Comput,2017 .29(9):2352-2449.
[12] Schwendicke F,Golla T,Dreher M.et al. Convolutional neural networks for dental image diagnostics:a scoping review[J]. J Dent,2019.99(7):769-774.
[13] Tatsugami F,Higaki T,Nakamura Y,et al. Deep learning-based image restoration algorithm for coronary CT angiography[J]. Eur Radiol,2019,29(10):5322-5329.
[14] Bruns S,Wolterink JM,Takx RAP,et al. Deep learning from dual-energy information for whole-heart segmentation in dual-energy and single. energy noncontrast-enhanced cardiac CT[J]. Med Phys,2020.47(10):5048-5060.
[15]蒋建慧,姚静,张艳娟,等。基于深度学习的超声自动测量左室射血分数的研究[J] .临床超声医学杂志, 2019,21(1):70-74.
[16] Kusunose K,Abe T.Haga A.et al. A deep learning approach for assessment of regional wall motion abnormality from echoc ardiographic images[J]. JACCCardiovasc Imaging,2020,13(2 Pt 1):374-381.
[17] Zhang J,Gajala S. .Agrawal P,et al. Fully automated echocardiogram interpretation in clinical practice feasibility and diagnostic accuracy[J]. Circulation,2018,138(16):1623-1635.
[18] Liu W,Wang F,Huang Q,et al. MFB-CBRNN:a hybrid network for MI detection using 12-lead ECGs[J]. IEE J Biomed Health Inform,2020,24(2):503-51[19] Siontis KC,Yao x.Piruccello JP,et al. How will machine learning inform the clinical care of atrial firilation?[J]. Circ Res,2020,127(1):155-169.
[20] Belo D,Bento N,Silva H,et al. ECG biometrics using deep learning and relative score threshold classific ation[J]. Sensors(Basel),2020,20(15):4078.
[21] Zhao Z,Liu C,Li Y,et al. Noise rejection for wearable ECGs using modified frequency slice wavelet transform and convolutional neural networks[J]. IEEEAccess .2019,7(1):34060-34067.
[22] Zhao L,Liu C,Wei S,et al. Enhancing detection accuracy for clinical heart failure utilizing pulse transit time variability and machine learning[J]. IEEE Access ,2019,7(1):17716-17724.
[23] Huang J,Chen B,Yao B,et al. ECG arrhythmia classification using STFT-based spectrogram and convolutional neural network[J]. IEEE Access,2019,7(1):92871-92880.
[24] Wotok K,WoOk A. Early and remote detection of possible heartbeat problems with convolutional neural networks and multipart interactive training[J]. IEEE Access ,2019,7(1):145921-145927.
[25] YOldoromo , PDawiak P,Tan RS,et al. Arrhythmia detection using deep convolutional neural network with long duration ECG signals[J]. Comput Biol Med,2018,102:411-420.
[26] Wang P,Hou B,Shao S,et al. ECG arrhythmias detection using auiliary classifer generative adversarial network and residual network[J]. IEEE Access,2019,7(99):100910-100922.
[27] Poldervaart JM,Langedjk M,Backus BE ,et al. Comparison of the GRACE,HEART and TIMI score to predict major adverse cardiac events in chest painpatients at the emergency department[J]. Int J Cardiol,2017,227:656-661 .
[28] Kwon J,Jeon K,Kim HM,et al. Deep-learning-based risk stratification for mortality of patients with acute myoc ardial infarction[J]. PLoS One .2019,14(10):e0224502.
[29] Huo D,Kou B.Zhou Z.et al. A machine learning model to classify aortic dissection patients in the early diagnosis phase[J]. Sci Rep,2019,9(1):1-8.
[30] Santos-Ferreira C,Baptista R,Oliveira-Santos M,et al. A 10-and 15-year performance analysis of ESC/EAS and ACCIAHA cardiovascular risk scores ina Southern European cohort[J]. BMC Cardiovasc Disord,2020,20(1):301.
[31] Wu CC,Hsu WD,Islam MM.et al. An artificial itelligence approach to early predict non-ST-elevation myocardial infarction patients with chest pain[J.Comput Methods Programs Biomed,2019,173:109-117.
[32] Kwon JM,Kim KH,Jeon KH,et al. Artificial intelligence algorithm for predicting mortality of patients with acute heart failure[J]. PLoS One ,2019,14(7):e0219302.
[33] Zack CJ,Senecal C,Kinar Y,et al. Leveraging machine learning tec hniques to forecast patient prognosis after percutaneous coronary intervention[J]. JACC Cardiovasc Interv,2019, 12(14):1304-1311.
[34] Commandeur F, Slomka PJ,Goeller M,et al. Machine learning to predict the long-term risk of myocardial infarction and cardiac death based on clinical risk,coronary calcium,and epicardial adipose tissue:a prospective study[J]. Cardiovasc Res,2020,116(14):2216-2225.
[35] Novak R,Xiao L,Hron J,et al. Neural tangents:fast and easy infinite neural networks in python[C]. Seattle:International conference on learning representations,ar Xiv,2020.
文献来源:艾克力亚尔·艾尼瓦尔,马翔。机器学习CNN模型在心血管疾病诊疗中的临床应用及研究进展[J].心血管病学进展,2021,42(06):488-491+495.