阿尔茨海默病(AD)是一种老年期慢性神经变性病,主要表现为记忆力及其他认知功能减退。据世界卫生组织(WHO)统计,2010年全球阿尔茨海默病患者约为35.60 × 106例,相关费用达604 × 109美元[1],以其目前增长速度预计,至2040年全球患病例数将达80×106例[2],由此可见,阿尔茨海默病不仅严重影响患者身心健康和生活质量,而且给家庭和社会带来沉重负担。阿尔茨海默病早期症状以记忆力减退为主,无法记住新信息;最先发生于神经细胞功能失调和凋亡的脑组织,即形成新记忆的脑区,此后逐渐延伸至其他脑区,使更多的认知功能缺失。除记忆障碍,阿尔茨海默病患者制定计划和解决问题能力减退,对时间和地点混淆,无法读写单词,回避工作和社会活动,伴情感淡漠或抑郁等。随着病情进展,神经功能全面下降,至疾病晚期失去生活自理能力,甚至失去语言交流能力。
阿尔茨海默病典型神经病理学特征是神经元胞外神经炎性斑[NPs,亦称老年斑(SPs)]沉积和神经元胞内神经原纤维缠结(NFTs)形成,以及淀粉样脑血管病(CAA)、星形胶质细胞增生和小胶质细胞激活.
1984年,美国国立神经病学、语言障碍和卒中研究所阿尔茨海默病及相关疾病协会(NINCDSADRDA)制定阿尔茨海默病临床诊断标准[7],包括医师检查记录、临床检查、神经心理学测验和实验室评价。并在此后的30年内为阿尔茨海默病的临床诊断提供可靠且合理的依据。随着神经影像学和生物化学等诊断技术的进步,2011年,NINCDSADRDA对其进行重新修订,新版诊断标准中有两项显着变化,即明确疾病状态的生物学标记和疾病阶段的标准化[811].生物学标记主要分为两大类:一类为β?淀粉样蛋白(Aβ)沉积生物学标记,包括PET显像中示踪剂滞留异常和脑脊液Aβ水平较低;另一类为神经元退行性变或损伤生物学标记,包括脑脊液tau蛋白水平升高、18F脱氧葡萄糖(18FFDG)PET显像呈现颞顶叶18FFDG摄取降低和结构性MRI显示颞顶叶萎缩[1214].新版诊断标准将阿尔茨海默病定义为正在进行的病理生理变化过程,而非单纯临床阶段,因为其病理改变早于临床阶段[15],患者经历长时间无症状阶段时,病理生理改变即已发生,可通过相关生物学标记的检测来判断是否已处于向临床转化并存在认知损害风险的阶段。因此,应准确定义阿尔茨海默病临床前阶段,以为进入临床阶段的患者提供早期干预机会。
除上述生物学标记外,神经影像学[MRI、磁共振波谱(MRS)、灌注成像(PWI)、fMRI、扩散张量成像(DTI)等]和神经心理学测验也是诊断阿尔茨海默病的重要方法。研究此三类特征之间的关系,并利用其区分正常老龄化、轻度认知损害(MCI)和阿尔茨海默病,以实现轻度认知损害和阿尔茨海默病的定性和定量诊断,以及对病情动态追踪、分析和预测,此为目前阿尔茨海默病研究的重要问题之一。
模式分类方法通过对大量信息或数据的自动分析而获取阿尔茨海默病患者内在规律,并利用这些规律对未知数据进行分类和预测。该方法自20世纪60年代出现以来,已在文字、语音、影像学、生物信号和信息等领域广泛应用,其中模式分类计算法用于疾病智能分类和预测,能够区分不同疾病并分辨疾病不同阶段,从而实现计算机辅助诊断,具有重要意义[1617].将生物学标记、影像学特征和神经心理学测验作为关键信息代入模式分类计算法,经过处理和分析后对正常老龄化、轻度认知损害和阿尔茨海默病进行描述、辨认、分类和解释,对轻度认知损害和阿尔茨海默病之发病机制、早期诊断、转化预测和疗效评价均具有重要的研究意义和临床应用价值。
一、模式分类方法
1.阿尔茨海默病诊断的模式分类流程 (1)训练数据集:数据集须满足两个要求,一是样本量充足,以突出群体特点,从而降低个体差异对分类的影响;二是具有突出群体特点之属性或特征,此为分类的标准和依据。(2)特征提取和数据降维:训练数据集包括生物学标记、MRI、PET等影像学特征和神经心理学测验。其中,生物学标记和神经心理学测验的数据维度较低,无需降维即可直接应用。而神经影像学的体数据,由于以体素为单位,如对于512×512×120大小的体数据,数据量极为庞大,即使经统计分析后获得差异有统计学意义的体素,一般也可达数万甚至十数万。关于皮质厚度的测量,也是基于体素的方法,数据量亦极其庞大。如此庞大的数据,若直接将其作为特征,既增加计算量,分类时又存在大量冗余,故应对其特征进行降维,筛选有效特征或进行特征转换,以新的低维度特征表征样本属性。(3)模型训练和最优化:通过输入训练数据集和已知分类标签,采用分类器计算获得一项区分类别的规则。可以选择多种监督学习的计算方法如支持向量机、贝叶斯网络、决策树等,模型参数亦可依据训练数据集进行最优化调整。交叉验证法是一种广泛应用于参数调节的方法,Nfold交叉验证即是将数据随机分为N份,其中(N-1)份作为训练,剩余1份进行测试。不断重复该过程直至每一子集均进行一次测试集,然后计算整体错误率。(4)分类测试:经过训练的模型和参数用于数据测试,一般将测试数据集和训练数据集分开,二者无关联性;若数据量较少,可采用交叉验证法以检验模型的分类效果。
2.特征选择与降维 特征是个体在某一特定过程中可测量的属性,通过机器学习方法,这些特征可进行分类识别。其中的冗余特征和非相关特征既增加运算时间,又降低分类和预测准确率[18].特征选择是选择原始特征的一个子集,该子集能够较好代表原始特征,在保证准确率的条件下,能够尽可能减少数据维度,主要是减少或剔除冗余特征和非相关特征。冗余特征系指两项或多项特征高度相关,多余特征无法提供更多的类别信息,故可通过选择较少的独特特征来表征数据。非相关特征系指与类别完全无相关性的特征,在分类预测中是纯粹噪声,可引起偏差,主要发生于对研究对象缺乏足够了解时。
3.分类器 分类器可以分为两类:一类是统计分析方法,另一类是机器学习方法。常用的统计分析方法有朴素贝叶斯、K最近邻法、线性判别式法、二次判别式法或贝叶斯网络等;常用的机器学习方法包括决策树、支持向量机、人工神经网络等[19].Chen和Herskovits[20]对7种分类器(判别式分析、逻辑回归、朴素贝叶斯、贝叶斯网络、决策树、支持向量机和多层感知器)诊断早期轻度认知损害的效果进行比较,结果显示,以全脑91个加拿大蒙特利尔神经病学研究所(MNI)脑区为特征时,贝叶斯网络和支持向量机的区分能力较判别式分析和逻辑回归高7%,且前两者的错误率仅为后两者的50%;以内侧颞叶邻近的12个MNI脑区为特征时,判别式分析和逻辑回归的区分能力提高,其与贝叶斯网络和支持向量机的差距减少≥ 3%,且错误率也接近。
对模型普遍性的评价表明,所有模型的训练效果与测试效果均存在一定差异,训练准确率普遍高于测试准确率[20].与此同时,线性模型的普遍性优于非线性模型,测试准确率与训练准确率更接近。
Plant等[21]分别采用贝叶斯分类器、支持向量机、特征区间投票对阿尔茨海默病进行预测,三者区分正常老龄化与阿尔茨海默病的效果比较,贝叶斯分类器、支持向量机、特征区间投票的分类准确率分别为92%、90%和78%;对于轻度认知损害转化分类,三者的分类准确率分别为91.67%、95.83%和95.83%.
二、模式分类方法在阿尔茨海默病诊断中的应用
模式分类方法广泛应用于阿尔茨海默病的辅助诊断,例如区分正常老龄化与阿尔茨海默病、正常老龄化与轻度认知损害[22]、正常老龄化与阿尔茨海默病病变过程[23]、转化型轻度认知损害与非转化型轻度认知损害[24].分类所采用的特征包括诊断标准建议的多种生物学标记,既有神经影像学技术,也包括脑脊液生化标记[12,2526],例如,Aβ沉积的检测,既可采用11C匹兹堡复合物B(11CPIB)PET,亦可直接测定脑脊液Aβ水平,证实Aβ沉积早于阿尔茨海默病,甚至发生于任何认知损害症状前[27].其他阿尔茨海默病相关神经功能变化,如突触功能下降,既可采用18FFDG PET[28],也可直接测定脑脊液tau蛋白水平;神经元缺失致脑萎缩,可采用结构性MRI测定脑体积变化;白质纤维束变化则以DTI最佳。上述生物学标记的变化均与阿尔茨海默病病程不同阶段密切相关,对预测和追踪病情进展有重要价值[27,29].轻度认知损害是定义明确的临床综合征,包括记忆力及其他认知功能减退[30],为正常老龄化与阿尔茨海默病之间的过渡阶段。轻度认知损害患者是进展至阿尔茨海默病的高危人群,因此,对阿尔茨海默病及其前期轻度认知损害阶段早期诊断的需求越来越迫切,若能在疾病初期予以干预,可延缓病情,甚至可稳定认知功能状态[31].基于此,大量研究应用模式分类方法诊断轻度认知损害和阿尔茨海默病,其中不同模态的数据包括结构性MRI、fMRI、PET、DTI和脑脊液检测,既可单独应用亦可联合应用,均可成功区分正常老龄化与阿尔茨海默病,正常老龄化与轻度认知损害,其分类准确率分别为82.70%[32]~ 100%[33]和71.09%[34]~ 100%[35].
尽管多模态联合方法并非均能获得最有效结果,但大多数文献仍建议采用多模态联合方法作为特征以提高不同群组之间的分类准确性,例如,fMRI与PET联合应用可使正常老龄化与轻度认知损害的分类准确率达100%,而单纯应用fMRI的分类准确率仅为87%[33].这是由于脑萎缩是阿尔茨海默病的显着标记,早期诊断研究主要以神经解剖学为分类依据,如以海马为兴趣区(ROI)可较好区分正常老龄化与阿尔茨海默病,其分类准确率为94%、灵敏度96%、特异度92%,其区分正常老龄化与轻度认知损害分别为83%、83%和84%[36].晚近研究应用静息态fMRI从大规模网络分析角度进行分类,亦获得相似结果[371.模式分类方法不仅适用于区分正常老龄化与阿尔茨海默病,对不同原因引起的痴呆亦同样有效。
Klppel等[1]研究显示,MRI模式分类方法区分正常老龄化与阿尔茨海默病的准确率约为95%,区分阿尔茨海默病与额颞叶痴呆(FTD)的准确率亦可达89.20%;同时证实该项机器学习方法具有普遍性,不同研究中心获得的数据均能达到类似效果。
随后Klppel等[39]又对机器诊断与放射科医师人工诊断结果进行比较,指出计算机辅助诊断更具临床应用潜力。关于不同病因的痴呆分类,2011年,Dukart等[40]研究显示,结构性MRI与PET联合的影像学技术对阿尔茨海默病与额颞叶痴呆的分类准确率为91.70%.关于轻度认知损害患者的病情追踪和转化分析,尽管有40% ~ 60%的轻度认知损害患者于发病后4~6年可转化为阿尔茨海默病,但仍有相当一部分患者可维持认知功能不再继续进展,甚至可恢复至正常水平[3031],提示轻度认知损害症状并非一定是阿尔茨海默病所致,故阿尔茨海默病诊断的另一主要应用是预测有轻度认知损害症状的患者是否病情进展,甚至转化为阿尔茨海默病。