5 冠心病问诊研究。
问诊被视为 “诊病之要领,临证之首务”,在四诊中占有重要地位。传统问诊来源于医生的耳闻、患者的口述,其主观性强、模糊性大,可重复性差,给临床科研带来困难。据文献[21]报道,用以表达四诊信息的症状表词有 817 个,由发生部位和性质联合组成的复合症状有 2317 个,如果再考虑症状的发生原因、诱发、加重等因素,形成的复合症状达 4500 个之多。因此,学者们开展了中医问诊规范化、客观化研究。如王哲等[22]对中医症状的量化表达方面进行了尝试,采用临床流行病学调查、条目分析及经验性筛选等方法,编制了简明抑郁症中医证候自评量表。
本课题组以中医心系问诊量表的研制为切入点,进行了问诊规范化的研究。我们运用问卷法,通过文献梳理、专家讨论,初步确定了心系问诊的条目池,在此基础上,借助多元统计学方法进行症状的筛选,并对量表进行信度、效度等检验,从而研制了中医心系问诊采集量表[23].在量表制作完善的基础上,结合现代计算机技术,研制了心系问诊信息采集系统[24],实现了中医心系问诊信息的规范化和数字化。为了探讨心血管疾病的中医问诊分类特征,为中医证候诊断标准的建立提供客观依据,我们尝试运用数据挖掘、模式识别等方法建立中医问诊模型。我们运用中医心系问诊量表和采集系统采集了 3021 例心系疾病患者的信息,其中冠心病有 1521 例[21],建立了中医心系问诊的隐结构模型[25],该模型无论定性层面或定量层面都与心系辨证理论基本吻合。基于问诊信息应用支持向量机 ( 径向基函数与多项式函数 2 种算法) 和人工神经网络 ( ACON 与 OCON2 种结构的网络) 建立3000 例心血管疾病常见证型心气虚、心阳虚、心阴虚、痰浊、气滞以及血瘀证的证候模型,研究发现,基于 OCON 结构的神经网络建立的证候模型,其识别准确率最高,均在 60% 以上,其中心气虚和心阳虚证分别高达 92. 4%、82. 9%[26].在前期研究的基础上,我们对机器学习领域的多标记学习进行了研究,提出了基于标记相关特征的多标记学习算法 ( revelant feature for each label,REAL) ,建立中医证候模型[27 -28],基于 REAL 对 695 例冠心病常见证型心气虚、心阳虚证、心阴虚证、痰浊证、血瘀证和心肾不交证进行分析,建立了冠心病中医证候模型,对于上述证型的识别率分别为73. 5% 、89. 5% 、79. 1% 、63. 8% 、85. 2% 、81. 8% .REAL 模型能很好地处理兼证,充分关注了证型和症状的关系,适合于中医辨证模型的建立。
6 冠心病四诊信息融合的研究。
中医 “望、闻、问、切”四诊信息是辨证论治的基础,通过四诊合参,达到审查病因、阐述病机、确定治疗原则以及判断预后等目的。然而传统中医诊法缺乏客观评价标准,导致中医辨证的精确性和可重复性较差,因此,实现中医四诊信息的客观化、辨证规范化是中医发展的迫切需要。早在20 世纪 70 年代,已有学者在中医领域引入计算机信息处理技术,开展了中医专家系统的研究[29].
早期的中医专家系统都是基于规则的推理[30],其缺点是自主 “学习”能力和 “适应”能力较差,知识自动更新困难。21 世纪初,随着计算机技术的发展,数据挖掘、人工智能等技术引入到中医辨证推理的研究领域,如基于人工神经网络技术、决策树方法建立中医辨证系统[31 -32].由于受限于当时四诊信息标准化采集手段及其信息化技术水平,参与辨证的客观化指标量化不足如望诊、声诊等信息尚未客观量化,影响了最终的辨证结果。近几年,中医四诊信息客观采集和分析系统的研究日益完善,为开展问诊、舌面、脉、声诊等四诊客观信息的融合研究奠定了基础,四诊信息融合研究成为中医诊断客观化研究的必然发展趋势。
20 年来本课题组合作开展了中医脉诊、问诊、望诊和声诊等检测系统的研究,研制出中医四个诊法的采集与分析系统,其能够提供的客观化指标基本覆盖了四诊的信息,解决了参与辨证的客观化指标量化不足的缺陷。在此基础上,我们研发了集成的中医四诊检测系统,并对 “四诊合参”信息融合研究做了许多创新性的尝试。应用中医四诊检测系统获取患者的舌诊、面诊、脉诊、问诊、声诊等四诊综合信息,基于四诊信息分别应用支持向量机和人工神经网络建立了 506 例心系疾病常见心气虚、心阳虚证、心阴虚证、痰浊证、血瘀证和气滞证的证候模型并进行预测,基于人工神经网建立证候模型中,气滞证模型的识别最高 ( 87. 07%) ,基于支持向量机建立的证候模型中,心阳虚证模型的识别率最高 ( 81. 70%)[28,33].为了验证 “四诊合参”的优势,分别基于问诊、基于问诊 + 望诊、基于问诊 + 望诊 + 脉诊、基于问诊 + 望诊 + 脉诊 +声诊 4 个数据集建立辨证模型并对其进行比较。考虑临床多兼证,采用 REAL 算法进行辨证模型的建模。基于 REAL 算法,建立了 693 例冠心病四诊信息融合的辨证模型,该模型通过互信息最大化来挑选与证型最相关的特征子集,从而建立心气虚证、心阳虚证、心阴虚证、痰浊证、血瘀证和心肾不交证的识别模型。当建模的数据集采用问诊信息时,上述证型的平均识别率为 84. 9%,当建模的数据集采用问诊 + 望诊信息时,上述证型的平均识别率为 85%,当建模的数据集采用问诊 + 望诊 + 脉诊信息时,上述证型的平均识别率为 85. 1%,当建模的数据集采用问诊 + 望诊 + 脉诊 + 声诊信息时,上述证型的平均识别率为 85. 8%.由此可见,当四诊信息收集全面时,模型的识别率最高。
7 展望。
随着科学技术的发展,脉诊仪、舌诊仪、面诊仪、声诊仪应运而生,但仍存在诸多不足,如现有的舌象采集设备多是从单一角度采集舌象,照相机采集的单帧图像易受光源电压和舌体运动的影响;中医 “三部九候”脉诊理论与方法尚需大量临床数据予以验证,三探头传感器尚未走进临床; 有40 余年现代化研究历史的脉诊尚未建立标准图谱及参数标准等。此外,分散于不同课题组的研究数据是孤立的,难以综合反映病证诊断的深层意义,而集成的中医四诊检测系统的研发,四诊信息融合的研究,有望解决由于不同诊法数据分离导致的信息孤岛问题。对整合的数据进行分析决策成为大数据下中医诊疗技术必然的发展趋势,大数据可以为患者的数据信息的收集、存储、检索和分析利用提供服务; 实现临床科研数据的持续积累、有效集成与应用。利用大数据可以从大量临床数据中发掘隐藏在现象背后的知识和规律。
心血管疾病是威胁人类生命健康的严重疾病,许多心血管疾病如冠心病、高血压病等在早期可以没有自觉症状,导致患者错过最佳治疗机会,因此,在疾病未发生时便开始积极预防和干预可达到防患于未然。大数据下的中医诊疗技术充分体现中医时间医学和中医个性化诊疗的特点,能够为患者带来最大的收益。中医四诊检测系统结合互联网技术,可以全面实时监测个人的健康数据,医生通过监测到的数据,利用先进的数据分析方法和模型,绘制患者的健康曲线图,计算机系统对患者的异常情况进行预警,并给予个性化干预,达到防病治病的目的。
参考文献
[1]李敬华 . 冠心病舌诊定量研究[D]. 北京: 中国中医科学院,2003.
[2]WANG YQ,XU J,GUO R,et al. Therapeutic effect inpatients with coronary heart disease based on informationanalysis from traditional Chinese medicine four diagnosticmethods[J]. JTCM,2014,31( 1) : 34-41.
[3]胡志希,袁肇凯,顾星,等 . GD-型光电流容积仪对 113例健康病人面部常见的检测分析[J]. 中国中医药信息杂志,2004,11( 11) : 965-967.
[4]袁肇凯,黄献平,范伏元,等 . 心病气血辨证面色变化特点及面部血管容积图检测分析[J]. 中医杂志,2001,42( 3) : 173-175.
[5]董梦青,李福凤,周睿,等 . 基于图像处理的不同脏腑疾病患者面部颜色特征分析[J]. 中华中医药杂志,2013,28( 4) : 959-963.
[6]董梦青 . 冠心病不同证候舌、面诊信息特征研究与实验室指标的相关性研究[D]. 上海: 上海中医药大学,2013.