白癜风最好的医院 http://m.39.net/pf/a_4618897.html
重要小贴士

为了进一步提高期刊论文质量和水平,更为深度的传承和传播名医经验,中医传承计算平台研发团队联合中药大品种联盟将于年11月8-10日在广州举办中医药科研论文与SCI写作培训会议。该培训班围绕名医学术思想、经验总结、毕业论文设计与期刊论文发表等相关内容,从名医传承者和研究生实用的角度对撰写相关论文与申请相关项目的经验进行广泛交流。报名直接点击文章最下方阅读原文。

⊙作者:吴嘉瑞,唐仕欢,郭位先,张晓朦,张冰

⊙编辑:一墨

名老中医是中医药学术发展的杰出代表,是联系传统和实现中医发展的灵魂,名老中医经验的总结和传承不仅能丰富中医学的理论体系,还能为中医药学术进步产生巨大的推动作用,也是培养造就新一代名中医的重要途径之一。因此,总结名老中医的临床经验、用药规律和学术思想,对中医药的薪火相传具有重要的理论意义和应用价值,也是中医药创新发展的源泉。随着现代信息技术的发展、计算机在医学领域的应用,医学研究者逐渐从直面众多医疗信息、医疗经验的困境中走了出来,其中,数据挖掘技术就是其中的典型代表。采用数据挖掘技术对名老中医学术思想和临证经验进行研究,可以全面解析其中的规律,分析名老中医个体化诊疗信息特征,提炼出临证经验中蕴藏的新理论、新方法、新知识,实现名医经验的有效总结与传承。自从基于信息和数据技术的名老中医临床诊疗经验研究思路提出以来,利用多种数据挖掘技术对病案进行分析的研究报道与日俱增,在名老中医经验传承领域发挥着重要作用。

数据挖掘(DataMining,DM)又称数据库知识发现(KnowledgeDiscoverinDatabase,KDD),是指从数据库的大量数据中揭示出隐含的、未知的并有潜在价值的信息的非平凡过程,是数据库技术、统计学、机器学习、知识工程、信息检索、人工智能、数据可视化以及高性能计算机等多学科交叉的研究领域。数据挖掘是一个完整的过程,一般而言,数据挖掘包括:问题定义、数据提取、数据清洗与转换、数据挖掘、模式评估、知识表示等几个方面。本文中,笔者结合多年从事数据挖掘研究的经验与体会,并借鉴国内同行的相关研究成果,从关联规则、贝叶斯网络、神经网络、决策树等多种方法角度,对数据挖掘在名老中医经验传承研究中的应用进行论述,希冀为数据挖掘方法在名老中医经验传承领域的进一步深入应用提供参考。

1名老中医经验传承研究中数据挖掘方法应用1.1关联规则关联规则(AssociationRules)是从大量的数据中挖掘发现项集之间有意义的关联,并寻找给定的数据集中项之间的有趣联系的一种算法。常用的关联规则算法包括Apriori算法、FP-树频集算法等。吴荣等采用关联规则算法对名老中医治疗冠心病的用药规律进行数据挖掘。结果显示,治疗冠心病处方中最常用的中药是丹参、瓜蒌、川芎,最常用的方剂是瓜蒌薤白类方、活血通脉剂及生脉散。刘晓怡等采用关联规则方法对李佃贵教授辨治慢性萎缩性胃炎医案进行数据挖掘,得出李佃贵教授诊治慢性萎缩性胃炎最常用的药物是茵陈、黄连。田琳等采用关联规则算法对名老中医诊疗眩晕病辨证思维模式进行数据挖掘,得出眩晕病的证候多为风阳上扰、肝肾阴虚、痰浊上蒙、肝肾阴虚、气血两虚等,病因病机多为虚、风、痰、瘀等,发病与肝、肾、脾三脏关系密切。晏婷婷等采用关联规则对孟河医家治疗痹证的治法及用药规律进行数据挖掘,结果显示常用药物以当归、秦艽、桑枝、牛膝出现频次最高,药对以当归与牛膝、秦艽与桑枝、秦艽与牛膝的支持度最高,续断对牛膝的置信度最高。笔者采用关联规则方法对国医大师颜正华教授治疗胃脘痛用药规律进行数据挖掘,得出颜正华教授在治疗胃脘痛过程中常用药物为陈皮、佛手、香附、白芍、煅瓦楞子、赤芍、当归、丹参等,使用频率前三位的药对是佛手、陈皮,陈皮、香附,佛手、香附。作为在名老中医处方规律研究中使用最广泛的数据挖掘算法,关联规则具有明显的优点,如它可以产生清晰有用的结果,支持间接数据挖掘,可以处理变长的数据等。但是,关联规则也有其不足,如计算量增长相当严重,难以决定正确的数据,容易忽略稀有的数据等。1.2贝叶斯网络的应用贝叶斯网络(Bayesiannetwork)是一种以贝叶斯公式为基础的概率网络,是一个有向无环图,由代表变量结点及连接这些结点的有向边构成。贝叶斯网络可以将具体问题中复杂的变量关系在一个网络结构表示,通过网络模型反映问题领域中变量的依赖关系。吴荣等利用贝叶斯网络技术对名老中医治疗冠心病辨证规律进行数据挖掘,提取出名老中医诊疗冠心病、心绞痛的8个证候要素。须义贞等采用贝叶斯网络和方剂智能分析软件对沈仲理教授诊疗子宫肌瘤医案进行数据挖掘,得出沈仲理教授诊疗子宫肌瘤善用活血化瘀、清热软坚法,常用治疗药物包括三棱、莪术、丹参、半枝莲、蚤休等。贝叶斯网络具有分类、聚类、因果分析等功能,面对大规模数据有其独特的优势,具体包括:①学习机制高效灵活,可发现潜在的有用的模式或者联系,实现对数据实例的分类、聚类、预测。②语义清晰,易于理解和接受,具有良好的预测能力。③有效避免对数据的过度拟合。④贝叶斯网络可将先验知识、样本,主观、客观有机结合起来,更加全面反映数据对象内在的联系和本质。1.3神经网络的应用人工神经网络(ArtificialNeuralNetwork,ANN)是由大量处理单位(即神经元,Neurons)广泛连接而成的网络,是人工建立的以有项图为拓扑结构的动态系统,通过对连续或断续的输入作状态响应而进行信息处理。陈肇文利用人工神经网络建立名老中医中医方剂系统和中医方证医学诊疗系统,可在线根据患者症状自动进行处方。白云静等利用人工神经网络技术对中医证候非线性建模研究,在充分辨识证候表征信息的基础上,建立证候与症状之间的非线性映射函数。陆萍等基于面诊的证素辨证建立面诊-证素辨证神经网络,对64个病例进行证型辨别,结果表明,神经网络模型构建的中医面诊系统能根据样本值对网络构造和训练,证型辨证结果准确率比较高,是可行的。作为最常用的数据挖掘方法之一,神经网络具有很强的非线性拟合能力,可映射任意复杂的非线性关系,而且学习规则简单,便于计算机实现,具有很强的鲁棒性、记忆能力、非线性映射能力以及强大的自学习能力。当然,神经网络算法并不是完美的,其也存在诸多不足:①最严重的问题是没能力来解释自己的推理过程和推理依据;②当数据不充分的时候,神经网络就无法进行工作;③把一切问题的特征都变为数字,把一切推理都变为数值计算,势必导致部分信息的丢失;④理论和学习算法还有待于进一步完善和提高;⑤神经网络模型不能像Logistic回归模型一样有明确的模型变量准入和剔除原则;⑥网络隐含层的数目和隐含层单元的选择缺乏理论指导。1.4决策树算法的应用决策树(DecisionTree)模型是一种自上而下的预测模型,其基本运算原理属于分类规则,也就是说每个决策或者事件都能引出两个或者多个事件,继而产生不同的后果,这种决策分支的图像就像一棵树的枝干,称其为决策树。决策树以样本的根节点开始,如果样本在同一个类,则该结点为树叶,算法选择最有分类能力的属性作为决策树的当前结点,根据信息增益进行分裂,直到给定节点的所有样本属于同一类或没有剩余属性可供划分为止。瞿海斌等采用决策树方法对血瘀证的诊断规则进行归纳,得到血瘀证决策分类模型,结果表明决策树提取的诊断规则与传统的医学统计方法相比,更为简单、方便,为从病例中自动归纳诊断规则提供了一种新的方法。谢雁鸣等从临床流行病学的角度用决策树等方法对原发性骨质疏松症的中医基本证候进行研究,得出原发性骨质疏松症的阴虚和阳虚诊断模型。徐蕾等用信息熵的决策树方法对慢性胃炎的中医辨证进行研究,构建以信息熵减少为特征的决策树分类模型。作为最常用的数据挖掘分类算法之一,决策树有着明显的优点,如:①可以生成易于理解的规则;②计算量相对来说不是很大;③可以处理连续和种类字段;④决策树可以清晰的显示哪些字段比较重要。决策树算法也有其不足之处,如:①对连续性的字段比较难预测;②对有时间顺序的数据,需要很多预处理的工作;③当类别太多时,错误可能就会增加的比较快。1.5复杂系统熵方法的应用年,《中国中医基础医学杂志》发表了“‘熵’在中医方证研究中的运用”一文,在总结熵理论的基础上,首次提出运用熵理论进行中医方证相关研究的设想,并探讨了证、熵、方结合的原理与前景。随后,该研究组成员以中风病为范例,通过实践表明,该方法不仅可以应用证候与方剂之间的相关性研究,还可以研究证候与证候之间、证候与症状之间、方剂中药物与药物之间、配伍中成分与成分之间的关系。其后,提出了复杂系统熵聚类的算法,并在疾病、证候、方剂的相关性研究中得到了应用。复杂系统熵聚类方法是一种非监督的模式发现算法,它能自组织地从海量的数据中提取出信息量最大的组合,同时,此方法特别适用于高度离散性类型的数据。相比于经典的统计方法,它有以下几个优点。①不需要数据的一致性,对于各类数据都适合。特别针对具有随机性,模糊性,非平衡性,非遍历性,多维性特点的中医药数据。②它客观地反映数据的情况,聚出来的组合内元素的相关都特别大,是最优的组合,这些组合为新药发现中候选处方的筛选奠定了基础。③相关是不对称的,为定义贡献度奠定了基础。④算法收敛速度快,对于处理大量的数据有优势。此方法具有两方面的显著优势:一方面,不仅可以定性、还可以定量挖掘出药物之间、病-证-症-药之间的相关性;另一方面,不仅可以挖掘出名医名家经验的核心组合,还可以挖掘出隐藏于方剂配伍之中的而没有被临床医家所重视的核心组合。笔者采用该方法对国医大师颜正华教授治疗胃脘痛、失眠等用药规律进行挖掘,得出颜正华教授在治疗胃脘痛、失眠的潜在药物组合和新方,为深入研究和药物开发奠定了基础。该方法的不足之处在于,挖掘出的潜在组合或新方,需要专业知识的综合判断和临床的再次验证。2数据挖掘在名老中医经验传承中的应用展望综上所述,关联规则、贝叶斯网络、神经网络、决策树等数据挖掘方法在名老中医经验传承研究中发挥着重要作用,是深入挖掘、继承名老中医的学术思想和临床经验的有力工具。然而,每种数据挖掘方法都有其局限性和不足,均有其适应范围,且对数据有一定的要求。中医药数据挖掘的对象是中医药领域中积累的海量数据,这些数据的属性既有离散型的,又有连续型和混合型的特点,挖掘过程需要人机交互、多次反复,在中医药专业背景知识引导下,针对具体问题,选择合适的数据挖掘方法。同时,数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识的过程,融合了数据库、人工智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果,是一个多学科交叉研究领域。因此,数据挖掘具体方法需要有计算机、统计学等多学科交叉人员才能熟练应用,不易被中医药临床人员和学术继承人等所掌握,这给数据挖掘方法在名老中医经验传承中的应用带来困难和挑战。名老中医经验的传承最终的目的是老专家临床经验和学术思想的总结和传播,数据挖掘方法的应用是有力的辅助手段,如何将相关挖掘方法进行集成并形成相应的软件,是数据挖掘方法在名老中医经验传承领域应用的重要方向。中医药的传承经过了口传心授、纸质文献、电子文献的过程,但是,尚不能有效满足传承的需要。中医传承包括丰富的内容,有多种传承模式,无论何种模式,收集整理临床医案是必不可缺的,因此,基于临床数据的循证传承是核心模式。中医药信息非标准化与个性化的特点,是中医的一大特色,但同时也是中医药传承信息化工作面临的重要瓶颈。数据的零散性与非标准性,从根本上制约了中医药传承信息化工作的效率与质量,也对本系统的研发工作提出了重要的挑战。为此,中国中医科学院中药研究所与中国科学院自动化研究所联合开发了中医传承辅助系统(TraditionalChineseMedicineInheritanceSupportSystem)软件。在全面客观地对中医药传承模式及方法特点进行分析的基础上,采用基于个性化需求的自助式服务平台的构建思路进行系统架构,以人工智能、数据挖掘、网络科学等学科的方法和技术为支撑,围绕临床诊疗和中医传承工作中的继承、发展、传播和创新四个方面的核心需求,分别构建面向临床数据的中医诊疗信息采集模块、面向中医药本体的知识管理和服务模块以及面向传承创新的隐性知识挖掘模块等几大功能模块,有效地解决了上述问题,从而保证了系统功能需求的有效实现。该软件是计算机科学和中医药学的有机结合,它以智能信息处理方面的研究成果为支撑,遵循基于临床数据的循证传承理念,提出并镶嵌了复杂系统熵聚类的挖掘方法,围绕名老中医学术思想总结和经验传承、中药新药处方筛选与处方发现等方面的信息处理进行了积极的探索。实现了“数据的录入-管理-查询-分析-网络可视化展示”等功能的中医传承辅助平台软件的开发与应用,在中医传承工作的具有里程碑意义,是中医传承的有力辅助工具,值得进一步推广应用。参考文献:略。

[本文来源:《中国中药杂志》年2月第4期,根据原文略有改动,由传承发展平台(TCMISS)编校发表,文章仅代表作者个人观点]

联系方式:xinyaosheji

.


转载请注明地址:http://www.walengzia.com/wlzcf/5264.html