1 人工神经网络在医学研究中的应用
人工神经网络 (artificial neuralnetwork,ANN)在各个领域中已经得到广泛的应用,许多领域中已经成功的应用了ANN,如航天、智能识别、地震预测等。 ANN 应用于医学领域亦有近 30 多年的历史,但是只是在最近 10 余年才有较快的发展。目前国内外有相当多的研究在探讨 ANN 在临床工作中的应用。ANN 应用于疾病的诊断有较高的实用价值 。早在 1991年,Baxt WG将 ANN 用于心肌梗死的诊断,通过适当训练的ANN 诊断心肌梗死的敏感度为 97.2%,特异度为 97.5%,明显高于临床医生(77.7%,84.7%)。 El Solh AA 等将 ANN 应用于活动性肺结核的诊断,结果:训练集中 ANN 正确诊断肺结核的灵敏度为 100%,特异度为 72%;医生的灵敏度为 47%,特异度为 75%。 测试集中 ANN 的灵敏度为 100%,特异度为69%;医生的灵敏度为 64%,特异度为 79%。 显然 ANN 诊断活动性肺结核的能力高于医生的临床评价,测试集中的结果还表明, 所建的ANN 能很好地推广到新患者的诊断。且ANN应用于临床诊断有较高的敏感性和特异性。 Tourassi GD 等将 ANN 应用于肺栓塞的诊断,它从 PIOPED 研究的数据中随机抽取了 1 064 份临床资料(其中 387 例为肺栓塞,其余681 例为非肺栓塞患者)应用于 ANN 的训练和检测,并把 ANN 的诊断结果同内科医师的诊断结果进行了对比,结果显示:ANN诊断的准确性比医师的准确性还要高。 同时也指出,用于训练的训练集的例数越多,网络的诊断能力也就越强,准确性也越高。
应用 BP 人工神经网络通过运用 424 例患者的一般情况、危险因素、症状、体征等 7 大类 59 项资料对网络进行训练构建了一个帕金森病的诊断模型。 通过该模型对113 例患者 (其中帕金森病患者 33 例 )进行诊断 ,结果显示 :ANN 有较好的诊断价值 ,其漏诊率为 8.3%,误诊率为 6.4%,准确性为 92.9%。
通过 1 200 份病例的训练,300例用于训练时的检测,然后对 167 例病例进行模拟诊断并同实际结果进行比较,计算出网络诊断的准确性为 91.02%,敏感性及特异性分别为 92.79%和 87.5%。吴拥军等则将 12 项血清学指标运用于 BP 网络进行肺癌诊断的研究中,其资料构成是 50 例肺癌患者、40 例肺良性疾病(如肺结核、支气管炎等)以及 50 例正常人的 CEA、CA125、NSE 等 12 项血清学指标,从中随机抽取了100 例用于网络的训练,其余30例用于检测, 研究结果显示:ANN 的肺癌的识别率及预测率分别为 100%,并且可以同时区分是正常、良性疾病还是肺癌。
目前,ANN已用于许多疾病诊断,包括帕金森病、阿尔茨海默病、癫 间 病、孤立性肺结节鉴别诊断、肌肉萎缩、膀胱出口梗阻、泌尿道结石、肺栓塞等。
2 决策树在医学研究中的应用
决策树是一种用树枝状展现数据,受各变量的影响情况的分析预测模型,是根据对目标变量产生效应的不同而制定分类规则,并且是建立在信息论基础之上对数据进行分类的一种方法。 另外,它首先通过一批已知的训练数据建立一颗决策树,然后采用建好的决策树对数据进行预测。 决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。
采用 boot strap 方法对 406 例样本进行扩增以满足数据挖掘对样本量的要求,采用基于信息熵的决策树 C4.5 算法建立中医辨证模型。 通过决策树 C4.5 算法筛选出对辨证分型有意义的 26 个因素,按其重要程度排序,产生出清楚易懂可用于分类的决策规则,建立辨证模型,模型分类符合率为:训练集 83.6%,验证集 80.67%,测试集 81.25%;模型区分各类证型的灵敏度和特异度也较高。 认为决策树 C4.5 算法建立的模型效果较好, 可用于慢性胃炎中医证型的鉴别诊断。
3 粗糙集的数据挖掘技术在医学研究中的应用
粗糙集理论能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。 近年来得到了迅速的发展和完善。粗糙集理论的出发点是根据目前已有的对给定问题的知识将问题的论域进行划分,然后对划分后的每一个组成部分确定其对某一概念的支持程度:肯定支持此概念、肯定不支持此概念和可能支持此概念。 在粗糙集理论中,以上 3 种情况分别用 3 个近似集合来表示为正域、负域和边界。 粗糙集理论中应用决策表来描述论域中的对象,它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性。 属性分为条件属性和决策属性。 根据条件属性的不同,论域中的对象被划分到具有不同决策属性的决策类。 对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果。
运用粗糙集进行中医类风湿证候的诊断,共收集了 224 个病例,每个病例有 81 个属性,并从这 224 个病例中随机抽取学习样本 180 例,进行预测诊断 44 例。 他们利用属性约简得到寒湿阻络、湿热阻络、痰阏阻络、气阴两虚、寒热错杂 5 种证的必定规则和可能规则。 在 44 例预测诊断中诊断正确率达到 90%以上,高于传统的模糊数学方法,并认为粗糙集有可能是中医诊断研究的动态理想工具。肺部肿瘤的良、恶性诊断是临床医学中的一个十分重要的问题。
有许多常规的检验方法可以用于这类诊断,例如胸部 X 线透视、CT、气管镜等。然而,这些检验特征的灵敏度和区分度并不明显,仅凭上述检查方法所得到的数据类诊断肿瘤是良性还是恶性是很困难的。目前,国际上已经把挖掘技术应用于对肺癌的诊断中,学者们在这方面进行了大量的研究。他们根据上述常规检验,选取了诸如年龄、CT 图像中肿瘤的最大半径、肿瘤位置、钙化程度等18个医学检查指标作为特征值。利用这些特征值对基于粗糙集理论的自主判别算法模型进行训练后,再用特征值不完整的新记录来测试,诊断的正确率非常高。
综上所述,数据挖掘技术在许多疾病诊断中发挥了积极作用,并取得了一定成果。
参考文献:
[1] Baxt W G.http://sblunwen.com/lcyx/ Use of an Artificial Neural Network for the Diagnosisof Myocardial Infarction[J].Ann Intern Med,1991,115 (11):
843-848.
[2] El Solh A A,Hsiao C B,Goodnough S,et al.Predicting ActivePulmonary Tuberculosis Using an Artificial Neural Etwork[J].Chest,1999,116(4):968-973.
[3] Tourassi G D,Floyd C E,Sostman H D,et a1.Acute PulmonaryEmbolism:Artificial Neural Network Approach for Diagnosis[J].Radiology,1993,189(2):555-558.
[4] 常崇旺,高国栋,陈洪,等.人工神经网络诊断帕金森病的应用研究[J].中国临床康复,2003,7(28):3818-3819.
[5] 赵炳让,胡北来,秦勤,等.人工神经网络在冠心病诊断中的作用[J]. 天津医药,2002,30(9):575-576
数据挖掘技术在医学研究中的应用
论文价格:免费
论文用途:其他
编辑:硕博论文网
点击次数:
Tag:
如果您有论文相关需求,可以通过下面的方式联系我们
点击联系客服
相关临床医学论文论文