学位论文 > 优秀研究生学位论文题录展示

数据挖掘在计算机辅助诊断中的应用研究

作 者: 耿中泽
导 师: 李伟鹏
学 校: 南方医科大学
专 业: 生物医学工程
关键词: 决策树 ID3算法 模糊聚类 逐步判别分析 计算机辅助诊断
分类号: TP311.13
类 型: 硕士论文
年 份: 2008年
下 载: 66次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,计算机辅助诊断(Computer Aided Diagnosis,CAD)逐渐成为医学领域的研究热点之一,很多计算机辅助诊断技术不断出现并获得快速发展,对于提高临床医生诊断的准确率、减少漏诊起到了积极的作用。数据挖掘技术的兴起和发展为计算机辅助诊断的发展提供了更广阔的空间。本文就基于数据挖掘的计算机辅助诊断在检验医学中的应用做了有益的尝试和探索。计算机辅助诊断在医学影像学方面的应用已经取得了重大进展,但在检验医学方面的应用研究还相对较少。本文详述了基于决策树模糊聚类分析两种数据挖掘技术的计算机辅助诊断在检验医学中的应用,并由此得出应用的一般模式。血细胞计数实验对于一些疾病具有临床诊断意义,本文重点介绍了运用决策树技术量化基于细胞计数的贫血病的诊断规则,形成诊断模型,将该模型通过代码实现,用于计算机辅助诊断,为贫血病的诊断提供有效的诊断提示。该实验的数据来自于医院的检验信息系统。为提高数据挖掘的效率,必须针对主题对数据属性进行维规约,排除无关属性,保留相关属性。维规约采用贪心算法,逐步向前选择有用属性。在属性的相关性分析中采用了熵增益技术,设定最小信息增益,引入新的属性后计算熵增益值,和最小信息增益阈值比较,来决定属性的有用性。决策树挖掘是数据挖掘中的重要应用之一。本文采用了经典的ID3算法,在阐述了ID3算法及其改进算法(C4.5算法)后,对基于细胞计数的贫血病的临床诊断标准进行维规约,并运用ID3算法生成决策树模型,进而将该模型用代码实现,用于计算机的辅助诊断。胃病是威胁人类健康的高发病之一,以往对于胃病的诊断,更多的是依靠医师的医疗知识和临床经验。本文提出模糊聚类与逐步判别分析相结合的方法,用于胃病的计算机辅助诊断。本文首先介绍了模糊聚类及逐步判别分析的有关内容,并以此建立医学疾病辅助诊断模型。然后结合实例分析,对从医院消化内科收集到的156例胃病患者,构造模糊相似矩阵,计算传递偏差并结合临床经验选取恰当的λ。在模糊聚类分析的基础上,选用贝叶斯意义下的逐步判别分析模型,将有显著作用的因素保留在判别函数中,不显著的去掉。依此对患者进行预测诊断。在对所收集的100例原始病例所做的回代验证中,诊断符合率达96.0%,在对另外的56例患者的预测诊断中,符合率也达到了91.1%,取得了良好的效果。该模型通过VB实现,整个诊断过程在计算机上进行,实现了胃病的计算机辅助诊断。基于数据挖掘的计算机辅助诊断在检验医学中的应用还处于探索阶段,本文也仅就数据挖掘中的两种方法的应用进行了论述,数据挖掘中的其他方法甚至几种方法的结合都可以应用到计算机的辅助诊断,这些研究都将在后续的工作中进一步展开。

全文目录


摘要  3-5
ABSTRACT  5-7
目录  7-9
第1章 引言  9-11
  1.1 本研究的意义  9-10
  1.2 本研究的目的  10
  1.3 本研究的主要工作  10-11
第2章 计算机辅助诊断和数据挖掘  11-23
  2.1 计算机辅助诊断简介  11-12
  2.2 数据挖掘介绍  12-16
  2.3 计算机辅助医学诊断系统中的数据挖掘和知识发现方法  16-23
    2.3.1 理解应用领域/识别 KDD的目标  17
    2.3.2 产生目标数据库  17-18
    2.3.3 清理与预处理数据  18-19
    2.3.4 数据约简和投影  19
    2.3.5 将目标与特殊数据挖掘方法匹配  19-20
    2.3.6 数据挖掘  20-21
    2.3.7 解释和评估所挖掘到的模式  21
    2.3.8 使用所发现的知识  21-23
第3章 基于决策树的贫血病计算机辅助诊断模型的研究  23-35
  3.1 决策树挖掘介绍  23-26
    3.1.1 决策树基本概念  23
    3.1.2 决策树挖掘的特点  23-24
    3.1.3 决策树挖掘的历史与发展  24
    3.1.4 决策树挖掘的种类  24
    3.1.5 决策树挖掘的算法  24-25
    3.1.6 决策树挖掘的核心问题  25-26
    3.1.7 决策树挖掘的研究方向  26
  3.2 决策树挖掘的算法  26-29
    3.2.1 ID3算法  26-28
    3.2.2 剪枝  28
    3.2.3 C4.5算法  28-29
  3.3 ID3算法用于基于细胞计数的贫血病诊断  29-32
    3.3.1 基于血细胞计数的四种贫血的诊断标准  30
    3.3.2 建立信息数据库  30-31
    3.3.3 通过计算生成初步决策树  31-32
  3.4 生成最终决策树模型并用于贫血病的计算机辅助诊断  32-35
    3.4.1 生成具有诊断意义的最终决策树模型  32-33
    3.4.2 将该模型用于贫血病的计算机辅助诊断  33-34
    3.4.3 临床验证和讨论  34-35
第4章 基于模糊聚类逐步判别分析相结合的胃病辅助诊断模型的研究  35-47
  4.1 聚类分析的概念以及胃病辅助诊断模型的临床意义  35-40
    4.1.1 聚类分析的定义  35
    4.1.2 聚类分析的算法分类  35-37
    4.1.3 聚类算法的一般步骤及改进策略  37-39
    4.1.4 聚类分析的研究方向  39-40
    4.1.5 胃病辅助诊断模型的临床意义  40
  4.2 理论模型  40-43
    4.2.1 模糊聚类分析预测模型  40-41
    4.2.2 逐步判别分析诊断模型  41-43
  4.3 程序设计  43
  4.4 实例分析  43-47
    4.4.1 模糊聚类  43-44
    4.4.2 逐步判别分析  44-46
    4.4.3 结果与讨论  46-47
第5章 总结和展望  47-49
参考文献  49-54
攻读学位期间成果  54-55
致谢  55-56

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 土壤环境功能区划研究,X321
  3. 乳腺钙化检测算法的研究与实现,R816.4
  4. 演化聚类算法及其应用研究,TP311.13
  5. 教学质量评估数据挖掘系统设计与开发,TP311.13
  6. 基于参考图像的乳腺肿块诊断方法研究,TP391.41
  7. 电力系统电压无功控制方法研究,TM761.1
  8. 停车诱导在智能移动终端上的设计与实现,TN929.53
  9. CT图像的肺结节特征提取的方法研究,TP391.41
  10. 基于学生评教数据挖掘与教学质量分析系统的研究,TP311.13
  11. 基于粗糙集理论的决策树分类算法与应用研究,TP18
  12. 基于三层架构的建筑材料租赁系统设计与实现,TP311.52
  13. 基于核心示例集的属性约简方法研究,O159
  14. 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
  15. 基于改进的ID3算法的蛋白质纯化方法研究,Q51
  16. 五种决策树算法的比较研究,TP311.13
  17. 信用卡风险管理技术及利润预测模型,F224
  18. 基于DCE-MRI的乳腺病灶良恶性计算机辅助诊断研究,TP391.7
  19. 汉语语音合成系统的改进与实现,TN912.33
  20. 基于物流港口企业业务流程战略转型的岗位优化设置研究,F259.27;F224
  21. 中国15岁以上人群乙型肝炎免疫预防的决策分析模型研究,R392.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com