学位论文 > 优秀研究生学位论文题录展示
kNN分类算法研究及其在中毒诊断中的应用
作 者: 曾志浩
导 师: 陈治平
学 校: 湖南大学
专 业: 计算机软件与理论
关键词: 模式分类 数据分类技术 最近邻算法 毒物分类系统
分类号: TP311.13
类 型: 硕士论文
年 份: 2005年
下 载: 316次
引 用: 2次
阅 读: 论文下载
内容摘要
数据分类技术是一种强有力的分析手段,它旨在生成一个分类函数或分类模型,由该模型把数据库中的数据项映射到某一给定类别中。现有的数据分类算法大体可以划分为两大类:积极学习方法与消极学习方法。其中消极学习型中应用最广泛的是最近邻分类算法。由于消极方法使用很多不同的局部线性函数来形成对目标函数隐含的全局逼近,具有比积极方法更丰富的假设空间。因此对消极方法及其应用的研究是一个非常重要的课题。 本文首先分析了K近邻(kNN)算法的理论基础及实现方法,然后分析了kNN算法的相关特征,包括kNN算法的计算复杂度、分类精确度及存储开销等问题。 针对最近邻算法在数据分类中存在的问题,本文提出一种预聚类处理的加权kNN分类算法模型,即通过对训练数据集进行预处理,分析训练数据集的特征,对其进行聚类处理并建立分类模型。实验证明,新的算法不仅能有效缩减原kNN算法在分类过程中的计算开销,而且能够自动确定最佳的k值,且分类精确度较经典的kNN算法有所提高。 为了满足中毒分类系统的需要,本文基于P-tree数据结构提出了一种改进的P-trees kNN分类算法。算法根据不同临床中毒表现对应不同毒物的权值向量构成“中毒表现加权向量表”,并将它作为训练数据集的属性值;构建中毒表现加权向量表的P树,并选择HOBBit距离作为距离度量标准,运用P-trees kNN分类算法进行毒物分类。运用医学临床毒物数据作为实验数据进行实验后得到的实验结果表明该算法能够取得令人满意的分类精确度。 基于相关的算法,并结合中毒诊断及毒物咨询的实际应用需要,一个B/S体系结构的毒物分类系统原型得以实现。该系统提供了相关必要的功能,能作为医学中毒诊断的计算机辅助工具而直接应用于医学界,具有较高的实用价值和良好的市场前景。
|
全文目录
摘要 7-8 ABSTRACT 8-10 插图索引 10-11 附表索引 11-12 缩略词注释表 12-13 第1章 绪论 13-19 1.1 前言 13 1.2 毒物分类系统应用现状 13-14 1.3 数据分类技术 14-16 1.3.1 积极学习方法 14-15 1.3.2 消极学习方法 15 1.3.3 两种方法的比较 15-16 1.4 k近邻方法(kNN) 16 1.5 本文所做工作 16-17 1.6 论文结构 17-19 第2章 基础知识 19-28 2.1 最近邻(NN)分类算法简介 19-21 2.2 最近邻(NN)分类算法实现 21-22 2.3 降低最近邻算法搜索复杂度 22-24 2.4 k最近邻(kNN)分类算法相关分析 24-27 2.5 小结 27-28 第3章 基于预聚类处理的加权kNN分类算法 28-35 3.1 引言 28-29 3.2 kNNModel算法 29-30 3.2.1 kNNModel算法的基本思想 29-30 3.2.2 kNNModel算法的缺陷 30 3.3 基于预聚类处理的加权kNN算法 30-33 3.4 实验及评估 33-34 3.5 小结 34-35 第4章 P-trees kNN分类算法 35-42 4.1 引言 35 4.2 P-trees简介 35-36 4.3 基于P-tree的kNN分类算法 36-38 4.3.1 距离度量标准 36-37 4.3.2 PkNN-使用P树的kNN分类算法 37-38 4.4 实验结果及分析 38-41 4.4.1 数据收集及预处理 38 4.4.2 中毒表现加权向量表 38-39 4.4.3 毒物的判定过程 39-41 4.5 小结 41-42 第5章 毒物分类系统 42-52 5.1 引言 42 5.2 系统需求分析 42-44 5.3 设计与实现方法 44-49 5.3.1 系统设计 44-45 5.3.2 模块一:用户及权限管理 45-46 5.3.3 模块二:毒物查询 46-47 5.3.4 模块三:中毒诊断 47-48 5.3.5 模块四:数据库维护 48-49 5.4 系统图形界面GUI 49-51 5.5 小结 51-52 结论 52-54 参考文献 54-58 致谢 58-59 附录A 攻读学位期间完成的学术论文 59-60 附录B 攻读学位期间参与完成的项目 60
|
相似论文
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于多核学习的高性能核分类方法研究,TP391.41
- 模式分类中数据选择方法的研究,TP391.4
- 彩色人脸图像颜色校正及其在肝病诊断中的应用研究,TP391.41
- 数据感知技术在动感地带品牌客户分类中的应用,TP311.13
- 基于案例推理的工作流异常处理研究与实现,TP311.52
- 最近邻方法在填充和分类中应用的新技术,TP311.13
- 基于二维步态的身份识别,TP391.41
- 基于W-SVM的数字通信调制模式分类技术的研究,TN914.3
- 案例推理和关联规则在汽车故障智能诊断中的应用,U472
- 基于遗传算法和线性分类器的~(31)P磁共振波谱肝癌诊断,TP391.41
- 基于流形学习的分类算法及其应用研究,TP311.13
- 基于D-S证据理论的模式分类问题的研究,TP181
- 数控切绘系统曲线拟合及轨迹优化研究与应用,TG659
- M2M模型及其在大型游戏中的应用,TP391.41
- 图像纹理特征的提取和图像分类系统研究及实现,TP391.41
- 基于CPN的分类方法在遥感影像分类中的应用研究,TP751
- 基于本体的试卷自动生成系统研究,TP319
- 软件用语中概念隐喻的认知研究,H05
- 基于模式识别算法的入侵检测研究,TP393.08
- SOM网络和广义回归网络及其混合模型研究,TP183
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|