学位论文 > 优秀研究生学位论文题录展示

半监督联合训练分类方法研究及其应用

作 者: 蔡晰
导 师: 郭躬德
学 校: 福建师范大学
专 业: 计算机应用技术
关键词: 半监督 分类 联合训练 定量构效关系 化合物毒性
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 34次
引 用: 0次
阅 读: 论文下载
 

内容摘要


常规的监督分类算法需要有大量的有标签数据才能构建出很好的分类模型,从而获得比较好的分类效果,但是现实中的情况往往难以满足这个条件,因此能够挖掘未标签数据中所包含的大量信息的半监督分类方法有重大的现实意义。本文对最重要的半监督分类算法之一的联合训练算法进行研究。在联合训练采用的分类器组合结构方面,对传统的两个分类器进行了改进,额外增加了仲裁分类器以弥补前两个分类器的不足,并提出了相应的分类器选择方法。此外,对数据集质量方面也进行了改进,提出了符合分类器结构的新颖训练集处理方法,构造出最.有利于分类的训练集,而因此被删除的点所引起的信息量损失由半监督分类从未标签数据中挖掘进行弥补。在半监督分类的过程中,如果错误标记的点被加入训练集中会影响分类效果,本文采用改进的最近邻规则方法对每一轮新标签进行检查,防止错误标记的数据加入到数据集中,提高了模型的健壮性,保证了选中的未标签数据点的安全性。在保证安全性的同时不可避免的删除部分未标签数据。在一些情况下,未标签数据也是有限的,尝试采用针对不平衡数据的SMOTE算法来补充更多的信息量,弥补为保证数据安全性造成的信息量损失。实验结果表明采用本文的算法比传统的联合训练算法有着更好的分类效果。

全文目录


中文摘要  2-3
Abstract  3-4
中文文摘  4-7
目录  7-9
绪论  9-15
  第一节 研究背景和意义  9-10
  第二节 半监督联合训练介绍  10-15
第一章 结合集成学习的联合训练算法  15-31
  第一节 背景介绍  15-18
    1.1 分类问题描述  15-16
    1.2 联合训练问题描述  16
    1.3 经典的联合训练算法  16-17
    1.4 数据集介绍  17-18
  第二节 联合训练算法中基础分类器选择  18-19
  第三节 基础分类器融合策略  19-20
  第四节 改进的联合训练算法  20-25
    4.1 问题描述  20-21
    4.2 基础分类器选择  21-22
    4.3 分类器融合步骤  22-23
    4.4 测试阶段  23-24
    4.5 算法流程  24-25
  第五节 实验和结果分析  25-30
    5.1 实验环境和准备  25-27
    5.2 实验结果和分析  27-30
  第六节 本章总结  30-31
第二章 带筛选机制的联合训练算法  31-42
  第一节 筛选的意义  31-32
  第二节 有筛选机制的联合训练算法  32-37
    2.1 问题描述  32
    2.2 编辑训练集提高训练集质量  32-33
    2.3 联合训练算法  33
    2.4 筛选机制保证训练集质量  33-34
    2.5 仲裁分类器  34
    2.6 改进的联合训练算法  34-37
  第三节 实验及分析  37-41
  第四节 本章小结  41-42
第三章 有插值的联合训练算法  42-53
  第一节 插值的意义  42-43
  第二节 有插值的联合训练算法  43-48
    2.1 问题描述  43
    2.2 改进的联合训练算法  43
    2.3 改进的半监督过程  43-47
    2.4 仲裁分类器选取  47-48
  第三节 实验及分析  48-52
  第四节 本章小结  52-53
第四章 结论  53-56
参考文献  56-63
攻读学位期间承担的科研任务与主要成果  63-65
致谢  65-67

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于三维重建的焊点质量分类方法研究,TP391.41
  4. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  5. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  6. 上下文相关的词汇复述研究,TP391.1
  7. 基于仿生模式识别的文本分类技术研究,TP391.1
  8. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 多样性密度学习算法的研究与应用,TP181
  12. 计算智能在数字化卷烟叶组配方中的应用研究,TS44
  13. 基于中国土壤系统分类的土壤类型和界线确定研究,S155
  14. 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
  15. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  16. 面向公众的教育视频共建共享平台的设计与实践研究,G434
  17. 基于土壤系统分类的土壤调查方法研究,S155
  18. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  19. 基于HJ卫星混合像元分解的水稻生长监测技术研究,S511
  20. 基于连锁图的QTL综合分析方法研究,S562
  21. 人工免疫分类和异常识别算法的改进,R392.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com