学位论文 > 优秀研究生学位论文题录展示

半监督学习中协同训练与多视图方法的比较及改进

作 者: 卢加磊
导 师: 丁香乾
学 校: 中国海洋大学
专 业: 计算机软件与理论
关键词: 半监督学习 多视图EM 协同训练 贝叶斯分类器 烟草数据分类
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 72次
引 用: 1次
阅 读: 论文下载
 

内容摘要


近几年来,随着数据分析和数据挖掘等领域的实际问题广泛提出,半监督学习在理论和实际应用研究中获得了长足的发展,半监督学习研究主要关注当训练数据的部分信息缺失的情况下,如何获得具有良好性能和推广能力的学习机器。协同训练和多视图方法是半监督学习理论的基本方法,在实际问题解决方案中这两种方法被越来越广泛的采用,并取得了较好的结果。本文首先从半监督学习的理论体系入手,概述半监督学习理论产生渊源及发展过程,主要介绍了人工智能与机器学习的发展,半监督学习在数据挖掘体系中的作用,半监督学习的研究现状与进展以及简要介绍了半监督学习主要算法框架。对贝叶斯理论、期望最大化算法、有限混合模型三个方面进行了剖析,这些理论算法是本文研究的基础。其次介绍了协同训练方法的注意点及应用背景。指出属性集合的聚类假设和分割集合的PAC设置是该方法的限制之一,并阐述了协同训练方法在自然语言处理和基于内容的图像检索这两个研究热点的应用问题。然后,本文对半监督框架下传统多视图EM算法的实现及算法中使用的公式推理细节进行说明;主要针对贝叶斯分类器和基于高斯混合模型的多视图EM算法进行分析,并对上述算法进行设计上的高进,以提高该算法在多视图框架下获取合适参数的能力,特别指出的是,改进后的算法设计在后续的实验中取得较好的分类结果;多视图EM算法的具体实现的注意点以及如何协调不同视图的权重参数等内容进行阐述。最后,本文采用烟草数据进行验证实验,实验结果表明该协同训练方法与传统算法相比在分类准确率方面有了一定的提高。两种半监督学习方法的对比实验中,多视图方法在这批数据上有较好的学习能力。这些实验结果,为烟草企业在产品配方设计中的数据分类提供了数据支持,并且在企业的产品设计中可以得到推广应用,以提高烟草企业在数据分类处理中的实际应用能力。

全文目录


摘要  5-6
Abstract  6-9
1 绪论  9-11
  1.1 研究的背景和意义  9-11
  1.2 本文研究的主要工作  11
  1.3 本文的组织结构  11
2 半监督学习  11-31
  2.1 人工智能与机器学习  11-14
  2.2 半监督学习的发展  14-17
    2.2.1 监督学习  14-15
    2.2.2 无监督学习  15-16
    2.2.3 半监督学习  16-17
  2.3 半监督学习方法概述  17-22
    2.3.1 基于支持向量机的半监督学习  18-19
    2.3.2 基于核函数的半监督学习  19-21
    2.3.3 基于K均值的半监督学习  21-22
  2.4 几个相关的基础理论介绍  22-30
    2.4.1 贝叶斯理论  22-28
    2.4.2 期望最大化(EM)算法  28-30
    2.4.3 有限混合模型框架  30
  2.5 小结  30-31
3 协同训练方法  31-44
  3.1 协同训练的基本理论  31-36
  3.2 协同训练的方法分析  36-42
    3.2.1 协同训练的PAC定义  36-41
    3.2.2 协同训练的两个角度  41-42
  3.3 协同训练方法的应用  42-44
    3.3.1 自然语言处理  42-43
    3.3.2 基于内容的图像检索  43-44
  3.4 小结  44
4 多视图方法  44-51
  4.1 传统多视图EM算法设计  44-47
  4.2 多视图EM算法的改进设计  47-49
  4.3 多视图算法的实现  49-51
  4.4 小结  51
5 烟草数据分类分析  51-65
  5.1 应用背景分析  51-54
    5.1.1 烟草行业的数据分析现状  51-52
    5.1.2 数据的来源  52-54
  5.2 烟草原料数据分析的算法设计  54-62
    5.2.1 分类器设计要求  54
    5.2.2 协同训练算法设计  54-56
    5.2.3 朴素贝叶斯分类器多视图EM算法  56-59
    5.2.4 高斯混合模型的多视图EM算法  59-62
  5.3 实验结果与分析  62-65
    5.3.1 协同训练方法的比较实验  62-63
    5.3.2 多视图方法的比较实验  63-65
  5.4 小结  65
6 总结与展望  65-67
  6.1 本文总结  65-66
  6.2 下一步工作  66-67
参考文献  67-71
致谢  71-72
个人简历  72
发表的学术论文  72

相似论文

  1. 基于改进的非参数回归交通流量预测方法,F570
  2. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  3. 视频数据中人体动作的分类研究,TP391.41
  4. 基于半监督哈希算法的图像检索方法研究,TP391.41
  5. 基于半监督学习的时间序列分类研究与实现,TP181
  6. 贝叶斯分类算法的研究与应用,TP18
  7. 面向工程监理的多Agent信息智能检索机制研究,TP391.3
  8. 数据挖掘在研究生调剂中的应用研究,TP311.13
  9. 基于半监督SVM的入侵检测研究,TP393.08
  10. 半监督分类技术及其算法研究,TP18
  11. 纠错输出编码算法的研究及其应用,TP311.13
  12. 基于半监督学习的入侵检测技术研究,TP393.08
  13. 基于图的半监督学习算法研究,TP181
  14. 监督和半监督典型相关分析及其应用研究,TP181
  15. 距离测度学习理论与应用研究,TP181
  16. 基于半监督学习和决策融合的人脸表情识别方法研究,TP391.41
  17. 基于半监督学习的中文问句分类研究,TP391.1
  18. 基于少量标记数据约束聚类算法的入侵检测技术研究,TP393.08
  19. 基于支持向量机的水电故障分类器的设计与实现,TV738
  20. 面向金融问答的论坛观点挖掘,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com