学位论文 > 优秀研究生学位论文题录展示

基于SVDD的多示例学习方法的研究

作 者: 龙哲
导 师: 方景龙
学 校: 杭州电子科技大学
专 业: 计算机应用技术
关键词: 多示例学习 机器学习 分类 支持向量机 支持向量数据描述
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 21次
引 用: 0次
阅 读: 论文下载
 

内容摘要


上世纪90年代,Dietterich等人在药物活性预测问题的研究中提出了多示例学习的概念。在该学习模型中,训练样本的歧义性比较特殊,使得多示例学习模型与传统的机器学习模型有很大的差别。由于多示例学习本身独特的性质和良好的应用前景,被称为是与监督学习、非监督学习和强化学习并列的第四种机器学习框架,并起了国内外研究者的极大关注。经过近几年的研究,多示例学习的应用越来越广泛。在多示例问题中,由于正包中的示例标签类别是不确定的,仅仅知道这个正包中至少包含一个正示例。国内外学者针对多示例学习的独特性质,提出了解决多示例学习问题的一些途径。本文分析了现有算法的不足,然后基于SVDD的模型提出了两种新的算法:MI-NSVDD_B算法和MI-NSVDD_I算法。本文主要研究了以下内容:首先对多示例学习的研究现状进行了综述。然后介绍了SVM和支持向量描述域的概念,并针对NSVDD做了详细的理论推导。然后介绍了两种解决多示例学习问题的支持向量数据描述算法mi-NSVDD算法和MI-NSVDD算法,并且对这两种算法进行了一定的分析,提出了该算法所存在的一些缺陷和不足。其次,本论文针对多示例学习问题的特点,提出了一种消除包中示例歧义性的方法:这个算法先通过概率的方法对正包中所有的示例进行精度预测,然后在每个正包中选出这个包中预测精度最高的示例来代表这个包,从而把包转换成为了一个单独的示例。这些示例组成的集合即为消除歧义后的正示例集合。然后又针对负包提出了一种选择最具有代表性的负示例的算法:把负包中每个示例与选出的消歧义后的正示例集合的距离计算出来,然后选择距离最远的示例作为这个负包中代表性的示例,从而同样也把包转换成了单示例。最后,提出了两种特征映射方法:基于包等级的特征映射和基于示例等级的特征映射。这两个算法可以分别把示例进行映射,然后使用NSVDD算法对进行映射后的单示例问题进行学习和求解,并得到了最终的分类器。针对不同的映射方法提出了两种基于支持向量数据描述的多示例学习算法:MI-NSVDD_B算法和MI-NSVDD_I算法。然后论文在实验部分验证了MI-NSVDD_B算法和MI-NSVDD_I算法的有效性。综上所述,本文所提出的MI-NSVDD_B算法和MI-NSVDD_I是能够有效解决多示例学习问题的新的算法。

全文目录


摘要  5-6
ABSTRACT  6-10
第一章 绪论  10-15
  1.1 问题的提出  10-11
  1.2 研究背景及意义  11-13
    1.2.1 研究背景  11-12
    1.2.2 研究意义  12-13
  1.3 论文的组织结构  13-15
第二章 多示例学习的研究  15-23
  2.1 多示例学习基础  15-19
    2.1.1 多示例学习理论  15-16
    2.1.2 多示例学习算法  16-19
    2.1.3 多示例学习应用  19
  2.2 多示例学习研究现状  19-22
    2.2.1 多示例学习的可学习性研究  19-21
    2.2.2 多示例学习与传统机器学习区别研究  21-22
  2.3 本章小节  22-23
第三章 支持向量数据描述  23-45
  3.1 统计学理论  23-26
    3.1.1 学习模型  23-24
    3.1.2 经验风险最小化  24-25
    3.1.3 VC维  25
    3.1.4 结构风险最小化  25-26
  3.2 支持向量机  26-31
    3.2.1 线性可分支持向量机  27-28
    3.2.2 核函数  28-29
    3.2.3 序列最小优化算法  29-31
  3.3 基于支持向量机的多示例学习  31-33
    3.3.1 mi-SVM和MI-SVM算法  31-32
    3.3.2 DD-SVM算法  32-33
  3.4 支持向量数据描述  33-40
    3.4.1 单类支持向量描述  34-35
    3.4.2 带负类的支持向量数据描述  35-36
    3.4.3 支持向量数据数据描述求解方法  36-40
  3.5 基于SVDD的多示例学习方法  40-44
    3.5.1 mi-NSVDD算法  41-42
    3.5.2 MI-NSVDD算法  42-43
    3.5.3 mi-NSVDD算法与MI-NSVDD算法的分析  43-44
  3.6 本章小结  44-45
第四章 基于支持向量数据描述的多示例学习算法  45-59
  4.1 消除包中示例歧义性方法  45-48
    4.1.1 消除正包中示例歧义性的方法  45-47
    4.1.2 选择负包中最具有代表性的示例  47-48
  4.2 特征映射算法  48
    4.2.1 基于示例等级的特征映射算法  48
    4.2.2 基于包等级的特征映射算法  48
  4.3 MI-NSVDD_I算法  48-50
  4.4 MI-NSVDD_B算法  50-51
  4.5 实验数据集  51-57
    4.5.1 实验数据集的介绍  51-53
    4.5.2 MUSK数据集实验  53-55
    4.5.3 基于内容的图像检索数据集实验  55-57
  4.6 本章小结  57-59
第五章 总结与展望  59-61
  5.1 总结  59-60
  5.2 展望  60-61
致谢  61-62
参考文献  62-66
附录  66-67
详细摘要  67-70

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  3. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  4. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  5. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  6. 音乐结构自动分析研究,TN912.3
  7. 基于词义及语义分析的问答技术研究,TP391.1
  8. 基于三维重建的焊点质量分类方法研究,TP391.41
  9. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  10. 基于多示例学习的用户关注概念区域发现,TP391.41
  11. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  12. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  13. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  14. 上下文相关的词汇复述研究,TP391.1
  15. 基于仿生模式识别的文本分类技术研究,TP391.1
  16. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  17. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  18. 基于图像的路面破损识别,TP391.41
  19. 多样性密度学习算法的研究与应用,TP181
  20. 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
  21. 基于支持向量机的故障诊断方法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com