学位论文 > 优秀研究生学位论文题录展示

多标记学习算法及其在标签推荐中应用研究

作 者: 何颖婧
导 师: 王志海
学 校: 北京交通大学
专 业: 计算机科学与技术
关键词: 数据挖掘 分类 多标记 推荐系统 标签推荐
分类号: TP391.3
类 型: 硕士论文
年 份: 2014年
下 载: 16次
引 用: 0次
阅 读: 论文下载
 

内容摘要


信息技术的飞速发展带来了信息过载问题,它使用户很难从海量的数据中获取有用的信息.自动分类作为解决信息过载问题的有效手段,已经在众多领域得到广泛应用.传统的分类都假设实例只与一个标记相关,而在类似文本、图像、视频等领域中,实例通常都与多个标记相关,传统的分类算法也就不再适用,因此对多标记数据的学习成为重要的研究课题.标签推荐则随着标签网站的迅速发展成为热门的研究问题之一.本文主要研究多标记学习算法,并根据多标记学习与标签推荐的预测结果都是多个元素的特点,对多标记学习算法在标签推荐中的应用展开相关的研究.本文首先对多标记学习与标签推荐的概念进行阐述,分别总结了多标记学习与标签推荐的相关算法,并分析了各算法的优缺点.其次,提出了基于标记间关系的多标记学习算法,该算法对元级特征进行了改进,改进后的简化元级特征保留了元级特征能够表示实例与标记的关系的特点,同时减少了输入空间的维度.在此基础上,该算法提出结合简化的元级特征以及标记空间得到标记间关系矩阵的方法,预测阶段结合该矩阵与简化的元级特征得到预测结果.在多标记数据集上的实验结果表明,该算法能够有效的利用标记间的关系,且更适用于对标记间依赖关系较强的数据集进行分类.最后,根据标签推荐的特点,对多标记学习算法的部分实现进行了改进,提出了用于标签推荐的多标记学习算法.训练阶段,提出了以标签共现次数来计算标签间关系矩阵的方法.推荐阶段,提出了以标签向量来表示用户与资源的历史信息,结合该标签向量与标签间关系矩阵得到推荐的标签集合.在标签数据集上的实验结果表明,该改进算法相较于其他标签推荐算法,较好的利用了标签间关系,推荐的标签集合更准确.

全文目录


致谢  5-6
中文摘要  6-7
ABSTRACT  7-11
1 引言  11-14
  1.1 研究背景与意义  11-13
  1.2 本文主要研究内容  13
  1.3 本文组织结构  13-14
2 多标记学习与标签推荐  14-30
  2.1 多标记学习  14-25
    2.1.1 算法适应  15-18
    2.1.2 问题转化  18-22
    2.1.3 多标记学习算法性能评价指标  22-25
  2.2 标签推荐  25-30
    2.2.1 标签推荐算法  27-29
    2.2.2 标签推荐算法的评价指标  29-30
3 基于标记间关系的多标记学习算法MLLR  30-41
  3.1 MLLR算法的算法思想  30-37
    3.1.1 多标记数据集的元级特征  31-34
    3.1.2 标记间关系的表示  34-37
  3.2 MLLR算法的算法描述  37-39
  3.3 MLLR算法分析  39-41
4 MLLR算法在标签推荐中的应用  41-50
  4.1 面向标签推荐的MLLR算法的算法思想  41-46
    4.1.1 标签推荐与多标记学习  41-43
    4.1.2 标签间关系的表示  43-44
    4.1.3 标签推荐结果的产生  44-46
  4.2 面向标签推荐的MLLR算法的算法描述  46-49
  4.3 算法分析  49-50
5 实验  50-61
  5.1 实验环境  50
  5.2 MLLR算法实验  50-56
    5.2.1 实验数据集  51
    5.2.2 实验设计  51-52
    5.2.3 实验结果与分析  52-56
  5.3 面向标签推荐的MLLR算法实验  56-61
    5.3.1 实验数据集  56-57
    5.3.2 实验设计  57-58
    5.3.3 实验结果与分析  58-61
6 总结与展望  61-63
参考文献  63-67
作者简历  67-69
学位论文数据集  69

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于三维重建的焊点质量分类方法研究,TP391.41
  4. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  5. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  6. 基于仿生模式识别的文本分类技术研究,TP391.1
  7. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  8. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  9. 基于图像的路面破损识别,TP391.41
  10. 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
  11. 基于数据挖掘技术的保健品营销研究,F426.72
  12. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  13. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  14. 计算智能在数字化卷烟叶组配方中的应用研究,TS44
  15. 基于中国土壤系统分类的土壤类型和界线确定研究,S155
  16. 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
  17. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  18. 基于土壤系统分类的土壤调查方法研究,S155
  19. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  20. 基于HJ卫星混合像元分解的水稻生长监测技术研究,S511
  21. Bicluster数据分析软件设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com