学位论文 > 优秀研究生学位论文题录展示

互联网图像语义表达规律分析及主题发现

作 者: 刘先明
导 师: 姚鸿勋
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 图像语义表达 图像标注 主题模型 机器学习 互联网社区 统计规律分析
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 67次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着互联网和多媒体共享社区的发展,尤其是Flickr、YouTube等新兴社区的快速发展,多媒体内容的规模正成爆炸式增长。如何有效、准确的对这些内容进行管理、检索变得尤为重要。而这些应用的基础,就是对图像内容语义合理的表达方式。这篇文章以互联网社区图像语义表达及管理组织方式为研究背景,以图像标注为主要应用目标,旨在分析和研究互联网图像语义表达的统计规律和主题发现策略,并提出互联网社区图像语义精确表达和主题发掘的理论和应用框架,并通过大规模数据集上的实验,对理论框架和算法进行了验证。文章首先分析了互联网社区图像标注及描述的统计规律,对比于传统的自然语言处理和文本信息检索领域的统计规律,得到了三条指导理论和应用研究的统计假设,分别是“稀疏分布假设”,“局部收敛性假设”和“全局收敛性推论”。以这三个假设为出发点,研究了主题和关键词的可选择性,并提出关键词的完备集理论。完备集理论通过对异质数据分布的分析,建立最小化能量误差准则,定性的对主题和关键词的可选择性进行了分析和评价。在此研究基础之上,建立视觉主题模型,通过无监督的机器学习方法和视觉差异性最大化准则,发掘大规模数据集下视觉主题的分布,并将其应用于互联网社区图像的关键词选择以及图像标注应用之上。实验结果对本文提出的理论及框架的正确性和有效性提供了有力的证据。在文章的最后,对现有工作做了总结并对未来工作做了合理展望。整个研究以对大量数据的统计分析为出发点,理论研究为依据,提出了解决互联网图像语义表达和主题发现理论和应用框架,并应用于图像标注,对后续研究提供了有价值的参考。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-24
  1.1 课题的研究背景  9
  1.2 基于内容的图像检索研究现状  9-12
  1.3 基于关键词的图像语义表达方法  12-19
    1.3.1 基于判别方法的图像标注  12-13
    1.3.2 基于生成方式的图像标注——主题模型  13-16
    1.3.3 互联网社区图像的语义表达  16-19
  1.4 基于关键词的图像语义表达中遇到的问题  19-21
  1.5 论文的主要工作及章节安排  21-24
    1.5.1 论文的主要工作  21-22
    1.5.2 论文的组织结构  22-24
第2章 互联网图像标注的统计规律研究  24-32
  2.1 引言  24
  2.2 假设及前提  24-26
  2.3 互联网图像标注的统计规律  26-31
    2.3.1 稀疏分布假设  26-29
    2.3.2 局部收敛性  29-30
    2.3.3 全局收敛性  30-31
  2.4 本章小结  31-32
第3章 关键词完备集理论  32-39
  3.1 引言  32
  3.2 关键词完备集理论及双向LSA 算法  32-36
    3.2.1 关键词完备性理论  32-33
    3.2.2 双向LSA 算法  33-35
    3.2.3 双向LSA算法用于图像标注  35-36
  3.3 实验  36-38
  3.4 本章小结  38-39
第4章 视觉主题模型  39-53
  4.1 引言  39
  4.2 视觉主题模型框架  39-41
    4.2.1 视觉主题的定义  40-41
    4.2.2 视觉主题模型框架  41
  4.3 关键词语义相关性聚类  41-44
    4.3.1 KNN vs.ε-Ball  43-44
  4.4 视觉差异性聚类  44-46
    4.4.1 视觉差异性的需要  44
    4.4.2 视觉差异性度量  44-45
    4.4.3 基于视觉差异性的挖掘算法  45-46
  4.5 基于视觉主题模型的图像标注算法  46-48
    4.5.1 利用视觉主题选取关键词  46-47
    4.5.2 基于视觉主题的图像标注算法  47-48
  4.6 实验结果及分析  48-52
    4.6.1 实验数据  48-49
    4.6.2 实验结果  49-51
    4.6.3 结果分析  51
    4.6.4 未来工作总结  51-52
  4.7 本章小结  52-53
结论  53-54
参考文献  54-58
攻读硕士学位期间发表的论文  58-60
致谢  60

相似论文

  1. 基于数据分布特征的文本分类研究,TP391.1
  2. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  3. 税务数据仓库系统的设计与应用,TP311.13
  4. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  5. Android恶意软件静态检测方案的研究,TP309
  6. 监督主题模型的研究与应用,TP391.1
  7. 基于失真效应的图像质量评价与分类,TP391.41
  8. 基于学习的逆向运动学人体运动合成,TP391.41
  9. 基于内容的网页恶意代码检测的研究与实现,TP393.092
  10. 学术主页信息抽取系统的研究,TP393.092
  11. 社会化网络中的推荐算法及其应用,TP391.3
  12. 数据挖掘在邮件反垃圾系统中的应用,TP393.098
  13. 基于点击数据和搜索结果片断的命名实体挖掘,TP391.3
  14. 基于自学习的社会关系抽取的研究,TP391.1
  15. 基于统计与图模型的若干机器学习算法及其应用,TP181
  16. P2P流量识别方法研究,TP393.06
  17. 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
  18. 基于SIFT特征和SVM的场景分类,TP391.41
  19. 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
  20. 基于丰富特征和多核学习的蛋白质关系抽取,Q51
  21. 图像与文本数据间的异构迁移学习,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com