学位论文 > 优秀研究生学位论文题录展示

基于中层语义的图像场景分类算法研究

作　者: 王同刚
导　师: 郎丛妍
学　校: 北京交通大学
专　业: 计算机科学与技术
关键词: 场景分类底层特征视觉词包主体模型分块PLSA模型
分类号: TP391.41
类　型: 硕士论文
年　份: 2011年
下　载: 191次
引　用: 0次
阅　读: 论文下载

内容摘要

随着多媒体信息技术的迅猛发展,图像数据以前所未有的速度增长。面对海量的图像数据,利用计算机对数据进行有效管理成为一项紧迫任务。在此基础上提出的图像场景分类对图像检索、目标识别、计算机视觉等领域都有较大的作用。图像场景分类就是根据图像内容信息,自动地将图像分为诸如海岸、森林、城市等场景。场景分类的方法分为基于底层场景分类和基于中层的场景分类。由于图像底层特征与高层语义之间存在鸿沟,因此基于底层特征难以有效地实现场景分类。本文从图像的底层特征开始阐述,围绕建立中间语义,最终完成图像的场景分类。视觉词典是中间语义的基础,本文通过提取底层视觉特征,进行K-means聚类生成视觉词语,从而建立视觉词包。图像的描述就由原来的底层特征变为视觉词语的概率分布。由于词典中出现同义和多义的问题,借鉴了文本统计中的LSA思想。我们建立主题模型,利用概率潜在语义分析(PLSA)发现与图像场景相对应的潜在主题,采用最大似然模型完成图像的场景分类。但此方法直接从视觉词语出现的总体情况进行场景分类,并没有到考虑图像的空间分布。鉴于此,我们在原来的基础在将图像进行分块,把每个分块作为一个整体采用PLSA模型提取潜在主题,最后将各个分块的潜在主题向量合并作为支持向量机的输入向量完成图像的场景分类。实验表明,该方法引进了有监督的SVM,虽然增加了时间的复杂度,但此方法的场景分类精度更高。

全文目录

致谢  5-6
中文摘要  6-7
ABSTRACT  7-10
1 图像场景分类概述  10-16
  1.1 引言  10
  1.2 课题研究意义  10-11
  1.3 课题研究目的  11-12
  1.4 场景分类技术的发展现状  12-14
    1.4.1 中间语义场景分类方法  13-14
  1.5 论文组织结构  14-16
2 底层特征与语义鸿沟  16-28
  2.1 颜色特征  16-18
  2.2 纹理特征  18-20
  2.3 尺度不变特征变换  20-24
  2.4 语义鸿沟  24-28
    2.4.1 基于对象本体论定义高层语义  25-26
    2.4.2 机器学习方法建立底层视觉特征与高层语义的关系  26-27
    2.4.3 相关反馈学习用户主观意图  27
    2.4.4 生成语义模板支持高层图像检索  27-28
3 图像中间语义的表示模型  28-39
  3.1 图像语义  28-29
    3.1.1 语义的概念  28
    3.1.2 语义的框架  28-29
  3.2 基于颜色、纹理的中间语义  29-32
  3.3 视觉词包  32-34
  3.4 主体模型  34-39
    3.4.1 同义和多义  34-35
    3.4.2 概率潜在语义分析  35-38
    3.4.3 基于PLSA方法的语义提取  38-39
4 基于主题语义的场景分类  39-46
  4.1 基于PLSA场景分类  39-41
  4.2 基于分块PLSA场景分类  41-46
    4.2.1 支持向量机简介  41-44
    4.2.2 训练分类器  44-46
5 实验结果及分析  46-54
  5.1 实验结果  46-49
  5.2 场景分类性能评价  49-54
    5.2.1 词典容量对分类效果的影响  50-51
    5.2.2 主题数对分类效果的影响  51
    5.2.3 两种方法的性能比较  51-54
6 结论与展望  54-55
参考文献  55-57
作者简历  57-59
学位论文数据集  59

基于中层语义的图像场景分类算法研究

内容摘要

全文目录

相似论文