学位论文 > 优秀研究生学位论文题录展示
基于张量分解的视觉显著性算法研究
作 者: 李寅
导 师: 周越
学 校: 上海交通大学
专 业: 模式识别与智能系统
关键词: 视觉显著性 张量分解 增量编码长度 子空间学习
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 321次
引 用: 0次
阅 读: 论文下载
内容摘要
注意选择机制,又称视觉显著性,是在时空域大量视觉信息中选择特定感兴趣区域的过程。视觉显著性是生物视觉系统的关键问题之一,提供了对于视觉数据的高效筛选方法。本文考察了“自下而上”的视觉显著性的计算模型。本文的重点是显著性的成因的可能解释,以及数据冗余性与视觉显著性之间的关系。本文的主要工作与创新点包括以下两点:基于增量信息的视觉显著性模型:该模型将显著性视为编码长度的直接体现,给出了影响视觉显著性的成因的一种可能解释。具体而言,本文在时空域中心邻域结构的基础上,利用限失真编码下的增量信息建立视觉显著性的计算模型,即将增量编码长度视为视觉显著性的度量。为了求解该模型,本文进一步考察了稀疏表示与限失真编码理论,在不同假设下,提出了两种高效的求解方法,即高斯条件信息熵与稀疏编码信息熵,并对其进行了广泛的实验。显著性区域检测和人眼运动预测实验结果表明,这一模型可以取得高效和可靠的视觉显著性。实验结果验证了这一模型的有效性。该部分研究内容发表于ACCV09,ICIP09。图像张量特征的分解方法及其在视觉显著性中的应用:本文提出了最优秩-稀疏张量分解方法。相比现有方法,最优秩-稀疏张量分解可以提取最优维度条件下的不变子空间,并同时分离异常模式。结合该分解方法以及图像特征的张量描述,本文提出了基于最优秩-稀疏张量分解的视觉显著性模型。本文进行了广泛的实验,实验结果表明最优秩-稀疏张量分解方法可以稳健分离不变子空间学习与异常模式,故而在包括眼动预测、前景提取、图像降噪、人脸分析等一系列实验上取得了优异的表现。该部分研究内容发表于ECCV10,ICIP10。
|
全文目录
摘要 3-5 ABSTRACT 5-11 第一章 绪论 11-15 1.1 视觉显著性的计算模型概述 12-13 1.2 图像的张量描述与分析概述 13-14 1.3 论文的主要研究内容与章节安排 14-15 第二章 研究背景与国内外研究现状 15-19 2.1 视觉显著性的计算模型 15-17 2.1.1 视觉注意机制 15-16 2.1.2 显著性的计算模型 16-17 2.2 张量子空间学习方法 17-18 2.2.1 向量数据的子空间学习方法 17 2.2.2 张量数据的子空间学习方法 17-18 2.3 本章小结 18-19 第三章 基于增量信息的显著性模型 19-34 3.1 视觉编码方式概述 19-21 3.1.1 独立成分分析 19-20 3.1.2 稀疏编码 20-21 3.2 基于增量信息的视觉显著性模型 21-24 3.2.1 时空域中心邻域结构 22 3.2.2 模型建立 22-24 3.3 增量编码长度显著性模型的求解 24-27 3.3.1 高斯条件信息熵 24-25 3.3.2 基于稀疏编码长度的信息熵 25-26 3.3.3 显著性物体的判定 26 3.3.4 算法流程 26-27 3.4 实验结果与分析 27-33 3.4.1 数据集与评价方式 27-29 3.4.2 参数选择 29 3.4.3 自然图像的显著性 29-31 3.4.4 视频序列的显著性 31-33 3.5 本章小结 33-34 第四章 基于最优秩-稀疏张量分解的显著性模型 34-54 4.1 张量的基本运算与分解 34-37 4.1.1 张量的基本运算 34-35 4.1.2 张量分解方法 35-37 4.2 图像的张量特征描述 37-39 4.2.1 图像特征的天然张量结构 37-38 4.2.2 图像特征的张量组织方式 38-39 4.3 最优秩-稀疏张量分解模型 39-45 4.3.1 模型建立 40-42 4.3.2 模型简化 42-43 4.3.3 模型求解 43-45 4.4 基于最优秩-稀疏分解的视觉显著性模型 45-47 4.4.1 基于ICA 的图像张量化描述 45-46 4.4.2 基于最优秩-稀疏分解的显著性模型 46-47 4.5 实验结果与分析 47-52 4.5.1 眼动数据的预测 48-49 4.5.2 视频前景提取 49-50 4.5.3 序列图像去噪 50-51 4.5.4 人脸图像分析 51-52 4.6 本章小结 52-54 第五章 总结与展望 54-56 5.1 主要工作与创新点 54 5.2 后续研究工作 54-56 参考文献 56-61 致谢 61-62 攻读硕士学位期间已发表或录用的论文 62-64
|
相似论文
- 基于稀疏非负矩阵分解的图像检索,TP391.41
- 贝叶斯框架下的图像显著性检测,TP391.41
- 社会标签推荐张量分解方法研究,TP393.09
- 基于最大后验概率与子空间学习的二维人脸变换,TP391.41
- 基于子空间学习的复杂场景多姿态人脸识别,TP391.41
- 基于子空间的人脸识别方法的研究,TP391.41
- 基于视觉注意力和形状简化的抽象化绘制方法研究,TP391.41
- 基于振动信号的高速铁路伤损探测方法,TN911.23
- 多维正弦信号参数估计算法研究,TN911.7
- 距离测度学习理论与应用研究,TP181
- 雷达辐射源个体识别中的分类器设计与子空间学习,TN974
- 基于子空间学习的人脸特征分析及应用,TP391.41
- 图像子空间聚类与分类算法研究,TP391.41
- 基于视觉感知的视频质量评价方法,TP391.41
- 非负矩阵分解问题算法的研究,O151.21
- 智能模式识别新方法及其应用研究,TP391.4
- 基于稀疏表示的协同入侵检测,TP393.08
- 基于自然场景统计特性的视觉显著性模型研究,TP391.41
- 基于MATLAB平台的2D对称和非对称应力张量可视化研究,TP391.41
- 基于视觉注意机制的物体显著性研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|