学位论文 > 优秀研究生学位论文题录展示
一种基于图像底层特征的对象粒认知方法研究
作 者: 李仲生
导 师: 张尧学; 李仁发
学 校: 湖南大学
专 业: 计算机应用技术
关键词: 显著对象 粒计算 拓扑信息系统 图像分割 图像标注
分类号: TP391.41
类 型: 博士论文
年 份: 2011年
下 载: 60次
引 用: 0次
阅 读: 论文下载
内容摘要
对象非监督发现、分割的应用领域相当广泛,包括图像理解、视频监控、图像和视频编辑、人机交互、图像和视频检索、视频编码以及对象识别等。分析已有的众多应用,发现有三点显得至关重要:一是所发现的对象与真实对象的逼近度,如边缘的吻合性等;二是所设计的应用算法的通用性和扩展能力,由于图像、视频种类繁多,一次性设计出通用性完美的发现、跟踪算法是不可能的,为达到无限地逼近真实对象的目的,相关算法具有持续升级能力和好的移植能力便显得十分必要;三是因众多资源有限的应用环境的出现,例如无线传感网等,为让图像、视频对象的非监督发现和跟踪能用于这些环境,相应的算法得轻便,易于硬化,最好是线性的。本文针对以上问题,以对象非监督提取和跟踪为目标,借鉴心理学的认知模型,基于底层特征构筑了一个对象粒认知平台,并将其用于显著对象的非监督粗糙提取。本文的主要工作包括:第一,针对复杂运动对象的跟踪失效情形,提出了一种基于颜色阈值和区域融合的方法。运动在采样时间尺度变长、物体本身外型较复杂且动作轨迹不受约束或受遮挡时,其复杂性将增加。此时将导致被连续跟踪帧间的变化增大,均值漂移算法会因Bhattarchayya系数太低而失效。针对这种情况,本文基于快速颜色阈值和区域融合,改进了均值漂移算法。实验证明,改进算法消除了失效。为做到进一步精密,比如让跟踪的边缘贴合于所跟踪的对象等,本文继续作了以下几项工作第二,为让计算机非监督地获得“感觉”,提出并实现了一种粒截分模型。通过分析已有的图像、视频底层特征的处理和语义挖掘算法,本文归纳出了一种映射关系,即底层特征、知识表示、语义概念对人类认知的感觉、知觉、表象。以此为指导,开始探索一种由感觉到表象的对图像、视频对象的非监督认知方法。做为基础,为让计算机能自主产生对彩图的“感觉”,基于人工智能领域中的长于模拟人类思维解决复杂问题的粒计算理论,提出了一种粒截分模型。首先以粗糙集和商空间理论为指导,构建拓扑信息系统。接下来,将数据视为超立方,建立由基础截分向量和拓扑截分向量构成的截分向量集,以图分别示意基础截分向量和拓扑截分向量的截分效果,提出了概念粒和连通粒两个新概念,给出了粒截分模型的定义。最后,为实现粒截分模型,设计一种单属性分析器,论证相关的定理及引理,详细描述所有概念粒的截分过程,讨论了存在的不足,并通过计算证实了单属性分析器的低复杂度。在超过三百幅各类彩图上做了实验,结果显示:单属性分析器能有效分析所指定的属性,让计算机从彩图中得到“感觉’第三,为让“感觉”更清晰,提出了一种可适用于任意图像甚至图像碎片的粒标注算法。首先,根据粒截分模型依据所选用的观察概念截分图像,得到相应的概念粒。然后,行压缩指定概念粒或全部概念粒,得到对应的行连通段。最后,给出了实现粒标注的算法—IGL算法,详细描述标注、提取所有连通区(本文称连通粒)的过程,定义可供后续处理应用的开放存贮结构,讨论标注模型向高维的可扩展性。用二值图和彩图分别作验证和比较分析,所得结果表明:所呈标注算法精确、鲁棒,且较之传统标注算法更高速。第四,考虑到截分所得的“粒”是任意形状、任意分布的连通区域,对以区域为基元作特征提取和分析进行了探索,提出并实现了一种粒相关边缘模型。本文针对现有边缘提取算法不能提取任意形状、任意分布区域的边缘及所提取的边缘缺乏统一模型、与实际对象的相关性不密切等问题,提出一种粒相关边缘模型,并给出相应的实现算法—任意区域边缘提取算法(Arbitrary Region Edge Extraction,简称(?)REE)。粒相关边缘模型兼容于粒计算理论,由拓扑信息系统、概念粒、连通粒及边缘空间等概念组成。AREE算法引入行连通段等定义,给出并证明计算边缘集的定理,随后依据定理在压缩状态下搜索连通粒中的内点,进而完成边缘提取。对比分析和示例实验都证明:本文所提出的算法能精确、快速地提取出各类图像中任意连通粒的边缘。第五,基于以上构筑的认知平台,提出了一种显著对象非监督粗糙认知算法。算法首先以粒截分模型用双概念分别拓扑划分论域,标注连通粒;依据尺度过滤掉过小拓扑等价类;用拓扑连通强度、拓扑分布密度等计算出拓扑等价类的拓扑显著度;借改进Fisher线性判别算法找到最大跃变点,裁掉拓扑显著度过小的拓扑等价类,得到候选区;以维扫梯度等捕捉拓扑等价类间的渐变模式,完成局部粗糙分割,得到候选对象,更新候选对象的拓扑显著度;再次调用Fisher线性判别算法裁减,如果还剩多个对象,用位权选择最终显著对象。最后,以实验分步验证了算法的执行过程,并与同类三种算法的提取结果作了比较分析,证实了本文算法的直观语义逼近效果。
|
全文目录
摘要 5-7 Abstract 7-10 目录 10-14 插图索引 14-16 附表索引 16-17 第1章 绪论 17-44 1.1 选题的背景和意义 17-19 1.2 底层特征处理及语义挖掘技术 19-40 1.2.1 底层特征计算和应用简析 19-28 1.2.2 特征比较 28-33 1.2.3 语义挖掘 33-39 1.2.4 多媒体语义生成与认知过程的比较 39-40 1.3 论文的主要工作 40-42 1.4 论文的组织结构 42-44 第2章 理论基础 44-52 2.1 引言 44 2.2 粗糙集 44-49 2.2.1 基础知识 44-45 2.2.2 扩充模型 45-48 2.2.3 知识获取 48-49 2.3 商空间 49-51 2.3.1 商空间基本概念 49-50 2.3.2 分层递阶结构 50-51 2.4 小结 51-52 第3章 一种改进的Mean-shift对象跟踪算法 52-59 3.1 引言 52-53 3.2 Mean-shift跟踪算法 53-54 3.2.1 核密度估计和核函数 53 3.2.2 Mean-shift跟踪算法 53-54 3.3 Mean-shift跟踪算法存在的问题及其可行解决办法 54-57 3.3.1 颜色空间选取 55 3.3.2 颜色空间划分及映射算法 55-56 3.3.3 目标对象的颜色类的提取过程 56 3.3.4 候选对象的处理过程 56-57 3.4 实验分析 57-58 3.5 小结 58-59 第4章 概念粒的截分 59-75 4.1 引言 60-61 4.2 图像的粒截分模型的引出和定义 61-64 4.2.1 截分 61-62 4.2.2 模型定义 62-64 4.3 彩图数据的量化 64-65 4.3.1 矢量量化 64 4.3.2 LBG算法 64-65 4.4 数据预处理 65-66 4.5 单概念分析算法(SAA) 66-69 4.6 算法的时间复杂度 69 4.7 实验分析 69-74 4.7.1 概念粒组 70-71 4.7.2 单一概念粒 71 4.7.3 单一连通粒 71-74 4.7.4 尺度变化对连通粒的影响 74 4.8 局限性分析 74 4.9 小结 74-75 第5章 图像连通粒的快速提取和标注 75-89 5.1 引言 75-76 5.2 粒截分模型 76-77 5.3 IGL算法 77-81 5.3.1 算法原理 77-80 5.3.2 算法实现 80-81 5.4 实验比较 81-88 5.4.1 可靠性验证 81-83 5.4.2 对比分析 83-85 5.4.3 彩色图像的连通粒标注实验 85-88 5.5 小结 88-89 第6章 连通粒的底层特征提取和处理 89-100 6.1 引言 89-91 6.2 问题描述及相关数学模型 91-93 6.2.1 问题描述 91-92 6.2.2 相关的数学模型 92-93 6.3 算法原理及实现 93-95 6.3.1 算法原理 93-95 6.3.2 算法实现 95 6.4 实验分析 95-98 6.4.1 对比分析 96-97 6.4.2 应用示例 97-98 6.5 小结 98-100 第7章 显著对象的非监督粗糙提取 100-114 7.1 引言 100-101 7.2 粒计算模型定义 101-103 7.3 显著对象提取的框架及基本原理 103-105 7.3.1 基础平台 103 7.3.2 基本原理 103-105 7.4 显著对象局部提取的实现 105-107 7.5 时间复杂性分析、对比 107-108 7.6 实验验证 108-113 7.6.1 分步验证实验 108-110 7.6.2 其他对比分析实验 110-113 7.7 小结 113-114 结论与展望 114-118 参考文献 118-132 致谢 132-133 附录A 攻读学位期间发表的学术论文 133-135 附录B 攻读学位期间参加的科研课题及所获成果 135
|
相似论文
- 粒计算理论及其在图像检索中的应用研究,TP18
- 基于参数活动轮廓模型的医学图像分割方法研究,TP391.41
- 指纹图像分割方法评价与半监督学习在指纹图像分割中的应用研究,TP391.41
- 形式概念中的粒计算,TP18
- 基于空间邻域词袋模型的图像标注技术,TP391.41
- 基于改进的GVF主动轮廓模型的图像分割方法研究,TP391.41
- 基于CBCT图像序列的三维牙齿分割技术研究,TP391.41
- 基于道路自动识别的交通流信息提取与分析,TP391.41
- 基于谱聚类的无监督图像分割,TP391.41
- 无人驾驶智能车基于单目视觉的道路检测,TP391.41
- 基于内容的图像检索系统的设计与实现,TP311.52
- 基于拓扑性质的视觉注意力模型的研究及其应用,TP391.41
- 基于个性化推荐的图像浏览与检索相关方法研究,TP391.41
- 基于对象和动作联合建模的图像标注技术研究,TP391.41
- 基于稀疏回归模型的图像标注研究,TP391.41
- 基于水平集的拟合能量分割技术研究,TP391.41
- 多目视觉反馈的快速完全分钢系统研究,TP391.41
- 基于量子进化特征选择的SAR图像分割,TN957.52
- 自由立体显示中虚拟视点生成算法研究与实现,TN873
- 基于粒计算的三层结构的交通流模拟,U491.112
- 基于颜色特征的视觉移动机器人目标跟踪系统,TP242.6
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|