学位论文 > 优秀研究生学位论文题录展示

图像稀疏编码算法及应用研究

作 者: 严春满
导 师: 郭宝龙
学 校: 西安电子科技大学
专 业: 电路与系统
关键词: 图像处理 稀疏表示 多尺度多分辨分析 多尺度几何分析 过完备字典 脉冲耦合神经网络
分类号: TP391.41
类 型: 博士论文
年 份: 2012年
下 载: 284次
引 用: 0次
阅 读: 论文下载
 

内容摘要


图像处理技术已成为人类生活与生产实践不可或缺的重要信息获取手段,已广泛应用于空间技术、医学影像、遥感图像处理、工业控制、文化艺术、计算机视觉、视频与多媒体系统、科学可视化、电子商务等众多领域。生物视觉系统是一种高效的图像处理系统。随着脑科学研究的不断发展,人类对生物视觉系统的研究逐步深入,从初级视皮层到高级视觉区域,从初级视觉感知到高级知觉组织等,都取得了许多重要的研究成果。从视网膜接收到光刺激作为输入信号开始,视觉系统利用一套完整的信息处理机制对输入图像进行处理和加工。尽管我们尚未透彻了解生物视觉系统的工作机制,但视觉信息处理过程的“稀疏编码”特性已证实了其合理性及有效性。广义的视觉图像稀疏编码特性是一种符合生物进化过程能量最节约原则的视觉信息表达方式。图像处理的稀疏编码算法及应用正是基于这一生物学背景而发展起来的一种高效信息处理技术。已有的研究成果表明:有效的视觉信息稀疏编码系统一般具有多分辨、临界采样及过完备性;用于表示图像的基函数具有局部性、带通性、方向性、各向异性等特点。基于这些规律,本文以图像稀疏编码算法的应用为重点,研究了图像信息的基本稀疏编码模型、基于优化Gabor字典的图像稀疏编码算法、基于过完备稀疏表示的图像处理及应用、基于多分辨分析理论的图像稀疏表示及应用,以及视觉皮层脉冲耦合神经网络模型及应用。所取得的研究成果如下:1.提出了一种基于优化Gabor字典的图像稀疏编码算法。图像稀疏表示的关键问题之一是如何构造有效的过完备字典。二维Gabor函数具有良好的局部性、方向选择性及空间频率选择性等特点,可有效模拟视觉皮层V1区简单细胞的感受野特性。以Gabor函数为原子生成函数构造的过完备字典能匹配图像中的边缘、纹理等几何机构,可实现图像的有效表示。但该字典仍存在原子数量巨大,匹配追踪算法计算开销大等问题。针对这些不足,提出了一种基于优化Gabor字典的图像稀疏编码算法。新算法主要采用两种策略对上述问题做一改进:其一是采用图像重叠分块的策略,以有效减少输入样本的长度;其二是采用粒子群优化算法(Particle Swarm Optimization,PSO),模拟视皮层神经元的竞争机制,以输入样本在Gabor原子上投影的模值为适用度值,以优化求解最匹配Gabor原子的自由度参数代替在大规模字典上的搜索过程,最后在优化所得的Gabor字典上采用正交匹配追踪(Orthogonal MatchingPursuit,OMP)算法完成图像的稀疏分解。实验结果验证了所提算法的有效性,算法在较低时间复杂度的前提下可获得较高的重建图像质量。2.基于图像的过完备稀疏表示理论,针对传统变换域方法的适应性及噪声鲁棒性问题,提出了一种自适应字典学习的多传感器图像融合算法。算法首先从待融合图像中随机取块构成训练样本集,经自适应字典学习算法迭代运算获取过完备字典;然后由OMP算法完成图像块的稀疏分解;再按分解系数的显著性选择融合系数并完成图像块的重构;重构块经重新排列并取平均后获得最后的融合图像。实验结果可见,新算法具有较好的噪声抑制能力,融合图像的主观质量及客观评价指标均要好于传统算法。3.基于图像的过完备稀疏表示理论,针对实例学习图像超分辨方法中低分辨图像块与高分辨图像块特征映射不一致问题,提出一种在线字典学习的图像超分辨重建算法。在学习阶段,算法首先获取一组高分辨图像,并经降质获得对应的低分辨图像,以该两组实例图像构建相应的高分辨及低分辨特征训练集,在低分辨训练集上经在线字典学习算法迭代运算获得低分辨字典,然后采用OMP算法获得输入样本在低分辨字典上的稀疏编码矩阵,通过共享稀疏编码系数求解高分辨字典;在超分辨重建阶段,对输入的低分辨图像块首先在低分辨字典上采用OMP算法实现稀疏编码,同样依据高分辨图像块与低分辨图像块共享稀疏编码系数的原则,以高分辨字典实现待估计高分辨图像块的稀疏逼近,最后经块重新排序并取平均实现高分辨图像的重建。实验结果可见,所提方法可取得优于传统方法的图像超分辨质量,重建图像的细节及纹理保持能力较好,且能有效抑制图像边缘的伪影现象。4.基于图像稀疏表示的多尺度几何分析(Multiscale Geometric Analysis,MGA)理论,提出了一种改进的非下采样Contourlet变换(Nonsubsampled ContourletTransform,NSCT)结合高斯比例混合模型(Gaussian Scale Mixtures Model,GSM)的图像去噪算法。MGA是近年来发展起来的一种新的高维函数多尺度多分辨分析方法,可实现较小波变换更优的图像“稀疏表示”能力。NSCT是一种有效的多尺度几何分析工具,具有多尺度、多方向性及平移不变性等特点。NSCT结合GSM的图像去噪算法能获得较满意的去噪效果,算法具有一定的通用性,但算法耗时较大。针对这一问题,提出一种改进的快速NSCT变换,以拓展其在算法时间要求较高场合下的应用。由于方向滤波器组主要影响NSCT的性能,故采用一种具有提升结构并经优化处理的方向滤波器改进了NSCT变换中的非下采样方向滤波器组,同时将改进后的NSCT结合GSM应用于图像去噪。实验结果可见,改进算法保持了原NSCT结合GSM算法的图像去噪效果,同时将算法速度提高了近11倍。5.基于图像稀疏表示的多分辨分析理论,模拟视觉系统同步振荡机制及视皮层神经元分层分级信息处理机制,提出了一种基于改进拉普拉斯金字塔(Laplacian Pyramid,LP)变换结合脉冲耦合神经网络(Pulse Coupled NeuralNetworks,PCNN)的抗噪声多聚焦图像融合算法。算法采用改进的LP变换构造图像的多分辨数据结构,分解系数按照分层多尺度的方式激励PCNN,经迭代运算生成其对应的神经元点火映射图,并以此为依据经判决算子完成数据融合,再采用一种新的伪逆重构算法(又称对偶框架算子)生成融合图像。实验结果证实新算法具有抗加性噪声及JPEG压缩系统噪声的能力,融合图像的客观评价指标较高,其中PSNR比原LP方法平均提升19.4%,且能有效减弱原LP算法融合图像边缘的伪影现象。

全文目录


作者简介  3-4
摘要  4-7
ABSTRACT  7-15
第一章 绪论  15-31
  1.1 研究背景及意义  15-16
  1.2 稀疏编码的研究内容及现状  16-21
  1.3 论文主要研究工作及章节安排  21-25
  本章参考文献  25-31
第二章 视觉图像稀疏编码原理及系统框架  31-57
  2.1 引言  31
  2.2 视觉图像处理的生理基础概述  31-33
  2.3 视觉图像稀疏编码的多尺度多分辨分析  33-35
  2.4 视觉图像的过完备稀疏编码模型及分析  35-47
  2.5 视觉图像稀疏编码系统及框架  47-51
  2.6 本章小结  51-52
  本章参考文献  52-57
第三章 基于优化GABOR字典的图像稀疏编码算法  57-85
  3.1 引言  57-59
  3.2 过完备GABOR字典及特性分析  59-64
  3.3 信号的稀疏表示及最佳原子搜索算法分析  64-67
  3.4 粒子群优化算法及改进  67-76
  3.5 基于优化GABOR字典的图像稀疏编码算法描述  76-77
  3.6 数值实验及分析  77-81
  3.7 本章小结  81
  本章参考文献  81-85
第四章 基于过完备稀疏表示的多传感器图像融合算法  85-99
  4.1 引言  85-86
  4.2 多传感器图像融合概述  86-89
  4.3 基于自适应字典学习的图像稀疏编码算法描述  89-91
  4.4 图像融合算法描述  91-92
  4.5 数值实验及分析  92-96
  4.6 本章小结  96
  本章参考文献  96-99
第五章 基于在线字典学习的图像稀疏表示及超分辨重建算法  99-117
  5.1 引言  99
  5.2 图像超分辨重建方法概述  99-102
  5.3 图像稀疏编码模型分析  102-103
  5.4 基于在线字典学习的图像稀疏编码算法描述  103-105
  5.5 图像超分辨重建算法描述  105-107
  5.6 数值实验及分析  107-112
  5.7 本章小结  112-113
  本章参考文献  113-117
第六章 基于改进NSCT变换的图像稀疏表示及去噪算法  117-139
  6.1 引言  117
  6.2 图像稀疏表示的NSCT变换及改进  117-128
  6.3 基于改进NSCT结合高斯比例混合模型的图像去噪  128-131
  6.4 数值实验及分析  131-135
  6.5 本章小结  135
  本章参考文献  135-139
第七章 基于视觉同步振荡机制的脉冲耦合神经网络及应用  139-157
  7.1 引言  139
  7.2 脉冲耦合神经网络模型及简化  139-142
  7.3 基于双层 PCNN 的图像分割算法  142-150
  7.4 基于改进 LP 变换结合 PCNN 的抗噪声多聚焦图像融合算法  150-154
  7.5 本章小结  154
  本章参考文献  154-157
第八章 总结与展望  157-163
  8.1 总结  157-159
  8.2 展望  159-163
致谢  163-165
作者攻读博士学位期间的研究成果  165-167

相似论文

  1. 基于CCD图像传感器的温度测量技术研究,TH811
  2. 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
  3. 机械臂视觉伺服系统的研究,TP242.6
  4. 数字图像处理在集装箱检测中的应用研究,TP274.4
  5. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  6. 基于机器视觉的光纤几何参数检测研究,TN253
  7. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  8. 基于计算机视觉对“次郎”甜柿外部品质检测与分级的研究,S665.2
  9. 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
  10. 基于FPGA高清视频车辆检测系统的设计与实现,TP391.41
  11. 基于不完全数据的服用测量系统研究,TP391.41
  12. 生物细胞图像拼接方法研究,TP391.41
  13. DNA指纹图谱的自动识别与分析定位研究,TP391.41
  14. 管道焊缝缺陷射线检测图像获取与处理的数字化技术研究,TG441.7
  15. 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
  16. DSP图像处理中动态多阈值模板建立及应用研究,TP391.41
  17. 基于神经树的人脸识别方法研究,TP391.41
  18. 基于图像处理技术的工件轮廓度测量系统,TP274
  19. 车载路面裂缝检测图像处理系统的设计与实现,TP391.41
  20. 图像信息处理机的图像处理方法研究,TP391.41
  21. 基于回归的图像超分辨率重建技术研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com