学位论文 > 优秀研究生学位论文题录展示

主动机器视觉中的注意力选择和运动图像压缩

作　者: 练涛
导　师: 田彦涛
学　校: 吉林大学
专　业: 控制理论与控制工程
关键词: 主动视觉注意力选择显著图信息熵运动视觉动态估计动态补偿
分类号: TP391.4
类　型: 硕士论文
年　份: 2004年
下　载: 295次
引　用: 0次
阅　读: 论文下载

内容摘要

视觉是一种处理过程，是要从图像中发现外部世界中有什么东西，以及他们的状态，包括位置及运动信息。视觉是人类的基本智能。人类获取信息的70%到80%来自视觉。人类视觉的机理需要进一步的探索。机器视觉在很多方面得到应用，比如自然的人机交互；计算机视觉监控；虹膜识别；三维重建等。视觉的目的包括：1、从二维图像恢复三维信息；2、从序列图像中恢复运动信息；3、从原始的图像数值描述产生语义概念化的描述。主动视觉是建立在计算机视觉基础上的。计算机视觉顾名思义就是利用计算机模拟并实现人类的视觉功能，包括目标识别，三维重建以及图像理解等内容。在此基础上，根据视觉的主动性要求提出了主动视觉理论，强调模拟人眼对环境的主动适应性。简而言之，主动视觉就是模拟人的“头-眼”功能，使视觉系统能够自主选择和跟踪注视的目标物体。主动机器视觉是机器视觉的发展方向，在军事、工业等领域有着巨大的应用潜力。主动视觉中两个关键的问题就是注意力选择和动态环境中的视觉信息处理。本文以吉林省科技发展计划资助项目为背景，对主动视觉原理进行系统的研究，提出一个主动视觉系统模型.在此基础上，深入研究注意力选择和运动图像压缩及其在主动视觉原理中的应用并提出新的模型。全文的工作共有三部分，概括如下：1 、通过分析生物视觉原理和Marr视觉理论，进一步分析主动视觉的必要性及其必须具备的功能，在此基础上提出一个主动视觉系统模型。然后叙述了实验室构建的主动视觉平台，并提出一个产品化的方案。2 、深入研究注意力选择实质，首先实现了一种典型的基于显著图的注意力选择模型，然后在此基础上提出一种新的基于信息熵的注意力选择模型。并且通过实验证明了模型的有效性。本文从不同的角度分析注意力选择，利用信息熵来表示图像区域的显著程度，从信息学的角度研究注意力选择模型。不仅从一个全新的角度证明了基于信息熵研究注意力选择的有效性，而且通过大量实验说明了注意力选择具有优越的功能，可以滤除大量的无效信息，快速寻找人们感兴趣的区域，这<WP=84>种功能在信息爆炸的今天显得尤为重要。这也预示着注意力选择巨大的应用潜力。当然本文提出的注意力选择也有其局限性，1、无论是基于信息熵还是基于显著图的注意力选择模型都是一种基于数据驱动的工作模式，因此不具备根据环境自我调整的功能，只能是通过人为修改一些参数来适应环境的变化。2、两种注意力选择模型都是基于图像强度和朝向等特征，并不能像人眼一样具备提取复杂有效特征的功能，这在一定程度上也限制了注意力选择的应用。上述两点不足不仅是本章的局限性，也是当前注意力选择发展的方向，有效的解决这两个问题，将促进注意力选择在实际中的广泛应用。3、对运动视觉原理进行的深入的研究，将其应用到动态视频压缩中，提出并实现一种的动态压缩方案。分别利用离散余弦变换和动态补偿来实现帧内和帧间的特征提出，然后利用Huffman编码实现可变长度的编码。世界是变化的，动态图像为我们提供了比单一图像更丰富的信息。通过对多帧图像分析，可获得从单一图像中不可能得到的信息。只有在图像序列上我们才有可能认识和分析动态过程。动态图像分析的基本任务是从图像序列中检测出运动信息，它是图像处理与计算机视觉领域中的一个非常活跃的分支，由于在国民经济和军事领域的许多方面有着广泛的应用，对它的研究受到各国科学家的普遍关注。在多媒体广泛应用的今天，动态图像压缩具有广阔的市场和应用前景。本章实现的动态压缩算法是在有效获取运动信息的基础上，借鉴JPEG和MPEG中的公开算法，实现了动态图像的压缩。本章的算法可广泛应用于图像数据的存储、多媒体的播放、网络会议等领域。有着广泛的应用前景和商业价值。最后对本文进行总结，提出需要进一步研究的问题。

全文目录

第一章绪论  5-9
  1.1 主动机器视觉的背景，作用和应用前景  5-6
  1.2 主动机器视觉的当前研究状况  6-8
  1.3 本文要解决的问题  8-9
第二章主动机器视觉机理模型  9-18
  2.1 生物视觉信息处理模型  9-10
  2.2 机器视觉信息处理模型  10-11
  2.3 主动机器视觉处理模型  11-12
  2.4 主动机器视觉实验平台系统  12-14
  2.5 主动机器视觉系统产品化设计  14-18
第三章注意力选择的实现及分析  18-45
  3.1 引言  18-19
  3.2 基于显著图的注意力选择系统的模型及实现  19-30
    3.2.1 系统概述  19
    3.2.2 高斯金字塔的概念及产生  19-22
    3.2.3 Gabor金字塔的概念及产生  22-25
    3.2.4 特征图的产生  25-26
    3.2.5 标准化操作  26-28
    3.2.6 显著图的产生及融合  28-29
    3.2.7 基于区域加权值的路径搜索  29-30
  3.3 对比分析  30-34
    3.3.1 标准化方案的改进，解决原模型失效的问题  30-31
    3.3.2 噪声干扰  31-32
    3.3.3 “Pop-out”  32-33
    3.3.4 纹理背景  33-34
  3.3 基于信息熵的显著图模型及实现  34-43
    3.3.1 引言  34
    3.3.2 模型  34-39
    3.3.3 算法的实现  39-41
    3.3.4 实验  41-42
    3.3.5 结论  42-43
  3.4 本章小结  43-45
第四章运动视觉原理及运动图像压缩  45-77
  4.1 引言  45
  4.2 图像中的编解码原理及实现  45-59
    4.2.1 概述  45-47
    4.2.2 颜色模式转换及采样  47-48
    4.2.3 离散余弦变换(DCT)  48-50
    4.2.4 量化及“之”字形排序  50-51
    4.2.5 编码  51-55
    4.2.6 DC、AC系数的Huffman编码  55-59
    4.2.7 DC、AC系数的Huffman解码  59
    4.2.8 实验分析  59
  4.3 序列图象中的运动信息处理  59-72
    4.3.1 运动视觉的任务和目的  59-66
    4.3.2 运动信息的处理方法  66-68
    4.3.3 运动估计  68-71
    4.3.4 运动补偿  71-72
  4.4 运动信息的编解码  72-76
    4.4.1 概述  72-73
    4.4.2 运动向量的编码  73-74
    4.4.3 宏块类型的分类及编码的块式样  74
    4.4.4 宏块类型的选择  74-76
  4.5 本章小结  76-77
第五章本文总结  77-79
参考文献  79-82
致谢  82-83
摘要  83-88

主动机器视觉中的注意力选择和运动图像压缩

内容摘要

全文目录

相似论文