学位论文 > 优秀研究生学位论文题录展示

一种物体识别方法的研究及若干应用

作 者: 陈赟
导 师: 沈一帆
学 校: 复旦大学
专 业: 计算机应用技术
关键词: 物体识别 图片搜索 视频跟踪
分类号: TP391.41
类 型: 硕士论文
年 份: 2010年
下 载: 210次
引 用: 0次
阅 读: 论文下载
 

内容摘要


物体识别是当今计算机视觉领域的一个难点问题,引起越来越多的计算机视觉工作者的兴趣与关注,其主要过程是使用相关算法在图像中把感兴趣的物体识别出来。同时,它也是机器人导航、人机交互、图像理解、图像自动标注、基于内容的图像搜索、智能视频监控等应用项目中的关键难题,有着广泛的研究和应用背景。本课题的研究进展将会促使相关应用领域当中的关键问题得到更好地解决。本文对基于特征匹配结合分割验证的物体识别方法进行了研究。在前人基于投票机制的物体识别方法的基础上,整合SIFT (Scale Invariant Feature Transform,以下都简称SIFT)特征提取和特征投票的过程,采用MeanShift算法对投票结果的统计方法进行了改进,达到较好的实验结果。对物体识别的两个应用:基于内容的图片搜索视频跟踪,本课题也进行了细致的研究。在图片搜索领域,目前主流的技术是通过文本去查找图片。谷歌和百度等搜索引擎采用的便是基于图片标签的匹配,用户输入文本信息,系统返回文本对应的图片。本课题的研究目的是用户输入一幅图片,系统返回与之相似的图片。Sivic和Zisserman借鉴了文本信息检索当中的tf-idf模型,得到了比较好的实验结果。首先把从训练集中提取得到的特征进行kmeans聚类,生成的每一个簇集定义为一个单词,给每个单词关联一个倒排文件(它表示的含义是该单词在训练集所有图片当中的分布情况)。然后把从查询图片中提取到的特征量化到这些单词当中,最后对查询图片与训练集中图片进行相似度评测。Nister和Stewenius在这个工作基础上提出了分层聚类的做法,利用树形索引,极大地缩短了特征量化所需的时间。我们的工作在前人的基础上利用模糊分类理论,改进了特征量化的过程,实现了一个小型的图片搜索系统。在视频跟踪领域当中,实际应用中复杂的动态背景、运动目标的尺度伸缩、目标遮挡、光线亮度的变化等等都给跟踪造成巨大的挑战。本课题期望实现一种鲁棒实时的跟踪系统,能够克服运动目标的尺度变化、部分遮挡以及光线亮度变化等不利因素。预期采用的方法是在kalman滤波预测的框架内,采用基于特征和区域统计特性的目标描述方法,利用改进的系统状态向量对运动目标进行跟踪。

全文目录


摘要  5-6
Abstract  6-8
1、引言  8-11
  1.1 课题背景及意义  8-9
  1.2 国内外研究现状及分析  9-11
2、物体识别方法的研究  11-24
  2.1 方法预览  11-12
  2.2 自顶向下的检测  12-20
    2.2.1 建立codebook  12
    2.2.2 整合的特征提取与特征投票过程  12-16
    2.2.3 Mean Shift求解局部极值  16-20
  2.4 实验结果  20-24
3、基于内容的图片搜索  24-32
  3.1 方法预览  24
  3.2 构造词汇树  24-25
  3.3 训练集中图片转为向量表示  25-26
    3.3.1 图片的表示方法  25-26
    3.3.2 权值的计算  26
  3.4 查询图片转为向量表示  26-28
    3.4.1 查询特征的量化  26-27
    3.4.2 改进的量化过程——模糊分类  27
    3.4.3 查询图片的向量表示  27-28
  3.5 图片间的相似度测量  28
  3.6 实验与分析  28-32
4、视频跟踪  32-45
  4.1 运动目标的表达  32-34
    4.1.1 基于特征的目标表达  33
    4.1.2 基于区域统计的目标表达  33
    4.1.3 基于模型的目标表达  33-34
  4.2 滤波预测算法  34-37
    4.2.1 标准Kalman滤波  34-36
    4.2.2 Kalman滤波的应用  36-37
  4.3 具体实现  37-41
    4.3.1 目标表示  38-39
    4.3.2 Kalman滤波框架下的跟踪模型  39-41
  4.4 实验结果  41-45
参考文献  45-47
攻读学位期间的工作与发表论文  47-48
致谢  48-49

相似论文

  1. 移动增强现实博物馆导览应用研究,TP391.9
  2. 视频跟踪中Mean-Shift算法的应用研究,TP391.41
  3. MK-801处理围生期与成年期大鼠建立精神分裂症模型的研究,R749.3
  4. 关节式物体检测识别及应用,TP391.41
  5. 分布式图片搜索引擎设计与实现,TP391.41
  6. 基于CELL处理器的智能监控系统中跟踪算法的研究,TP391.41
  7. 基于虚拟检测器的车辆检测系统研究与实现,U495
  8. 基于快速鲁棒性特征的物体识别检测算法研究,TP391.41
  9. 非监督的结构学习及其应用,TP181
  10. 基于显著局部特征的视觉物体表示方法,TP391.41
  11. 基于图像识别的运动目标检测与跟踪系统,TP274.4
  12. 基于IBIS5的APT系统视频跟踪器技术研究,TP391.41
  13. 物体识别对视觉心理表象产生和检测的影响,B842.1
  14. 基于在线学习的视频跟踪算法研究与实现,TP391.41
  15. 基于DSP的视频与音频联合目标跟踪系统,TP391.41
  16. 视频中运动目标的结构特征提取方法,TP391.41
  17. 基于混沌的图像加密技术研究,TP309.7
  18. 数据驱动的人群动画仿真技术研究,TP391.9
  19. 非面孔物体识别倒置效应,B842.1
  20. 基于形状与语义建模的物体识别,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com