学位论文 > 优秀研究生学位论文题录展示

基于计算机视觉的物体分类关键技术研究

作 者: 朱荣
导 师: 胡瑞敏
学 校: 武汉大学
专 业: 通信与信息系统
关键词: 物体识别 语义特征 词袋算法 k-均值聚类 核函数 支持向量机 尺度分量
分类号: TP391.41
类 型: 博士论文
年 份: 2011年
下 载: 409次
引 用: 0次
阅 读: 论文下载
 

内容摘要


物体识别是当前国内外计算机视觉领域一个活跃的研究方向,物体识别的本质就是建立一个能够识别出图像中感兴趣物体类别的计算系统,在现实生活中有着广泛的应用需求,具有相当高的应用价值和研究意义。近年来,随着模式分类技术的不断成熟以及人工智能的持续发展,基于语义特征提取的物体识别技术逐渐被广大学者所接受。物体的语义特征就是通过提取一类物体的局部特征,然后按照一定的处理准则将局部特征转化为描述一类物体的语义信息,形成一类物体的语义特征模型,实现可行有效的物体分类识别效果。由于物体图片的信息量大,计算复杂度高,如何利用物体有效的特征进行自动物体分类识别,目前算法在实际应用中面临很大的挑战性,本文首先总结物体识别的研究现状和目前存在的问题,介绍了物体识别与分类的算法基本框架,视觉不变性特征的比较,然后深入研究了SIFT的尺度分量所携带的信息,设计了两级匹配的层次聚类算法,有效的提高了匹配正确率。以此为基础,研究了SIFT的词袋算法框架,通过支持向量机选择视觉词汇的特征点,实验表明,性能优于k均值聚类算法。最后完整的描述了系统的实验过程,分析了实验结论,证明了本文提出算法的有效性。本文在视觉物体分类和识别的研究中,主要的研究内容和创新点如下:(1)基于尺度分量的两级SIFT特征匹配算法在物体分类中,SIFT特征具有尺度空间不变性,一般的应用中,直接在全部样本空间实现全搜索,基于最近邻和次近邻比值门限来判断是否匹配成功,该方法带来两个问题,一是误匹配,二是无法回避物体内部的自相似特征点。本文分析了同类物体在不同相机参数下的匹配特征点尺度关系,计算观测物体的相对尺度,设计两级匹配方法,将尺度分量用于决策过程,提高匹配的精度和效率。(2)基于SVM的视觉词汇生成方法现有Bag of Words算法以描述符的聚类中心作为视觉单词,但是该方法会产生严重的语义丢失现象。本文提出了两种基于决策机制的视觉单词生成方法,通过决策机制,选取若干类内有效特征点代替聚类中心,形成语义丰富的视觉单词,丰富了视觉词汇表中的语义信息,提高了物体识别过程中的特征点查全率。选取最适合高维数据的SVM非线性分类器,实现了特征描述符到视觉单词的转化以及待测物体的描述符归类过程,提高了语义特征表达的有效性,增加了物体识别效率。(3)基于小词库集的视觉物体分类方法在物体分类中,视觉词汇包分类方法一般基于统一的大词库词典,典型的基于直方图的贝叶斯后验概率分类器。本文针对少数待识类别情况下的应用,提出了一种一类物体一个词库的分类方法,每一类词汇表明显小于统一大词库,系统稳健性明显提高。

全文目录


摘要  5-7
Abstract  7-9
目录  9-11
第1章 绪论  11-25
  1.1 研究背景  11-13
  1.2 国内外研究现状  13-21
    1.2.1 视觉物体识别的基本思路  13-17
    1.2.2 用于物体识别的图像低级特征  17-19
    1.2.3 语义词汇的产生与词袋模型  19-21
    1.2.4 物体识别中的分类器  21
  1.3 物体识别分类还有待解决的问题  21-22
    1.3.1 局部特征的相似性准则  21-22
    1.3.2 视觉词汇生成的聚类方法  22
    1.3.3 基于小词库的词袋方法  22
    1.3.4 分类器的优化方法  22
  1.4 本文的研究内容与结构  22-25
    1.4.1 论文的研究内容  22-23
    1.4.2 论文的结构  23-25
第2章 视觉物体分类系统的构成与关键技术  25-41
  2.1 生物视觉的计算过程分析  25-27
  2.2 物体识别的两类方法  27-30
    2.2.1 基于匹配的方法  27-29
    2.2.2 基于统计的方法  29-30
  2.3 局部不变性特征的描述算子  30-38
    2.3.1 熵方法  30-34
    2.3.2 SIFT算子  34-38
  2.4 词袋模型  38-40
    2.4.1 自然语言处理中的词袋模型  38
    2.4.2 物体识别的词袋模型  38-39
    2.4.3 词袋模型中的Bayes分类模型  39-40
  2.5 小结  40-41
第3章 基于SIFT尺度分量的特征点匹配算法  41-60
  3.1 SIFT关键点基本匹配算法  41-44
    3.1.1 最近邻准则  41-43
    3.1.2 比值准则  43-44
  3.2 物体识别中SIFT点的尺度分量特征  44-49
  3.3 SIFT关键点的两级匹配算法  49-56
    3.3.1 并集初匹配算法  49-54
    3.3.2 尺度精匹配算法  54-56
  3.4 基于两级匹配的层次聚类算法  56-58
  3.5 小结  58-60
第4章 物体类别的视觉语义表达模型  60-91
  4.1 视觉词汇的形成  60-66
    4.1.1 k-均值算法  60-61
    4.1.2 语义特征提取  61-66
  4.2 大词典方法  66-72
    4.2.1 模型及算法介绍  66-69
    4.2.2 分类效果评价  69-70
    4.2.3 实验结果  70-72
  4.3 小词典方法  72-74
    4.3.1 聚类  72-73
    4.3.2 最近邻距离的决策机制  73-74
  4.4 分类器  74-79
    4.4.1 基于贝叶斯决策分类器  75-76
    4.4.2 支持向量机  76-79
  4.5 基于SVM的视觉词汇生成  79-90
    4.5.1 SVM产生视觉词汇表  80-81
    4.5.2 SVM在识别程中的应用  81-83
    4.5.3 性能分析  83-90
  4.6 小结  90-91
第5章 形状特征在视觉物体分类的判决过程  91-98
  5.1 形状上下文的提取过程  92-93
  5.2 形状上下文的匹配过程  93-95
  5.3 实验与分析  95-97
  5.4 小结  97-98
第6章 车载环境中的应用与性能分析  98-106
  6.1 车载应用环境分析  99
  6.2 实验设计  99-101
    6.2.1 实验数据库的制备  100-101
    6.2.2 实验步骤  101
  6.3 实验结果与分析  101-105
  6.4 小结  105-106
第7章 总结  106-108
  7.1 本文的贡献与创新之处  106-107
  7.2 下一步的工作  107-108
参考文献  108-112
攻读博士学位期间发表达论文及成果  112-114
致谢  114

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于变异粒子群的聚类算法研究,TP18
  15. 基于车载3D加速传感器的路况监测研究,TP274
  16. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  17. 鲁迅小说中动词的修辞阐释,H15
  18. 不匹配信道下耳语音说话人识别研究,TN912.34
  19. 基于文本挖掘的学者简历自动生成,TP391.1
  20. 基于特征选择的入侵检测研究,TP393.08
  21. 基于SVM的跨膜蛋白结构预测应用研究,Q51

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com