学位论文 > 优秀研究生学位论文题录展示
面向汽车辅助驾驶的远红外行人检测关键技术研究
作 者: 庄家俊
导 师: 刘琼
学 校: 华南理工大学
专 业: 计算机应用技术
关键词: 远红外行人检测 汽车驾驶辅助系统 概率模板 候选区域提取 方向梯度直方图 支持向量机 直方图交叉核 迁移学习
分类号: TP391.41
类 型: 博士论文
年 份: 2013年
下 载: 128次
引 用: 0次
阅 读: 论文下载
内容摘要
基于远红外成像的行人检测已成为计算机视觉与模式识别领域的研究热点之一,远红外图像不依赖于场景的光照条件,反映的是具有不同热辐射率的场景目标的表面温度分布,能够捕捉黑暗和烟雾等环境中的行人目标,故基于远红外成像的夜间行人检测在汽车辅助驾驶系统和智能监控系统中具有重要的应用前景。由于行人目标的非刚体性质和较强的运动随意性,其外观模式通常呈现出复杂多变和尺度不一等特点,导致其具有较高的类内多样性;与可见光图像相比,远红外图像中的行人目标还具有纹理信息较少、分辨率较低的特点,因此,基于远红外成像的行人检测是一个极具挑战性的研究课题。本文围绕面向汽车辅助驾驶的夜间行人检测问题展开研究,基于配备单目摄像头的车载平台,研究解决保障检测系统实时性、准确性、适合于变化场景的行人检测问题,涉及候选区域(Regions of Interest, ROIs)提取方法、远红外行人描述特征的提取方法、行人识别方法等方面关键技术的研究。论文的主要贡献如下:1)提出一种基于概率模板匹配的远红外行人检测方法。根据行人的运动朝向建立多尺度概率模板,缓解因外观模式引起的行人类内方差较大的问题;进一步将目标跟踪/多帧校验方法融入概率模板匹配的过程,综合利用行人在多帧图像之间出现的连续性和检测结果的一致性滤除不稳定的误检模式,并填补部分由于ROIs提取精度不高所造成的漏检行人。实验表明该方法能够较好地保障检测系统的实时性,与基于行人步态模式的概率模板构建方法相比,文中方法归纳行人外观模式的能力更强。2)基于统计学习的识别框架,提出熵加权方向梯度直方图特征(Entropy WeightedHistograms of Oriented Gradients, EWHOG)描述远红外行人,综合了所描述目标的局部形状信息和局部梯度分布的随机信息,确保其局部形状能够更好地被局部密集像素梯度或边缘方向表示;为了解决因成像尺度不一等因素引起的目标类内方差较大的问题,提出基于EWHOG特征的三分支结构支持向量机(Support Vector Machine, SVM)行人识别方法,并利用快速分类支持向量机(Fast Classification Support Vector Machine,FCSVM)对获得的支持向量进行优化,从而约简识别环节所需要的计算和存储开销;根据远红外行人头部及其与周围背景之间灰度分布的差异性,提出进一步抑制误检目标的行人头部校验方法。实验表明:EWHOG特征能有效区分远红外行人;快速分类方案以轻微降低行人识别准确率为代价,保证检测系统运行的实时性,在市区和郊区场景中均获取了较好的检测性能。3)针对行人检测本质上属于“稀有事件检测”问题的特点,从ROIs提取的角度出发,提出一种基于像素梯度的垂直投影方法,根据远红外图像中天空与路面等背景区域通常具有大范围高灰度同质性的特点,利用图像梯度信息对可能包含行人的竖直带状图像区域进行初定位,避免对整幅输入图像进行搜索;实验表明该方法能够提高ROIs提取阶段的搜索效率,并能够抑制部分仅包含背景目标的候选区域。在行人识别阶段,将图像空间金字塔表示方法融入EWHOG特征的提取过程,在多层图像片(cell)划分方式下,利用局部方向梯度直方图的熵加权分布特性及其全局结构信息表征远红外行人,提出了金字塔熵加权方向梯度直方图(Pyramid Entropy Weighted Histograms of OrientedGradients, PEWHOG)特征;鉴于PEWHOG特征属于直方图统计特征,利用基于直方图交叉核(Histogram Intersection Kernel, HIK)的SVM分类器实现行人识别;针对收集具有代表性的训练数据较为困难、行人分类器的预测性能依赖于初始训练数据的问题,提出基于bootstrapping和提前终止策略的离线训练机制。4)训练数据与测试数据之间通常存在不可避免的数据分布差异性,这可能导致多数基于传统统计学习的行人检测方法在场景因素变化较大时表现得不够理想。针对这个问题,提出一种Boosting-style的归纳迁移学习算法DTLBoost,用于高效且有效地处理变化场景中的远红外行人检测问题。显式地定义成员分类器对训练数据的预测不一致性程度,将其融入DTLBoost算法的样本权重更新规则,从辅助训练数据中选择具有正迁移能力的数据,并鼓励不同成员分类器学习目标训练数据的不同部分或方面。最后在本文收集的数据集和OSU远红外行人数据集上,通过面向行人识别和行人检测问题的扩展实验评估了该方法的性能,实验结果表明该方法在新场景和变化视角场景中均具有较好的行人检测性能。
|
全文目录
摘要 5-7 Abstract 7-10 目录 10-13 图表清单 13-15 主要符号表 15-16 第一章 绪论 16-34 1.1 研究背景与意义 16-17 1.2 行人检测关键技术与研究现状 17-29 1.2.1 ROIs 提取 18-21 1.2.2 行人识别 21-29 1.3 研究内容和创新点 29-31 1.4 本文结构 31-34 第二章 行人检测理论基础 34-46 2.1 基于统计学习的行人识别 34-40 2.1.1 特征提取 34-37 2.1.2 分类算法 37-40 2.2 数据集与性能评估标准 40-44 2.2.1 远红外行人检测数据集 40-43 2.2.2 性能评估标准 43-44 2.3 本章小结 44-46 第三章 基于概率模板匹配的行人检测方法 46-56 3.1 引言 46 3.2 基于图像分割的 ROIS 提取 46-49 3.3 基于概率模板匹配的行人识别 49-52 3.3.1 行人概率模板 49-51 3.3.2 目标跟踪/多帧校验 51-52 3.4 实验与结果分析 52-55 3.4.1 行人概率模板匹配性能对比 52-53 3.4.2 行人检测实验与结果分析 53-55 3.5 本章小结 55-56 第四章 基于快速分类和头部校验的行人检测方法 56-70 4.1 引言 56-57 4.2 快速分类和头部校验模型 57-62 4.2.1 熵加权方向梯度直方图 57-60 4.2.2 基于快速分类的行人识别 60-62 4.2.3 头部校验 62 4.3 实验与结果分析 62-68 4.3.1 实验设置 62-63 4.3.2 不同描述特征和分类器结构的行人检测性能比较 63-65 4.3.3 不同分类算法的行人检测性能比较 65-66 4.3.4 行人检测系统的性能评估 66-67 4.3.5 讨论 67-68 4.4 本章小结 68-70 第五章 基于局部区域搜索和统计学习的行人检测方法 70-88 5.1 引言 70-71 5.2 基于局部区域搜索的 ROIS 提取 71-74 5.2.1 基于像素梯度的垂直投影 71-74 5.2.2 图像分割与 ROIs 选取 74 5.3 行人识别 74-77 5.3.1 金字塔熵加权方向梯度直方图 75-76 5.3.2 基于 HIKSVM 算法的行人分类器 76 5.3.3 基于 bootstrapping 和提前终止策略的训练机制 76-77 5.3.4 多帧校验 77 5.4 实验与结果分析 77-86 5.4.1 性能评估标准 79-80 5.4.2 预分割性能评估 80-82 5.4.3 行人识别性能比较 82-83 5.4.4 行人检测性能评估 83-86 5.5 本章小结 86-88 第六章 面向变化场景的行人检测方法 88-104 6.1 引言 88 6.2 相关工作 88-90 6.3 基于归纳迁移学习的行人识别 90-94 6.3.1 问题描述 90-91 6.3.2 样本重要性度量模型 91 6.3.3 一种 Boosting-style 的归纳迁移学习算法 91-94 6.4 实验与结果分析 94-103 6.4.1 实验设置 94-96 6.4.2 样本重要性度量模型的参数敏感性分析 96-98 6.4.3 面向变化场景的行人识别性能评估 98-100 6.4.4 面向变化场景的行人检测性能评估 100-103 6.5 本章小结 103-104 结论 104-108 参考文献 108-120 攻读博士学位期间取得的研究成果 120-122 致谢 122-123 答辩委员会对论文的评定意见 123
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 不匹配信道下耳语音说话人识别研究,TN912.34
- 基于文本挖掘的学者简历自动生成,TP391.1
- 基于特征选择的入侵检测研究,TP393.08
- 基于SVM的跨膜蛋白结构预测应用研究,Q51
- LS-SVM算法预测煤层瓦斯涌出量技术研究及应用,TD712.5
- 基于支持向量机的故障诊断研究,TH165.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|