学位论文 > 优秀研究生学位论文题录展示

复杂背景下多视角人脸检测与识别

作　者: 田春娜
导　师: 高新波；樊国良
学　校: 西安电子科技大学
专　业: 智能信息处理
关键词: 人脸检测多视角人脸识别人脸对齐示例学习流形学习张量分析非线性张量分解
分类号: TP391.41
类　型: 博士论文
年　份: 2008年
下　载: 960次
引　用: 9次
阅　读: 论文下载

内容摘要

自动人脸检测与识别属于模式识别和计算机视觉的交叉学科,具有重要的科学意义。随着低价位摄像装置的出现与计算机技术的快速发展,以及商业和军事应用领域需求的不断提高,人脸检测与识别技术的研究得到了愈加广泛的关注和参与。自然人脸图像受多种因素的影响具有很强的模式多样性,这使得人脸检测与识别问题极富挑战性。复杂背景和多姿态是人脸检测与识别技术走向实用化需解决的关键问题。本文系统地分析了现有人脸检测与识别方法的优缺点。针对如下问题进行了深入的研究:基于可能近似正确学习模型的人脸检测方法中的样本选择和多姿态问题;识别任务中的人脸对齐问题;多因素影响下人脸图像线性子空间识别方法中的视角非线性变化问题。主要的创新性研究成果概括如下:(1)针对主动机器学习中训练示例的选择问题,提出了嵌入式Bootstrap主动样本选择算法。通过将Bootstrap和嵌入式Bootstrap的思想进行形式化描述,从理论和实验中均证明了新算法在保持和原Bootstrap算法训练时间相当的前提下,可得到更典型的训练示例集,从而解决了计算条件对训练集规模的限制,使训练所得的预测器具有更高的性能。并将Bootstrap和嵌入式Bootstrap应用于基于AdaBoost的正面人脸检测任务的负样本选择中,实验结果表明了理论分析的正确性。该算法适用于一大类主动学习中训练示例的选择问题。(2)当人脸姿态变化较大时,人脸图像可利用的共同特征明显减少,为解决多姿态人脸的类内差异,提出基于聚类有效性分析和FloatBoost的多姿态人脸检测算法。对多种姿态采取“分而治之”的策略,通过模糊c-均值聚类和基于修正的划分模糊度的聚类有效性分析对多姿态人脸图像进行分类,然后用FloatBoost学习得到树型的多姿态人脸检测器。与原树形检测器算法相比,新算法在训练阶段速度更快,在检测阶段更有效。(3)面部特征精确配准是实现鲁棒人脸识别的前提,为了更精确的描述人脸特征和提高分类的精度,提出一种新的人脸序列图像的对齐方法。文中借鉴人脸图像中的灰度分布平滑性,提出快速鲁棒的模糊连通度分割方法实现序列图像中的人脸分割,并根据人脸主要器官进行正面人脸对齐,实验结果表明该方法有助于识别性能的提高。此外,所提出的分割算法在多噪声和序列医学图像的分割上也取得较原基于尺度的分割方法更快的速度。(4)基于张量分解的线性子空间识别方法主要用于解决多因素影响下的复杂人脸识别,本文针对其中的视角非线性变化问题进行深入的研究,提出基于视角流形建模的多姿态人脸识别算法。首先采用张量分解将影响人脸图像的多种因素分离;再结合视角流形建模来解决人脸视角空间的非线性问题,最后给出身份和视角参数的自动求解方法。对测试视角与训练视角进行交叉验证的结果表明,与原基于张量脸的识别算法相比,新算法的识别率提高了12%左右。(5)针对人脸姿态低维流形与高维人脸数据之间的非线性映射关系,提出一种基于非线性张量分解的人脸生成模型。文中深入地研究了多视角人脸表达中的三种视角流形生成方法的有效性,并提出一种基于EM-like的模型参数求解方法。对测试视角与训练视角进行交叉验证的结果表明,与基于张量脸的识别算法相比,识别率提高了19%左右。此外,基于非线性张量分解的方法为混合线性-非线性因素影响下的精细目标建模提供了有效途径。上述研究成果分别从复杂背景条件下的多姿态人脸检测、对齐与识别等方面给出了具体的研究方案和实验结果,为人脸检测与识别的理论研究和应用推广提供了新思路。此外,文中提出的主动样本选择方法、图像分割方法、多姿态人脸检测和识别模型具有一定的通用性,为相关的模式识别问题提供了有效的理论依据和有效途径。

全文目录

摘要  3-5
Abstract  5-11
第一章绪论  11-33
  1.1 研究背景及意义  11-12
  1.2 人脸检测研究进展及现状  12-18
    1.2.1 基于知识的方法  13
    1.2.2 基于模板匹配的人脸检测  13-14
    1.2.3 基于统计学习的人脸检测  14-18
  1.3 人脸识别研究进展及现状  18-23
    1.3.1 基于三维信息的人脸识别方法  18-19
    1.3.2 基于二维图像的人脸识别方法  19-23
  1.4 论文的研究内容及章节安排  23-25
  本章参考文献  25-33
第二章正面人脸检测的主动机器学习方法  33-53
  2.1 引言  33-34
  2.2 基于AdaBoost 的人脸检测  34-41
    2.2.1 基于AdaBoost 的人脸检测器  35-39
    2.2.2 级联的检测器结构设计  39-40
    2.2.3 基于级联AdaBoost 分类器的人脸检测  40-41
  2.3 基于嵌入式Bootstrap 的示例选择  41-46
    2.3.1 Bootstrap 示例选择  42-44
    2.3.2 嵌入式Bootstrap 算法  44-45
    2.3.3 Bootstrap 和嵌入式Bootstrap 性能比较  45-46
  2.4 基于E-Bootstrap+AdaBoost 的人脸检测算法  46
  2.5 实验结果与分析  46-51
  2.6 本章小结  51
  本章参考文献  51-53
第三章基于聚类有效性分析的多姿态人脸检测  53-71
  3.1 引言  53-54
  3.2 基于模糊聚类分析的多姿态人脸分类  54-58
    3.2.1 多姿态人脸划分  55-56
    3.2.2 多姿态人脸聚类分析  56-57
    3.2.3 基于聚类有效性分析的多姿态人脸自动分类  57-58
  3.3 基于FloatBoost 的多姿态人脸检测  58-64
    3.3.1 Haar Wavelet-like 特征提取  59-60
    3.3.2 基于FloatBoost 的分类器训练  60-61
    3.3.3 基于FloatBoost 的多姿态人脸检测树设计  61-64
  3.4 实验结果与分析  64-67
  3.5 本章小结  67-68
  本章参考文献  68-71
第四章基于模糊连通度的人脸序列图像对齐  71-87
  4.1 引言  71-72
  4.2 基于鲁棒模糊连通度的图像分割  72-76
    4.2.1 模糊连通度  72-73
    4.2.2 鲁棒模糊连通度  73-74
    4.2.3 基于鲁棒模糊连通度的图像分割算法  74-76
  4.3 小波域序列人脸分割的模糊连通度方法  76-79
    4.3.1 二维冗余小波变换  76-77
    4.3.2 基于冗余小波和模糊连通度的人脸分割算法  77-79
  4.4 序列人脸图像对齐  79-81
  4.5 实验结果与分析  81-85
    4.5.1 序列人脸分割与对齐实验  81-83
    4.5.2 医学图像分割实验  83-85
  4.6 本章小结  85
  本章参考文献  85-87
第五章基于视角流形建模的多视角人脸识别  87-107
  5.1 引言  87-88
  5.2 基于多线性分析的多视角人脸识别  88-93
    5.2.1 多线性分析理论  89-91
    5.2.2 多视角人脸张量分解与识别  91-93
    5.2.3 人脸张量空间的维数约减  93
  5.3 基于视角流形建模的多视角人脸识别  93-97
    5.3.1 人脸视角流形建模  93-94
    5.3.2 模型参数求解  94-97
  5.4 实验结果与分析  97-103
    5.4.1 实验数据介绍  97-98
    5.4.2 多视角人脸合成  98-99
    5.4.3 多视角人脸识别结果  99-103
  5.5 本章小结  103-104
  本章参考文献  104-107
第六章基于非线性张量分解的多视角人脸识别  107-121
  6.1 引言  107-108
  6.2 多视角人脸视角流形生成方法  108-112
    6.2.1 概念驱动的视角流形  108-109
    6.2.2 数据驱动的视角流形  109-111
    6.2.3 混合数据-概念驱动的视角流形  111-112
  6.3 非线性张量分解与视角流形相结合的多视角人脸识别  112-116
    6.3.1 基于非线性张量分解的人脸生成模型  113-114
    6.3.2 模型参数估计与多视角人脸识别  114-116
  6.4 实验结果与分析  116-119
  6.5 本章小结  119
  本章参考文献  119-121
第七章总结与展望  121-124
  7.1 总结  121-122
  7.2 未来工作的展望  122-124
致谢  124-126
攻读博士学位期间撰写的学术论文  126-128
攻读博士学位期间参与的科研工作  128
攻读博士学位期间获奖情况  128-129

复杂背景下多视角人脸检测与识别

内容摘要

全文目录

相似论文