学位论文 > 优秀研究生学位论文题录展示

基于GMM的说话人识别系统研究与实现

作　者: 陈强
导　师: 阙大顺
学　校: 武汉理工大学
专　业: 信号与信息处理
关键词: 语音处理说话人识别高斯混合模型矢量量化特征提取
分类号: TN912.34
类　型: 硕士论文
年　份: 2010年
下　载: 490次
引　用: 11次
阅　读: 论文下载

内容摘要

说话人识别也称声纹识别,其目的是根据说话人的声音特征来完成说话人的辨认或确认。随着网络信息化技术的迅猛发展,身份验证的数字化、隐性化、便捷化显得越来越重要,说话人识别作为一种生物认证技术,在视觉监控、身份验证、司法刑侦及金融安全等领域有着广泛应用前景,成为当前语音信号处理领域的研究热点。说话人识别技术研究的关键是语音信号的特征提取和模式匹配等问题。本文在研究当前说话人识别主要算法的基础上,通过研究基于声学特性的倒谱特征提取方法和基于模板匹配及概率统计的模式匹配方法,研究实现了基于矢量量化VQ的说话人识别系统,重点研究设计了与文本无关的基于混合高斯模型GMM的说话人识别系统。论文主要研究内容如下：(1)总结归纳说话人识别技术的发展、研究热点和难点,分析讨论了现有说话人识别主要算法。(2)分析研究了说话人识别语音预处理,重点对减谱法语音增强算法进行了改进,通过实验分析了语音增强效果,提高了噪声环境下的说话人识别系统的鲁棒性；研究了说话人识别的特征提取原理和方法,仿真实现了说话人基音特征、LPCC和MFCC参数及差分倒谱参数等的提取。(3)在分析VQ基本原理、LBG算法和VQ码本初始化的基础上,设计实现了基于VQ的说话人识别系统,完成了模型参数训练和匹配识别过程,实验分析了不同模型参数及不同语音样本时长下的系统识别性能。(4)为了提高系统识别率和稳定性,在研究GMM模型参数估计期望最大化(EM)算法、模型参数初始化、训练和识别过程的基础上,研究设计了基于GMM的说话人识别系统,并完成了系统仿真实验,分析了不同模型参数、不同特征提取方法、不同语音样本时长和不同信噪比噪声环境下的说话人识别性能。(5)分析了开集说话人识别方法、说话人确认阈值选取方法,研究了一种先辨认后确认的开集说话人识别方法,分析了针对集外冒充说话人的“拒识问题”,并完成了基于VQ和GMM两种模型的开集说话人识别系统性能分析比较。

全文目录

摘要  4-5
Abstract  5-9
第1章绪论  9-14
  1.1 说话人识别研究的目的与意义  9-10
  1.2 说话人识别发展历史和研究现状  10-12
  1.3 论文工作的主要内容  12-14
第2章说话人识别技术概述  14-19
  2.1 说话人识别的分类  14-15
  2.2 说话人识别的基本原理和系统结构  15
  2.3 说话人识别模式匹配方法  15-17
    2.3.1 模板匹配法  16
    2.3.2 概率统计模型法  16-17
  2.4 说话人识别系统性能评价  17-18
  2.5 本章小结  18-19
第3章说话人识别语音前端处理和特征提取  19-31
  3.1 语音信号预处理  19-22
  3.2 基于减谱法语音增强的语音前端处理  22-24
    3.2.1 减谱法语音增强基本原理  22-23
    3.2.2 改进减谱法语音增强  23
    3.2.3 减谱法语音增强应用于前端处理实验  23-24
  3.3 说话人识别特征提取  24-30
    3.3.1 基音特征参数提取  25-26
    3.3.2 LPCC特征参数提取  26-28
    3.3.3 MFCC特征参数提取  28-30
  3.4 本章小结  30-31
第4章基于VQ的说话人识别系统研究与实现  31-39
  4.1 系统基本结构  31-32
  4.2 矢量量化基本原理  32-34
    4.2.1 VQ基本原理  32
    4.2.2 LBG算法  32-33
    4.2.3 初始码本的选定  33-34
  4.3 系统具体实现  34-36
    4.3.1 语音数据库建立  34
    4.3.2 系统模型的训练与识别  34-36
  4.4 实验结果及其分析  36-38
    4.4.1 码本容量对说话人识别系统性能的影响  36-37
    4.4.2 不同的样本训练时间和测试时间对系统性能的影响  37-38
  4.5 本章小结  38-39
第5章基于GMM的说话人识别系统研究与实现  39-55
  5.1 系统基本结构  39-40
  5.2 高斯混合模型GMM  40-43
    5.2.1 模型描述  40
    5.2.2 模型参数估计  40-42
    5.2.3 模型参数初始化  42-43
  5.3 系统具体实现  43-48
    5.3.1 语音数据库  43-44
    5.3.2 系统模型的训练与识别  44-48
  5.4 实验结果及其分析  48-52
    5.4.1 GMM混合度对系统识别率的影响  48-49
    5.4.2 不同训练语音时长和测试时长对系统识别率的影响  49-51
    5.4.3 噪声环境下说话人识别系统分析  51-52
  5.5 基于VQ和GMM识别系统的性能比较  52-54
  5.6 本章小结  54-55
第6章总结与展望  55-57
  6.1 论文工作总结  55-56
  6.2 未来工作展望  56-57
致谢  57-58
参考文献  58-61
攻读学位期间发表的论文和参加的科研项目  61
  一、攻读学位期间发表的论文  61
  二、参加的科研项目  61

基于GMM的说话人识别系统研究与实现

内容摘要

全文目录

相似论文