学位论文 > 优秀研究生学位论文题录展示

基于GMM说话人分类的说话人识别系统研究

作　者: 李圆
导　师: 赵振东
学　校: 华北电力大学（河北）
专　业: 通信与信息系统
关键词: 说话人识别多带谱相减特征提取小波变换混合高斯模型
分类号: TN912.34
类　型: 硕士论文
年　份: 2008年
下　载: 151次
引　用: 0次
阅　读: 论文下载

内容摘要

说话人识别是根据人的声音来识别人的身份的一种生物认证技术,广泛应用于人机接口、保安、军事、司法等方面。本文详细介绍了语音信号预处理、端点检测和特征提取的方法,建立了基于混合高斯模型说话人分类技术的分级说话人识别系统,同时将小波神经网络引入到子识别系统中。实际测试表明,基于小波神经网络的识别系统与传统的BP神经网络识别系统相比,网络训练速度加快,识别率也有所提高。且分类分级网络在保证正确识别率的同时,不仅改善了网络训练速度,亦大大提高了识别响应速度,是说话人识别的一种有效可行的方法。

全文目录

中文摘要  4
英文摘要  4-8
第一章引言  8-16
  1.1 研究背景与现状  8-9
  1.2 说话人识别概述  9-10
    1.2.1 说话人识别的概念  9
    1.2.2 说话人识别的分类  9-10
    1.2.3 说话人识别的基本原理和系统结构  10
  1.3 说话人识别的主要技术  10-12
    1.3.1 特征提取  10-12
    1.3.2 说话人识别的模式匹配  12
  1.4 说话人识别系统性能评价标准  12-14
  1.5 说话人识别的应用前景  14
  1.6 说话人识别研究的热点  14-15
  1.7 论文内容安排  15-16
第二章语音信号预处理  16-25
  2.1 语音信号预加重  16
  2.2 语音信号加窗分帧  16-17
  2.3 语音信号时域分析  17-18
    2.3.1 短时能量和短时平均幅度  17
    2.3.2 短时过零率  17-18
    2.3.3 短时自相关函数  18
  2.4 语音信号端点检测  18-25
    2.4.1 传统端点检测算法  18-19
    2.4.2 本文采用的端点检测算法  19-22
    2.4.3 端点检测的算法比较  22-25
第三章语音信号特征提取  25-36
  3.1 线性预测倒谱系数LPCC 的提取方法  25-27
  3.2 美尔频率倒谱系数MFCC 的提取方法  27-30
  3.3 感知线性预测系数PLPC 的提取方法  30-31
  3.4 基于小波包变换特征参数的提取方法  31-34
    3.4.1 小波包的定义  31-32
    3.4.2 小波包的算法  32-33
    3.4.3 小波包变换参数提取  33-34
  3.5 其他语音特征  34-36
第四章说话人识别方法  36-55
  4.1 高斯混合模型  36-41
    4.1.1 模型描述  37
    4.1.2 最大似然参数估计  37-41
    4.1.3 说话人识别方法  41
  4.2 小波神经网络  41-51
    4.2.1 小波分析  42-44
    4.2.2 小波神经网络的结构  44-46
    4.2.3 小波神经网络的学习方法  46
    4.2.4 小波神经网络在说话人识别中的应用  46-51
  4.3 分级说话人识别方法  51-55
    4.3.1 网络概述  51-52
    4.3.2 类模型的训练  52-55
第五章说话人识别系统实现  55-65
  5.1 特征提取  56-59
    5.1.1 美尔倒谱系数的提取实现  56-57
    5.1.2 基于小波包特征参数的提取实现  57-58
    5.1.3 特征参数提取实验结果  58-59
  5.2 说话人识别  59-65
    5.2.1 识别系统具体实现  59-61
    5.2.2 说话人识别实验结果  61-65
第六章结论  65-66
参考文献  66-70
致谢  70-71
在学期间发表的学术论文和参加科研情况  71

基于GMM说话人分类的说话人识别系统研究

内容摘要

全文目录

相似论文