学位论文 > 优秀研究生学位论文题录展示

基于GMM说话人分类的说话人识别系统研究

作 者: 李圆
导 师: 赵振东
学 校: 华北电力大学(河北)
专 业: 通信与信息系统
关键词: 说话人识别 多带谱相减 特征提取 小波变换 混合高斯模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 151次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别是根据人的声音来识别人的身份的一种生物认证技术,广泛应用于人机接口、保安、军事、司法等方面。本文详细介绍了语音信号预处理、端点检测和特征提取的方法,建立了基于混合高斯模型说话人分类技术的分级说话人识别系统,同时将小波神经网络引入到子识别系统中。实际测试表明,基于小波神经网络的识别系统与传统的BP神经网络识别系统相比,网络训练速度加快,识别率也有所提高。且分类分级网络在保证正确识别率的同时,不仅改善了网络训练速度,亦大大提高了识别响应速度,是说话人识别的一种有效可行的方法。

全文目录


中文摘要  4
英文摘要  4-8
第一章 引言  8-16
  1.1 研究背景与现状  8-9
  1.2 说话人识别概述  9-10
    1.2.1 说话人识别的概念  9
    1.2.2 说话人识别的分类  9-10
    1.2.3 说话人识别的基本原理和系统结构  10
  1.3 说话人识别的主要技术  10-12
    1.3.1 特征提取  10-12
    1.3.2 说话人识别的模式匹配  12
  1.4 说话人识别系统性能评价标准  12-14
  1.5 说话人识别的应用前景  14
  1.6 说话人识别研究的热点  14-15
  1.7 论文内容安排  15-16
第二章 语音信号预处理  16-25
  2.1 语音信号预加重  16
  2.2 语音信号加窗分帧  16-17
  2.3 语音信号时域分析  17-18
    2.3.1 短时能量和短时平均幅度  17
    2.3.2 短时过零率  17-18
    2.3.3 短时自相关函数  18
  2.4 语音信号端点检测  18-25
    2.4.1 传统端点检测算法  18-19
    2.4.2 本文采用的端点检测算法  19-22
    2.4.3 端点检测的算法比较  22-25
第三章 语音信号特征提取  25-36
  3.1 线性预测倒谱系数LPCC 的提取方法  25-27
  3.2 美尔频率倒谱系数MFCC 的提取方法  27-30
  3.3 感知线性预测系数PLPC 的提取方法  30-31
  3.4 基于小波包变换特征参数的提取方法  31-34
    3.4.1 小波包的定义  31-32
    3.4.2 小波包的算法  32-33
    3.4.3 小波包变换参数提取  33-34
  3.5 其他语音特征  34-36
第四章 说话人识别方法  36-55
  4.1 高斯混合模型  36-41
    4.1.1 模型描述  37
    4.1.2 最大似然参数估计  37-41
    4.1.3 说话人识别方法  41
  4.2 小波神经网络  41-51
    4.2.1 小波分析  42-44
    4.2.2 小波神经网络的结构  44-46
    4.2.3 小波神经网络的学习方法  46
    4.2.4 小波神经网络在说话人识别中的应用  46-51
  4.3 分级说话人识别方法  51-55
    4.3.1 网络概述  51-52
    4.3.2 类模型的训练  52-55
第五章 说话人识别系统实现  55-65
  5.1 特征提取  56-59
    5.1.1 美尔倒谱系数的提取实现  56-57
    5.1.2 基于小波包特征参数的提取实现  57-58
    5.1.3 特征参数提取实验结果  58-59
  5.2 说话人识别  59-65
    5.2.1 识别系统具体实现  59-61
    5.2.2 说话人识别实验结果  61-65
第六章 结论  65-66
参考文献  66-70
致谢  70-71
在学期间发表的学术论文和参加科研情况  71

相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  4. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  5. Q学习在基于内容图像检索技术中的应用,TP391.41
  6. 图像的稀疏表示及编码模型研究,TP391.41
  7. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  8. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  9. 空间交会接近视觉测量方法研究,TP391.41
  10. 图像实时采集、存储与处理方法研究,TP391.41
  11. 唇读中的特征提取、选择与融合,TP391.41
  12. 多币种纸币处理技术的研究与实现,TP391.41
  13. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  14. 基于图像的路面破损识别,TP391.41
  15. 移动机器人视觉检测和跟踪研究,TP242.62
  16. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  17. 基于随机森林的植物抗性基因识别方法研究,Q943
  18. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  19. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  20. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  21. 红外图像目标识别及跟踪技术研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com