学位论文 > 优秀研究生学位论文题录展示
基于GMM说话人分类的说话人识别系统研究
作 者: 李圆
导 师: 赵振东
学 校: 华北电力大学(河北)
专 业: 通信与信息系统
关键词: 说话人识别 多带谱相减 特征提取 小波变换 混合高斯模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 151次
引 用: 0次
阅 读: 论文下载
内容摘要
说话人识别是根据人的声音来识别人的身份的一种生物认证技术,广泛应用于人机接口、保安、军事、司法等方面。本文详细介绍了语音信号预处理、端点检测和特征提取的方法,建立了基于混合高斯模型说话人分类技术的分级说话人识别系统,同时将小波神经网络引入到子识别系统中。实际测试表明,基于小波神经网络的识别系统与传统的BP神经网络识别系统相比,网络训练速度加快,识别率也有所提高。且分类分级网络在保证正确识别率的同时,不仅改善了网络训练速度,亦大大提高了识别响应速度,是说话人识别的一种有效可行的方法。
|
全文目录
中文摘要 4 英文摘要 4-8 第一章 引言 8-16 1.1 研究背景与现状 8-9 1.2 说话人识别概述 9-10 1.2.1 说话人识别的概念 9 1.2.2 说话人识别的分类 9-10 1.2.3 说话人识别的基本原理和系统结构 10 1.3 说话人识别的主要技术 10-12 1.3.1 特征提取 10-12 1.3.2 说话人识别的模式匹配 12 1.4 说话人识别系统性能评价标准 12-14 1.5 说话人识别的应用前景 14 1.6 说话人识别研究的热点 14-15 1.7 论文内容安排 15-16 第二章 语音信号预处理 16-25 2.1 语音信号预加重 16 2.2 语音信号加窗分帧 16-17 2.3 语音信号时域分析 17-18 2.3.1 短时能量和短时平均幅度 17 2.3.2 短时过零率 17-18 2.3.3 短时自相关函数 18 2.4 语音信号端点检测 18-25 2.4.1 传统端点检测算法 18-19 2.4.2 本文采用的端点检测算法 19-22 2.4.3 端点检测的算法比较 22-25 第三章 语音信号特征提取 25-36 3.1 线性预测倒谱系数LPCC 的提取方法 25-27 3.2 美尔频率倒谱系数MFCC 的提取方法 27-30 3.3 感知线性预测系数PLPC 的提取方法 30-31 3.4 基于小波包变换特征参数的提取方法 31-34 3.4.1 小波包的定义 31-32 3.4.2 小波包的算法 32-33 3.4.3 小波包变换参数提取 33-34 3.5 其他语音特征 34-36 第四章 说话人识别方法 36-55 4.1 高斯混合模型 36-41 4.1.1 模型描述 37 4.1.2 最大似然参数估计 37-41 4.1.3 说话人识别方法 41 4.2 小波神经网络 41-51 4.2.1 小波分析 42-44 4.2.2 小波神经网络的结构 44-46 4.2.3 小波神经网络的学习方法 46 4.2.4 小波神经网络在说话人识别中的应用 46-51 4.3 分级说话人识别方法 51-55 4.3.1 网络概述 51-52 4.3.2 类模型的训练 52-55 第五章 说话人识别系统实现 55-65 5.1 特征提取 56-59 5.1.1 美尔倒谱系数的提取实现 56-57 5.1.2 基于小波包特征参数的提取实现 57-58 5.1.3 特征参数提取实验结果 58-59 5.2 说话人识别 59-65 5.2.1 识别系统具体实现 59-61 5.2.2 说话人识别实验结果 61-65 第六章 结论 65-66 参考文献 66-70 致谢 70-71 在学期间发表的学术论文和参加科研情况 71
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 图像的稀疏表示及编码模型研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 红外图像目标识别及跟踪技术研究,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|