学位论文 > 优秀研究生学位论文题录展示
噪声环境下说话人识别研究
作 者: 于明刚
导 师: 张汝波
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 说话人识别 美尔倒谱系数 群延迟谱 矢量量化
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 94次
引 用: 2次
阅 读: 论文下载
内容摘要
随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数自动鉴别说话人身份的技术。随着计算机技术发展,说话人识别技术越来越受到人们的重视。在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数。其二,设计出行之有效的分类器。说话人识别虽然研究历史较长,但仍有许多问题有待研究解决,噪声环境下的说话人识别即是其一。在纯净语音环境下的说话人识别系统已经有很高的识别率,但是在噪声环境中识别率显著降低。为了提高说话人识别系统的在噪声环境中的识别率,本文考虑到小波变换的优点,结合具有较好鲁棒性的特征参数GDS(group delay spectrum),提取基于小波变换的GDS特征参数。对于分类器的设计,主要应用矢量量化的技术。通过不同噪声在不同信噪比下的实验来验证提取参数的有效性。本文首先介绍了说话人识别技术的研究背景和应用领域,概要介绍了说话人识别技术。接着对说话人识别技术中常用的特征参数进行了性能研究,通过实验比较了它们的鲁棒性。针对噪声环境下,提出了新的组合特征参数,并详细介绍了特征参数的提取过程。然后给出了分类器的设计方法。最后,根据提出的方法实现了说话人识别系统。
|
全文目录
摘要 5-6 Abstract 6-11 第1章 绪论 11-21 1.1 论文研究背景 11-12 1.2 说话人识别的应用领域 12-13 1.3 说话人识别技术 13-17 1.3.1 说话人识别的基本概念 13-14 1.3.2 说话人识别系统结构 14-15 1.3.3 说话人识别的关键技术 15-16 1.3.4 说话人识别系统性能 16-17 1.4 噪声环境中的说话人识别技术 17-20 1.4.1 噪声的分类及影响 17-18 1.4.2 抗噪声处理的基本方法 18-20 1.5 本课题的主要研究内容 20-21 第2章 特征参数提取 21-34 2.1 语音信号处理基础 21-24 2.1.1 语音信号特征 21 2.1.2 时域分析 21-22 2.1.3 频域分析 22 2.1.4 语谱分析 22-23 2.1.5 倒谱分析 23-24 2.2 线性预测系数(LPC)和倒谱系数(LPCC) 24-26 2.2.1 线性预测系数(LPC) 24-25 2.2.2 倒谱系数(LPCC) 25-26 2.3 MFCC和差分MFCC参数的提取 26-28 2.3.1 MFCC参数的提取 26-27 2.3.2 差分MFCC参数的提取 27-28 2.4 GDS参数的提取 28-30 2.5 实验 30-33 2.6 本章小结 33-34 第3章 基于小波变换GDS参数提取 34-42 3.1 小波分析理论简介 34-37 3.1.1 小波和小波变换 34-36 3.1.2 多分辨率分析与Mallat算法 36-37 3.2 小波变换GDS参数提取 37-41 3.3 实验 41 3.4 本章小结 41-42 第4章 分类器设计 42-52 4.1 分类器设计方法简介 42-47 4.1.1 基于模板匹配模型的方法 42-43 4.1.2 基于概率模型的方法 43-45 4.1.3 基于判决模型的方法 45-46 4.1.4 基于混合模型的方法 46-47 4.2 矢量量化的基本原理 47-48 4.3 VQ的识别模型 48-50 4.3.1 基于LBG算法的码本形成过程 48-50 4.3.2 基于VQ的说话人识别 50 4.4 本章小结 50-52 第5章 说话人识别系统的实现 52-60 5.1 语音信号的预处理 52-55 5.1.1 预滤波和模数变换 52 5.1.2 预加重 52-53 5.1.3 分帧和加窗 53-54 5.1.4 端点检测 54-55 5.2 说话人识别系统实现与研究 55-58 5.2.1 说话人识别系统的实现 55-58 5.2.2 实验数据的分析 58 5.3 本章小结 58-60 结论 60-61 参考文献 61-65 攻读硕士学位期间发表的论文和取得的科研成果 65-66 致谢 66
|
相似论文
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
- 压缩感知算法及其在矢量量化中的应用,TN911.7
- Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
- 语音人工带宽扩展算法研究,TN912.3
- 复杂信道下的说话人识别技术,TN912.34
- 基于VC++6.0的说话人识别系统的研究,TN912.34
- 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
- 基于混合特征和高斯混合模型的说话人识别研究,TN912.34
- 甚低速率语音编码器算法研究,TN912.3
- 端到端保密通信中的类语音调制解调研究,TN918
- AMR-WB+编码算法关键技术及码流识别研究,TN912.3
- 基于Windows CE的说话人识别系统的设计与实现,TN912.34
- 基于MELP的低速率语音编码算法研究,TN912.3
- 说话人识别中特征参数的提取及优化研究,TN912.34
- 基于文本无关的说话人识别研究,TN912.34
- 高速公路交通事件检测建模及应用研究,U491.116
- 多路并行实时说话人识别算法研究与实现,TN912.34
- 低速率语音编码参数高效量化算法研究,TN912.3
- 基于语音信号特征的语音零水印,TP309.7
- 基于支持向量机的说话人识别系统的开发,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|