学位论文 > 优秀研究生学位论文题录展示
噪声环境下说话人特征参数提取研究
作 者: 江成
导 师: 蒋志方
学 校: 山东大学
专 业: 软件工程
关键词: 说话人识别 基音检测 LMS算法 语音端点检测 自适应时频参数
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 79次
引 用: 0次
阅 读: 论文下载
内容摘要
说话人识别是语音信号处理中的重要组成部分,是当前的研究热点之一。它是一项根据语音波形中反映说话人生理、心理和行为特征的语音参数来自动识别说话人身份的生物认证技术。说话人识别的两个关键在于个人特征的提取和识别模型的建立,其中个人特征的提取最为关键。由于现实环境中各种不确定噪声的引入,通常会使特征参数提取变得较为困难,从而使说话人识别系统性能显著下降。因此,噪声环境下提取说话人特征参数的研究意义非常重要。本文在分析了常用的说话人特征参数的基础上,研究了三种噪声环境下说话人特征参数提取的新算法,给出了具体的算法流程,并在MATLAB软件环境下进行了仿真实验。实验结果表明,新算法的检测效果明显优于传统方法,减少了检测误差,鲁棒性较好。首先,本文简单介绍了数字化语音信号处理的基础知识,讨论了语音信号时、频域处理方法,分析了常用的基音周期、端点检测和Mel倒谱系数等说话人特征参数的性能。接着,研究了说话人特征参数中的基音周期提取方法,分析了传统的自相关函数法(ACF)和平均幅度差函数法(AMDF)的优、缺点。结合LMS自适应滤波,提出了一种改进的基于LMS自适应滤波和ACF/AMDF加权平方特征的基音检测新算法。实验结果表明,该算法在噪声环境下的检测效果明显优于传统方法,有效地抑制了共振峰的影响,提高了基音检测精度,且计算复杂度低,适合于语音合成与编码的实时处理。然后,对常用的端点检测方法中的短时平均能量法、短时平均过零率法和谱熵法进行了详细说明。结合谱减增强原理,提出了一种改进的基于谱减法和自适应子带能量谱熵的语音端点检测算法。该算法首先利用改进的谱减法对带噪语音信号进行增强处理,然后提取语音信号的自适应子带能量谱熵特征进行语音端点检测。仿真结果表明,该算法具有良好的检测性能,算法实现简单,环境适应性较强。进一步,从人耳听觉系统出发,对Mel标度滤波器组进行研究,给出了一种基于Mel域的自适应时频参数的算法流程。实验结果表明,该参数能有效区分语音和噪声的频带,识别率较传统的MFCC参数有明显的改善,较少依赖信噪比,且具有良好的噪声鲁棒性。最后,本文对所提算法进行了总结,提出了一些在今后工作中需要改进的问题,并对以后的研究方向作了简单的介绍和展望,指出了未来说话人特征参数提取的发展前景。
|
全文目录
摘要 9-11 ABSTRACT 11-13 第1章 概述 13-20 1.1 研究背景及意义 13-14 1.2 国内外研究现状 14-15 1.3 面临的主要困难 15-17 1.4 本文的主要工作 17-18 1.5 本文的组织结构 18-20 第2章 数字化语音信号处理基础 20-30 2.1 语音的产生 20-23 2.1.1 发声器官 20 2.1.2 清音、浊音和爆破音 20-21 2.1.3 基音频率 21-22 2.1.4 语谱图 22-23 2.2 语音信号数字化和预处理 23-27 2.2.1 预加重 24-25 2.2.2 分帧加窗 25-27 2.3 语音信号分析 27-29 2.3.1 短时时域分析 27-28 2.3.2 频域分析 28-29 2.4 本章小结 29-30 第3章 基音特征提取研究 30-44 3.1 经典的基音提取方法 30-35 3.1.1 自相关函数法(ACF) 31-34 3.1.2 平均幅度差函数法(AMDF) 34-35 3.2 基于LMS自适应滤波和ACF/AMDF加权平方特征的基音检测算法 35-40 3.2.1 LMS自适应滤波原理 35-36 3.2.2 改进的ACF/AMDF加权平方特征参数 36-40 3.3 仿真实验 40-43 3.3.1 实验条件 40 3.3.2 实验结果 40-43 3.4 本章小结 43-44 第4章 端点检测算法研究 44-65 4.1 常用的端点检测方法 44-51 4.1.1 短时平均能量和平均幅度 44-46 4.1.2 短时平均过零率 46-48 4.1.3 谱熵法 48-51 4.2 噪声对语音的影响 51-53 4.3 基于谱减法和自适应子带能量谱熵的端点检测算法 53-61 4.3.1 谱减增强原理 53-56 4.3.2 改进的自适应子带能量谱熵特征 56-60 4.3.3 自适应门限 60-61 4.4 实验结果及分析 61-64 4.5 本章小结 64-65 第5章 Mel域自适应时频参数研究 65-77 5.1 听觉系统的Mel倒谱系数(MFCC) 65-69 5.1.1 人耳听觉特性 65-66 5.1.2 Mel倒谱系数(MFCC) 66-69 5.2 Mel标度自适应时频参数 69-72 5.2.1 Mel频域能量 69-70 5.2.2 Mel域自适应时频参数 70-72 5.3 实验结果及分析 72-75 5.4 本章小结 75-77 第6章 结束语 77-79 6.1 结论 77 6.2 展望 77-79 参考文献 79-82 致谢 82-83 学位论文评阅及答辩情况表 83
|
相似论文
- 基于二阶循环统计量的阵列信号处理,TN911.7
- 数字助听器中语音增强技术的研究,TN912.35
- 相位编码信号脉压技术的研究与实现,TN957.51
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 复杂信道下的说话人识别技术,TN912.34
- 基于VC++6.0的说话人识别系统的研究,TN912.34
- 直扩系统中自适应干扰抑制技术研究,TN914.42
- 脉冲激光信号检测与软件设计,TN24
- 语音信号基音周期检测算法研究,TN912.3
- 基于混合特征和高斯混合模型的说话人识别研究,TN912.34
- 基于经验模态分解的语音端点检测算法研究,TN912.3
- 基于Windows CE的说话人识别系统的设计与实现,TN912.34
- 说话人识别中特征参数的提取及优化研究,TN912.34
- 基于文本无关的说话人识别研究,TN912.34
- 多路并行实时说话人识别算法研究与实现,TN912.34
- 基于自适应算法的并联型有源电力滤波器的研究,TN713.8
- 连续属性离散化和LMS算法相关研究,TP18
- 钢琴校音计算机软件的设计,TP368.1
- 基于支持向量机的说话人识别系统的开发,TN912.34
- 与文本无关的开集说话人识别技术研究,TN912.34
- 噪声环境下的说话人识别研究,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|