学位论文 > 优秀研究生学位论文题录展示
基于电话信道的声纹识别算法研究
作 者: 周芬
导 师: 何新
学 校: 南京理工大学
专 业: 检测技术与自动化装置
关键词: 声纹识别 独立分量分析 端点检测 特征参数 GMM-UBM
分类号: TN912.34
类 型: 硕士论文
年 份: 2012年
下 载: 69次
引 用: 0次
阅 读: 论文下载
内容摘要
声纹识别是一种利用说话人语音来确定身份的技术,虽然现如今在实验室环境中已经取得了很好的识别性能,但是一旦用到现实环境中,容易受环境噪声以及各种信道的干扰,使得识别率严重下降。本文以提高声纹识别系统的识别率出发,对其深入讨论与研究。环境噪声与各种信道的干扰一般通过信号空间、特征空间以及模型空间这三个空间来影响识别性能,本文主要从信号空间以及特征空间这两方面进行研究来改善干扰的影响,并同时对高斯混合-通用背景模型(GMM-UBM)深入探讨,来提高识别性能。主要工作如下:1)从信号空间入手,介绍传统的一些语音去噪算法,通过实验证明这些方法受噪声强度的影响,因此重点研究基于独立分量分析(ICA)的去噪方法,对ICA中基于负熵的fastICA算法做深入研究,并对其做改进。实验表明,这种去噪方法能明显提高性噪比。2)为了有效地判断语音的起始/结束,研究传统的双门限端点检测算法,并提出改进的基于幅度增量与过零率的双门限算法,通过实验表明能减少提取特征时的运算量。3)对线性预测参数、线性预测倒谱参数、梅尔倒谱参数以及一阶差分进行深入探讨,研究这些静动态特征组合对系统识别率的改善情况,利用基音受信道干扰小的特点,对基音进行研究,将其与其它特征结合,提高在不同信道下的系统鲁棒性。4)研究基本的识别模型:矢量量化模型、高斯混合模型,在前两者的基础上深入探讨GMM-UBM模型,并通过实验分析码字个数、语音训练长度、高斯混合数对识别性能的影响,最后结果表明GMM-UBM能有效提高识别性能。5)在话务台改造项目的背景下,利用本文的相关算法,设计实现一套完整的基于电话信道的声纹识别系统。
|
全文目录
摘要 3-4 Abstract 4-9 1 绪论 9-17 1.1 声纹识别的背景及意义 9-10 1.2 声纹识别的基本原理 10-11 1.2.1 声纹识别的概念 10-11 1.2.2 声纹识别的分类 11 1.3 声纹识别的发展历史和国内外研究现状 11-14 1.4 论文的工作内容 14 1.5 本文结构安排 14-17 2 声纹识别中特征参数的提取 17-33 2.1 语音信号的时域分析 17-20 2.1.1 短时平均过零率 17-18 2.1.2 短时能量与幅度分析 18-19 2.1.3 短时自相关分析 19-20 2.2 倒谱与复倒谱 20-25 2.2.1 线性预测倒谱参数(LPCC) 20-23 2.2.2 梅尔倒谱参数(MFCC) 23-24 2.2.3 差分倒谱参数 24-25 2.2.4 线性梅尔倒谱参数(MFCC-LPC) 25 2.3 声门信息融合 25-28 2.3.1 基音周期的提取 25-26 2.3.2 声门特征对信道的补偿 26-28 2.4 静动态特征组合对比实验结果 28-31 2.4.1 在理想环境下的特征组合实验 28-30 2.4.2 在不同信道下的特征组合实验 30-31 2.5 小结 31-33 3 语音信号中的预处理 33-57 3.1 噪声的分类及来源 33-34 3.2 传统的语音去噪算法 34-40 3.2.1 谱相减法 34-35 3.2.2 自适应滤波法 35-36 3.2.3 小波变换法 36-38 3.2.4 各种传统语音去噪算法的比较 38-40 3.3 基于独立分量分析的语音去噪基本知识 40-44 3.3.1 ICA的数学模型及约束条件 40-41 3.3.2 ICA中的基础理论 41-43 3.3.3 ICA的工作原理 43 3.3.4 ICA中语音信号的预处理 43-44 3.4 ICA的算法研究 44-50 3.4.1 基于负熵最大的fastICA算法 44-47 3.4.2 基于峭度最大的fastICA 47-48 3.4.3 基于负熵的fastICA算法改进 48-49 3.4.4 基于负熵fastICA的改进算法去噪实验结果 49-50 3.5 端点检测算法 50-54 3.5.1 传统的双门限端点检测 51-53 3.5.2 改进的双门限端点检测 53 3.5.3 实验结果 53-54 3.6 小结 54-57 4 声纹识别模型 57-71 4.1 基于VQ模型的声纹识别系统 57-59 4.1.1 VQ的基本原理 57-58 4.1.2 LBG算法 58 4.1.3 初始码本的选定 58-59 4.1.4 训练与识别系统 59 4.2 基于高斯混合模型(GMM)的声纹识别系统 59-65 4.2.1 GMM的模型描述 60-61 4.2.2 GMM的参数估计 61-64 4.2.3 GMM模型的识别 64-65 4.3 基于GMM-UBM的声纹识别系统 65-67 4.3.1 MAP自适应算法 66-67 4.3.2 识别 67 4.4 不同识别模型的实验比较 67-70 4.5 小结 70-71 5 系统实现框架 71-79 5.1 系统基本结构 71-72 5.2 实验平台 72-73 5.2.1 软件参数 72-73 5.2.2 硬件系统示意图 73 5.2.3 语音库 73 5.3 声纹识别系统软件界面 73-76 5.4 在噪声环境下的声纹识别实验 76-77 5.5 总结 77-79 6 总结与展望 79-81 6.1 总结 79 6.2 展望 79-81 致谢 81-83 参考文献 83-87
|
相似论文
- 认知无线电网络中的基于信道特征的主用户仿真攻击防御技术,TN925
- 数字助听器中语音增强技术的研究,TN912.35
- 棉纤维成熟度纵向图像分析研究,TP391.41
- 罐底腐蚀声发射信号降噪研究,TH878
- 功率谱估计在宽带ADCP信号检测中的研究与应用,TN911.23
- 用于金属磨粒检测系统的噪声消除算法研究,TP391.41
- 基于气味分析的设备异常检测方法研究,TB17
- 宽幅矮塔斜拉桥结构参数分析及宽幅箱梁剪力滞效应研究,U448.27
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 基于独立分量分析的地震盲反褶积方法及应用研究,P631.4
- 基于独立分量分析和小波变换的钢丝绳缺陷信号提取,TG115.284
- 基于日负荷曲线的用电行业构成比例在线修正方法研究,TM714
- 面向装备研制的产品平台构建研究,TJ08
- 独立分量分析的重盲分离研究及其在机械故障诊断中的应用,TH165.3
- 竹子地上部分形态特征及生长建模研究,S795
- 基于盲源分离的肺音信号提取研究,TN911.72
- 基于数字拼写的视—听联合刺激诱发ERP研究,R318.0
- 基于听觉注意的认知脑—机接口研究,R318.0
- 多任务脑—机接口空域滤波与特征提取方法研究,TP11
- 基于Kernel ICA的PET图像去噪的研究,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|