学位论文 > 优秀研究生学位论文题录展示
贝叶斯网络在语音鲁棒性识别中的应用
作 者: 王兴斌
导 师: 王炳锡
学 校: 解放军信息工程大学
专 业: 信息与通信工程
关键词: 连续语音识别 贝叶斯网络 特征补偿 VBEM算法 能量 美尔频率倒谱系数
分类号: TN912.34
类 型: 硕士论文
年 份: 2006年
下 载: 94次
引 用: 2次
阅 读: 论文下载
内容摘要
语音识别是通过识别过程把语音信号转变为相应文本或命令的一种技术。经过多年的发展,语音识别在实验室已经取得了很大的成功。在实际应用中,由于环境的改变导致训练和测试环境不匹配,使得系统的识别性能显著下降。语音识别要走向实用化,就必须克服这种的不匹配造成的影响,因此语音鲁棒性识别技术有着非常重要的意义。 特征补偿是一种常用的鲁棒性识别技术。本文主要以贝叶斯网络为工具,通过贝叶斯网络灵活的建模能力和有效的学习算法——VBEM算法,对语音特征进行补偿。 本文分别对语音的能量特征和美尔频率倒谱系数特征做了补偿。 对能量的补偿本文采用了两种方法。第一种是用MMSE估计的RASTA-PLP能量替代谱能量,通过这种办法可使识别系统在信噪比10dB的白噪声环境下的识别正确率比不采用任何能量补偿的系统提高2.82%。第二种方法是通过贝叶斯网络的学习算法迭代估计语音的谱能量,这种方法对谱能量的做了很好的估计,识别系统在信噪比10dB的白噪声环境下识别正确率比不做能量补偿的系统提高4.21%。 本文在对美尔频率倒谱系数特征的补偿中以Algonquin框架为基础,通过贝叶斯网络融合能量参数后对美尔频率倒谱系数进行估计,使得系统在信噪比10dB的白噪声环境下识别正确率在Algonquin框架的基础上提高了2.24%。
|
全文目录
中文摘要 4-5 ABSTRACT 5-6 目录 6-8 表目录 8-9 图目录 9-10 第一章 绪论 10-13 1.1 语音识别的回顾和问题 10-11 1.2 贝叶斯网络与语音识别 11 1.3 本论文研究主题和论文安排 11-13 第二章 噪声环境下的连续语音识别系统 13-23 2.1 语音识别的整体模型 13-14 2.2 常用语音特征及其鲁棒性 14-18 2.2.1 短时能量参数 15 2.2.2 美尔频率倒谱系数 15-16 2.2.3 RASTA-PLP参数 16-18 2.3 模型训练 18-19 2.3.1 声学模型训练 18-19 2.3.2 语言模型训练 19 2.4 识别性能测试 19-20 2.5 噪声环境下的语音识别 20-21 2.6 实验平台概述 21-22 2.7 小结 22-23 第三章 贝叶斯网络与语音识别 23-31 3.1 图模型和贝叶斯网络 23-25 3.1.1 推理 24-25 3.1.2 结构学习 25 3.1.3 参数学习 25 3.2 VBEM算法 25-30 3.2.1 含隐含变量的参数学习 26 3.2.2 EM算法 26-28 3.2.3 VBEM算法 28-30 3.3 小结 30-31 第四章 语音能量的鲁棒性估计 31-42 4.1 语音能量的表示 31 4.2 RASTA-PLP能量的估计 31-34 4.3 用贝叶斯网络估计谱能量 34-41 4.4 小结 41-42 第五章 贝叶斯网络用于多流特征融合 42-61 5.1 辅助特征 42-43 5.2 贝叶斯网络引入模型 43-45 5.3 Algonquin框架 45-47 5.4 融合辅助特征后的Algonquin框架 47-60 5.4.1 Algonquin框架在图17(a)上 47-48 5.4.2 Algonquln框架在图17(b)上 48-56 5.4.3 Algonquln框架在图17(c)上 56-58 5.4.4 识别结果及分析 58-60 5.5 小结 60-61 结束语 61-62 致谢 62-63 参考文献 63-65 作者在学期间取得的学术成果 65-66 附录A 矩阵运算常用公式 66-67 附录B 条件高斯分布训练公式 67
|
相似论文
- 多传感器信息融合及其在可穿戴计算机上的应用,TP202
- 蛋白磷酸酶2A Cα亚基敲除所致心脏能量代谢重塑的研究,Q78
- 黄磷储罐区安全评价方法研究,TQ126.317
- 一水肌酸对肉鸭胴体组成、肉品质及宰后肌肉能量代谢的影响研究,S834.5
- 不同蛋白源饲料对褐点石斑幼鱼生长利用、能量收支及血液学指标的影响,S963
- 禁食对鸡肉宰后僵直及其品质影响研究,TS251.1
- 无线传感器网络MAC协议的研究,TN915.04
- 基于无线传感器网络的农田环境监测系统路由协议的研究,TN915.04
- 不同电压击昏对宰后鸡肉品质的影响,S831
- 慢性肾衰竭患者血清锌-α2-糖蛋白水平变化及与营养不良的关系分析,R692.5
- 基于多层WSN结构的非均匀簇路由协议研究,TP212.9
- 镉对华溪蟹肝胰腺线粒体抗氧化系统及能量代谢的影响,X174
- C2,O2+分子低激发态的光谱性质探究,O561.3
- 丙酮酸钠对体外循环犬红细胞能量代谢和血浆内NO浓度的影响,R654.1
- 基于图割理论的图像匹配问题研究,TP391.41
- 基于能量均衡的无线传感器网络多路径路由算法的研究,TP212.9
- FPSO在石油卸载过程中的风险评估,U698
- 基于最佳侧移刚度分布的多高层钢框架结构抗震设计方法,TU973.13
- 基于涡度相关法对松嫩草甸草原能量分配和能量闭合程度的研究,S812
- 移动自组网中基于能量的路由协议研究,TN929.5
- 一体化能量回馈电梯驱动控制系统实现,TP273
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|