学位论文 > 优秀研究生学位论文题录展示

非特定人连续语音识别的理论、分析和实验

作 者: 徐春燕
导 师: 王守觉;曹文明
学 校: 浙江工业大学
专 业: 检测技术与自动化装置
关键词: 连续语音识别 单词音节 隐马尔可夫模型 高维空间几何 高维空间点覆盖 神经网络
分类号: TN912.34
类 型: 硕士论文
年 份: 2005年
下 载: 329次
引 用: 6次
阅 读: 论文下载
 

内容摘要


非特定人连续汉语数字语音识别在电话语音网关、家电遥控、工业控制、信息查询系统等领域有着广泛的应用,无论在小词表语音识别系统还是大词表语音识别系统中都具有重要的理论意义和实用价值。由于汉语具有发音短、混淆性高、方言多的特点,汉语数字语音识别比英语数字语音识别难度更大,成为目前汉语语音识别领域的热点和难点问题。 以隐马尔可夫模型为典型代表的统计方法,对动态时间序列有很强的建模能力,在参数、结构和训练方法的选择上有很大的灵活性,成为目前主流的语音识别方法。然而,由于隐马尔可夫模型是基于统计的方法,模型的训练需要大量的样本,采集样本和训练模型的工作量大,对样本数据的信息利用率不高;出现概率少的样本容易得不到充分的训练而引起误识。 本文主要研究连续汉语数字音节的建模问题,提出一种新的人机结合的数字音节特征提取方法,从连续数字语音中提取出建模和测试用的数字音节样本集,把高维空间点覆盖理论应用于非特定人连续语音识别,建立各数字音节的高维空间点覆盖神经网络模型,并使用测试集进行建模正确性验证,验证结果正确率达到97%以上。该模型用于一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识

全文目录


第一章 绪论  11-18
  1.1 语音识别的发展历史及现状  11-14
  1.2 语音识别的难点  14-15
  1.3 本文选题的依据和意义  15-17
  1.4 本文的内容安排  17-18
第二章 隐马尔可夫模型(HMM)的基本原理及其在语音识别中的应用  18-27
  2.1 HMM基本原理  18-19
    2.1.1 马尔可夫链  18-19
    2.1.2 隐马尔可夫模型(HMM)  19
  2.2 HMM的三个基本问题  19-25
    2.2.1 HMM评价问题—前向后向算法  20-21
    2.2.2 HMM解码问题——Viterbi算法  21-22
    2.2.3 HMM学习问题Baum-Welch算法  22-24
    2.2.4 HMM的结构  24-25
  2.3 HMM在语音识别中的应用及其特点  25-27
第三章 一种人机结合的连续数字音节建模样本的特征提取方法  27-44
  3.1 汉语数码语音库的设计  27-28
  3.2 常用的特征提取方法  28-34
    3.2.1 线性预测倒谱系数(LPCC)  28-32
    3.2.2 MEL频率倒谱参数(MFCC)  32-34
  3.3 一种人机结合的连续数字音节样本的特征提取方法  34-44
    3.3.1 人机结合的意义  34-35
    3.3.2 数字切分和MFCC变换  35-37
    3.3.3 按照一定的夹角距离对语音数据进行压缩  37-40
    3.3.4 等长度规整数字音节样本  40-44
第四章 高维空间点覆盖方法在连续数字单词音节神经网络建模中的应用  44-63
  4.1 形象思维的概念和重要意义  44-46
  4.2 高维空间几何的分析方法  46-53
    4.2.1 高维空间几何的概念  46-50
    4.2.2 高维空间中的元素之间的相互关系及度量  50-52
    4.2.3 几何概念的推广——抽象的高维几何空间  52-53
  4.3 高维空间点覆盖理论  53-57
  4.4 基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别方法  57-63
第五章 HMM方法和高维空间点覆盖方法对数字音节建模的实验及分析  63-83
  5.1 对HMM和高维空间点覆盖方法建模能力的试验  63-70
    5.1.1 对HMM和高维空间点覆盖方法建模能力的试验  63-68
    5.1.2 对HMM和高维空间点覆盖方法建模能力试验的分析  68-70
  5.2 对高维空间点覆盖方法学习能力的试验  70-83
第六章 总结与展望  83-86
  6.1 本文的工作总结  83-85
  6.2 存在的问题和未来工作展望  85-86
参考文献  86-90
致谢  90-91
作者攻读硕士学位期间发表论文  91

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
  4. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  5. 红外超光谱图像的虚拟探测器研究,TP391.41
  6. 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
  7. 基于神经网络的水厂投药预测控制研究,TP273.1
  8. 视觉伺服四自由度机械臂的研究,TP242.6
  9. 机械臂视觉伺服系统的研究,TP242.6
  10. 压电驱动微工作台的控制与校正技术研究,TP273
  11. 某武器检测装置的控制系统设计,TP183
  12. 市级旅游用地规划环境影响评价研究,X820.3
  13. 珠三角地区高性能混凝土配合比智能化系统,TU528
  14. 大学生综合素质测评研究,G645.5
  15. 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
  16. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  17. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  18. 基于神经网络辨识的同步发电机励磁控制研究,TM31
  19. 基于BP神经网络的水稻干燥智能控制研究,S226.6
  20. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  21. 海上平台消防系统研究,U698.4

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com