学位论文 > 优秀研究生学位论文题录展示

基于CRF和SVM的连续语音识别研究

作 者: 张利娟
导 师: 马希荣
学 校: 天津师范大学
专 业: 教育技术学
关键词: 连续语音识别 条件随机场 支持向量机 混合模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 1次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算技术的飞速发展,计算机成为人们生活、工作和学习中不可或缺的日常工具之一,人们渴望着与计算机进行交互,并且期盼着与计算机的交互能更加的友好、更加自然。人们的这一理想促使了研究者对语音识别的研究热潮。目前,已经有各种语音识别技术被提出,并在语音识别领域取得了很大的成就。但是在实际的应用中,还是存在诸多问题,尤其是在连续语音的识别上还存在着很多的难点和不足之处。因此,要想实现更好、更有实用意义的连续语音识别,研究者仍需要对语音识别领域的相关理论技术、算法思想等继续展开研究,进而实现人们的理想。本论文首先对语音识别进行概述,介绍了语音识别的国内外发展现状,并对其分类及现存的难点进行了分析与研究;接着对语音信号的声学基础和前端分析处理做了详细介绍,阐述了如何对采集到的语音信号进行预处理、端点检测和特征参数提取等;然后研究了语音识别领域三种较为重要的识别算法:动态时间规整(Dynamic Time Warping, DTW)、隐马尔科夫模型(Hidden Markov Model, HMM)以及人工神经网络(Artificial Neural Network, ANN),分析了它们的原理、特点及实现过程;再然后在分析条件随机场(Conditional Random Fields, CRF)模型和支持向量机(Support Vector Machine,SVM)这两种模型的基础上,结合二者的优势,提出了基于CRF和SVM相结合的连续语音识别方法,介绍了系统的整体框架,并通过具体的实验分析验证了本方法在语音识别系统中的识别效果,实验证明本算法提高了连续语音识别的正确率;最后对本论文进行了总结与展望,并提出了未来工作需要进一步改进和提升的地方。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-17
  1.1 语音识别概述  9-10
  1.2 语音识别的发展及研究现状  10-12
  1.3 语音识别系统的分类  12-14
  1.4 语音识别目前存在的主要问题  14-15
  1.5 本论文的主要内容和结构  15-17
第2章 语音识别声学基础和前端分析  17-27
  2.1 语音信号的产生  17-18
    2.1.1 语音的产生及分类  17
    2.1.2 语音信号的数学模型  17-18
  2.2 语音信号采集  18-20
  2.3 语音信号的预处理  20-22
    2.3.1 预加重  20-21
    2.3.2 分帧  21
    2.3.3 加窗  21-22
  2.4 语音信号的端点检测  22-24
  2.5 语音信号的特征参数提取  24-27
    2.5.1 线性预测倒谱系数LPCC  24-25
    2.5.2 美尔频率倒谱系数MFCC  25-27
第3章 语音识别的相关技术研究及算法  27-37
  3.1 动态时间规整算法(DTW)  27-30
    3.1.1 DTW算法的基本原理  27-29
    3.1.2 DTW的具体算法步骤  29-30
  3.2 隐马尔科夫模型(HMM)  30-35
    3.2.1 HMM的定义及基本原理  30-32
    3.2.2 HMM解决的三个问题  32
    3.2.3 HMM的三种算法介绍  32-35
  3.3 人工神经网络(ANN)  35-37
第4章 基于CRF和SVM的连续语音识别  37-52
  4.1 条件随机场(CRF)模型  37-38
  4.2 支持向量机(SVM)  38-41
  4.3 基于CRF和SVM混合的连续语音识别方法  41-50
    4.3.1 CRF与SVM混合研究的意义  41-42
    4.3.2 语音识别过程  42-43
    4.3.3 基于CRF和SVM混合的连续语音识别系统  43-44
    4.3.4 语音训练识别的具体过程  44-49
    4.3.5 辅助工具  49-50
  4.4 系统实验与分析  50-52
第5章 总结与展望  52-54
  5.1 本文总结  52
  5.2 研究展望  52-54
参考文献  54-57
致谢  57

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  5. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  6. 音乐结构自动分析研究,TN912.3
  7. 基于三维重建的焊点质量分类方法研究,TP391.41
  8. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  9. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  10. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  11. 基于图像的路面破损识别,TP391.41
  12. 基于支持向量机的故障诊断方法研究,TP18
  13. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  14. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  15. 基于车载3D加速传感器的路况监测研究,TP274
  16. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  17. 不匹配信道下耳语音说话人识别研究,TN912.34
  18. 基于文本挖掘的学者简历自动生成,TP391.1
  19. 基于特征选择的入侵检测研究,TP393.08
  20. 基于SVM的跨膜蛋白结构预测应用研究,Q51
  21. LS-SVM算法预测煤层瓦斯涌出量技术研究及应用,TD712.5

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com