学位论文 > 优秀研究生学位论文题录展示

基于CRF和SVM的连续语音识别研究

作　者: 张利娟
导　师: 马希荣
学　校: 天津师范大学
专　业: 教育技术学
关键词: 连续语音识别条件随机场支持向量机混合模型
分类号: TN912.34
类　型: 硕士论文
年　份: 2013年
下　载: 1次
引　用: 0次
阅　读: 论文下载

内容摘要

随着计算技术的飞速发展,计算机成为人们生活、工作和学习中不可或缺的日常工具之一,人们渴望着与计算机进行交互,并且期盼着与计算机的交互能更加的友好、更加自然。人们的这一理想促使了研究者对语音识别的研究热潮。目前,已经有各种语音识别技术被提出,并在语音识别领域取得了很大的成就。但是在实际的应用中,还是存在诸多问题,尤其是在连续语音的识别上还存在着很多的难点和不足之处。因此,要想实现更好、更有实用意义的连续语音识别,研究者仍需要对语音识别领域的相关理论技术、算法思想等继续展开研究,进而实现人们的理想。本论文首先对语音识别进行概述,介绍了语音识别的国内外发展现状,并对其分类及现存的难点进行了分析与研究；接着对语音信号的声学基础和前端分析处理做了详细介绍,阐述了如何对采集到的语音信号进行预处理、端点检测和特征参数提取等；然后研究了语音识别领域三种较为重要的识别算法：动态时间规整(Dynamic Time Warping, DTW)、隐马尔科夫模型(Hidden Markov Model, HMM)以及人工神经网络(Artificial Neural Network, ANN),分析了它们的原理、特点及实现过程；再然后在分析条件随机场(Conditional Random Fields, CRF)模型和支持向量机(Support Vector Machine,SVM)这两种模型的基础上,结合二者的优势,提出了基于CRF和SVM相结合的连续语音识别方法,介绍了系统的整体框架,并通过具体的实验分析验证了本方法在语音识别系统中的识别效果,实验证明本算法提高了连续语音识别的正确率；最后对本论文进行了总结与展望,并提出了未来工作需要进一步改进和提升的地方。

全文目录

摘要  4-5
Abstract  5-9
第1章绪论  9-17
  1.1 语音识别概述  9-10
  1.2 语音识别的发展及研究现状  10-12
  1.3 语音识别系统的分类  12-14
  1.4 语音识别目前存在的主要问题  14-15
  1.5 本论文的主要内容和结构  15-17
第2章语音识别声学基础和前端分析  17-27
  2.1 语音信号的产生  17-18
    2.1.1 语音的产生及分类  17
    2.1.2 语音信号的数学模型  17-18
  2.2 语音信号采集  18-20
  2.3 语音信号的预处理  20-22
    2.3.1 预加重  20-21
    2.3.2 分帧  21
    2.3.3 加窗  21-22
  2.4 语音信号的端点检测  22-24
  2.5 语音信号的特征参数提取  24-27
    2.5.1 线性预测倒谱系数LPCC  24-25
    2.5.2 美尔频率倒谱系数MFCC  25-27
第3章语音识别的相关技术研究及算法  27-37
  3.1 动态时间规整算法(DTW)  27-30
    3.1.1 DTW算法的基本原理  27-29
    3.1.2 DTW的具体算法步骤  29-30
  3.2 隐马尔科夫模型(HMM)  30-35
    3.2.1 HMM的定义及基本原理  30-32
    3.2.2 HMM解决的三个问题  32
    3.2.3 HMM的三种算法介绍  32-35
  3.3 人工神经网络(ANN)  35-37
第4章基于CRF和SVM的连续语音识别  37-52
  4.1 条件随机场(CRF)模型  37-38
  4.2 支持向量机(SVM)  38-41
  4.3 基于CRF和SVM混合的连续语音识别方法  41-50
    4.3.1 CRF与SVM混合研究的意义  41-42
    4.3.2 语音识别过程  42-43
    4.3.3 基于CRF和SVM混合的连续语音识别系统  43-44
    4.3.4 语音训练识别的具体过程  44-49
    4.3.5 辅助工具  49-50
  4.4 系统实验与分析  50-52
第5章总结与展望  52-54
  5.1 本文总结  52
  5.2 研究展望  52-54
参考文献  54-57
致谢  57

基于CRF和SVM的连续语音识别研究

内容摘要

全文目录

相似论文