学位论文 > 优秀研究生学位论文题录展示
基于CRF和SVM的连续语音识别研究
作 者: 张利娟
导 师: 马希荣
学 校: 天津师范大学
专 业: 教育技术学
关键词: 连续语音识别 条件随机场 支持向量机 混合模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算技术的飞速发展,计算机成为人们生活、工作和学习中不可或缺的日常工具之一,人们渴望着与计算机进行交互,并且期盼着与计算机的交互能更加的友好、更加自然。人们的这一理想促使了研究者对语音识别的研究热潮。目前,已经有各种语音识别技术被提出,并在语音识别领域取得了很大的成就。但是在实际的应用中,还是存在诸多问题,尤其是在连续语音的识别上还存在着很多的难点和不足之处。因此,要想实现更好、更有实用意义的连续语音识别,研究者仍需要对语音识别领域的相关理论技术、算法思想等继续展开研究,进而实现人们的理想。本论文首先对语音识别进行概述,介绍了语音识别的国内外发展现状,并对其分类及现存的难点进行了分析与研究;接着对语音信号的声学基础和前端分析处理做了详细介绍,阐述了如何对采集到的语音信号进行预处理、端点检测和特征参数提取等;然后研究了语音识别领域三种较为重要的识别算法:动态时间规整(Dynamic Time Warping, DTW)、隐马尔科夫模型(Hidden Markov Model, HMM)以及人工神经网络(Artificial Neural Network, ANN),分析了它们的原理、特点及实现过程;再然后在分析条件随机场(Conditional Random Fields, CRF)模型和支持向量机(Support Vector Machine,SVM)这两种模型的基础上,结合二者的优势,提出了基于CRF和SVM相结合的连续语音识别方法,介绍了系统的整体框架,并通过具体的实验分析验证了本方法在语音识别系统中的识别效果,实验证明本算法提高了连续语音识别的正确率;最后对本论文进行了总结与展望,并提出了未来工作需要进一步改进和提升的地方。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-17 1.1 语音识别概述 9-10 1.2 语音识别的发展及研究现状 10-12 1.3 语音识别系统的分类 12-14 1.4 语音识别目前存在的主要问题 14-15 1.5 本论文的主要内容和结构 15-17 第2章 语音识别声学基础和前端分析 17-27 2.1 语音信号的产生 17-18 2.1.1 语音的产生及分类 17 2.1.2 语音信号的数学模型 17-18 2.2 语音信号采集 18-20 2.3 语音信号的预处理 20-22 2.3.1 预加重 20-21 2.3.2 分帧 21 2.3.3 加窗 21-22 2.4 语音信号的端点检测 22-24 2.5 语音信号的特征参数提取 24-27 2.5.1 线性预测倒谱系数LPCC 24-25 2.5.2 美尔频率倒谱系数MFCC 25-27 第3章 语音识别的相关技术研究及算法 27-37 3.1 动态时间规整算法(DTW) 27-30 3.1.1 DTW算法的基本原理 27-29 3.1.2 DTW的具体算法步骤 29-30 3.2 隐马尔科夫模型(HMM) 30-35 3.2.1 HMM的定义及基本原理 30-32 3.2.2 HMM解决的三个问题 32 3.2.3 HMM的三种算法介绍 32-35 3.3 人工神经网络(ANN) 35-37 第4章 基于CRF和SVM的连续语音识别 37-52 4.1 条件随机场(CRF)模型 37-38 4.2 支持向量机(SVM) 38-41 4.3 基于CRF和SVM混合的连续语音识别方法 41-50 4.3.1 CRF与SVM混合研究的意义 41-42 4.3.2 语音识别过程 42-43 4.3.3 基于CRF和SVM混合的连续语音识别系统 43-44 4.3.4 语音训练识别的具体过程 44-49 4.3.5 辅助工具 49-50 4.4 系统实验与分析 50-52 第5章 总结与展望 52-54 5.1 本文总结 52 5.2 研究展望 52-54 参考文献 54-57 致谢 57
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 不匹配信道下耳语音说话人识别研究,TN912.34
- 基于文本挖掘的学者简历自动生成,TP391.1
- 基于特征选择的入侵检测研究,TP393.08
- 基于SVM的跨膜蛋白结构预测应用研究,Q51
- LS-SVM算法预测煤层瓦斯涌出量技术研究及应用,TD712.5
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|