学位论文 > 优秀研究生学位论文题录展示

语音识别算法研究及实现

作　者: 涂俊辉
导　师: 续晋华
学　校: 华东师范大学
专　业: 计算机应用技术
关键词: 语音识别 HMM 隐马尔可夫模型 HTK TIMIT
分类号: TN912.34
类　型: 硕士论文
年　份: 2010年
下　载: 429次
引　用: 3次
阅　读: 论文下载

内容摘要

通常意义上,我们所说的语音识别指的是将语音信号转换成文字的一个过程。语音识别作为模式识别领域中一个重要的研究方向,其重要性不言而喻。语音识别技术的发展可以使得人们与计算机等设备能更方便的进行交互。其最基本的应用就是实现语音输入。语音输入可以代替键盘的功能,提高输入速度,也节省人们宝贵的时间。此外还可能将语音识别技术用来控制某些机器,汽车,飞机,手机等。本文对语音识别的一些基本理论及算法进行了一些研究和实验。首先在第二章对语音信号的处理及特征提取进行了介绍,简要的介绍了两种常见的特征提取方法,并且比较了两种特征在用于孤立词的识别时性能的差异。接下来讨论了基于隐马尔可夫模型(Hidden Markov Model)的语音识别算法。在利用隐马尔可夫模型进行孤立词识别的基础上,尝试将该模型用于英文连续词的语音识别。该部分内容中介绍了一个连续语音识别系统的构成,讨论了对声学建模单元的选取,模型参数的改进,识别算法以及统计语言模型的使用,并且介绍了一个语音识别工具HTK。利用该工具在一个大词汇量非特定人的连续语音数据库TIMIT上进行相关的实验。

全文目录

摘要  7-8
ABSTRACT  8-11
第1章绪论  11-15
  1.1 研究背景及意义  11-12
  1.2 语音识别的分类  12-13
  1.3 国内外研究历史及现状  13
  1.4 本文研究内容及组织结构  13-15
第2章语音信号的预处理及特征提取  15-19
  2.1 语音信号的预处理  15-16
  2.2 基于发音模型的特征线性预测系数-LPC系数  16-18
  2.3 基于滤波器组的mel倒谱系数MFCC系数  18
  2.4 本章小结  18-19
第3章隐马尔可夫模型原理  19-34
  3.1 马尔可夫链理论及隐马尔可夫模型  19-21
    3.1.1 马尔可夫链  19-20
    3.1.2 隐马尔可夫模型  20-21
  3.2 隐马尔可夫模型的几个问题  21-31
    3.2.1 关于问题1的求解  22-24
    3.2.2 关于问题2的求解  24-26
    3.2.3 关于问题3的求解  26-28
    3.2.4 隐马尔可夫模型在实际应用中的问题  28-31
  3.3 隐马尔可夫模型的几种分类  31-33
  3.4 本章小结  33-34
第4章基于隐马尔可夫模型的孤立词识别  34-42
  4.1 端点检测  34-38
  4.2 用隐马尔可夫模型进行小词汇量的孤立词的识别  38-41
    4.2.1 模型的训练  39-41
  4.3 实验及结果分析  41
  4.4 本章小结  41-42
第5章基于隐马尔可夫模型的连续语音识别  42-59
  5.1 连续语音识别的系统构成  42-51
    5.1.1 数据的预处理及特征提取  42-43
    5.1.2 首先是确定用隐马尔可夫模型对什么样的声学单元进行建模  43
    5.1.3 声学模型的训练  43-47
    5.1.4 识别网络  47-49
    5.1.5 搜索与解码  49-51
  5.2 实验用的语音数据库  51
  5.3 实验使用的工具  51-52
  5.4 实验过程  52-59
    5.4.1 特征提取  52-53
    5.4.2 语言模型的建立  53
    5.4.3 识别网络的建立  53-54
    5.4.4 声学模型的训练  54
    5.4.5 初步的识别结果及其评估  54-55
    5.4.6 模型的改进和优化  55-59
      5.4.6.1 三音素单元建模  55-56
      5.4.6.2 对三音素模型的参数进行聚类并且绑定  56-57
      5.4.6.3 增加模型中的高斯混合数目  57-59
第6章总结及展望  59-60
  6.1 论文总结  59
  6.2 工作展望  59-60
致谢  60-61
附录  61-63
攻读硕士学位期间发表的学术论文  63-64
参考文献  64-67

相似论文

多重ANN/HMM混合模型在语音识别中的应用,TN912.34
基于DSP的机器人语音命令识别系统研制,TN912.34
在智能手机环境下健康管理功能设计与研究,TN929.53
移动音视频交互业务执行平台的研究,TN915.09
呼叫中心IVR系统的设计与实现,TN99
基于HMM的机器人语音识别系统的研究,TN912.34
基于改进MFCC的语音识别系统研究及设计,TN912.34
仿真机器人控制系统,TP242
基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
基于音素的错误发音自动检测方法研究与应用,TN912.34
基于ZigBee技术的智能家居监控系统的设计与实现,TN929.5;TP212.9
基于快速沃尔什变换的藏语音识别技术,TN912.34
研制咳嗽记录分析仪的前期研究,R725.6
遗传连锁群中分子标记排序研究,TP18
语音识别算法及其在嵌入式中的应用,TN912.34
托马斯液复合康斯特保护液对离体大鼠长时间心肌缺血—再灌注损伤的保护作用,R965
基于手机势识别的通用控制研究,TP391.41
基于HLA飞行模拟指挥练习器的研究与设计,V216.8
视频语义提取分析研究,TP391.41
基于语音控制的电动小车的设计,TP273