学位论文 > 优秀研究生学位论文题录展示
语音识别技术在导航设备中的应用
作 者: 张耀兰
导 师: 李兴华
学 校: 北京交通大学
专 业: 通信与信息系统
关键词: 语音识别 端点检测 梅尔频率倒谱参数 矢量量化 离散隐马尔科夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 183次
引 用: 2次
阅 读: 论文下载
内容摘要
随着我国车辆的迅速增加和公路交通网建设的增强,人们对车辆自身定位及路况信息获取的需求变得日益迫切,而GPS导航定位系统很好地满足了这一要求。常用的GPS导航系统需要手动输入目的地,引入语音识别技术后改变了该现状。作为人机交互的有效手段,语音识别技术的研究日渐成熟、实用。使用具备语音识别技术的车载导航系统,驾驶者无需双手便可以与其交互,使得车载导航定位更加方便、快捷。本文即设计了一套应用于GPS导航仪的语音识别系统。首先,本文阐明了本课题的研究背景和意义,总结了语音识别系统的发展历史及现状,介绍了车载GPS导航系统,并在此基础上对语音识别技术在GPS导航系统中的应用进行了分析。接着,本文介绍了语音识别原理的两部分内容:语音信号分析和识别方法。语音信号分析包括语音信号预处理、语音信号的端点检测与特征提取,本文的端点检测采用基于短时能量和短时平均过零率的双门限检测法,并选用了梅尔频率倒谱参数作为特征参数;识别方法部分,本文介绍了隐马尔科夫模型和矢量量化模型的原理和基本算法,并根据GPS导航仪资源受限的特性,最终选择离散隐马尔科夫模型作为本文的基本识别算法。本文的主体部分是基于离散隐马尔科夫模型的语音识别系统的原理设计、功能实现与性能分析。本文从语音数据读取、预处理、特征提取、码本设计、系统实现五部分分析了系统的设计思路及流程,并在实验室环境下实现了系统功能。接着,本文在导航仪实际应用环境下建立小型语音库,对语音识别系统的性能及其在导航仪中应用的可行性进行测试分析,并根据车载语音识别导航系统对识别的正确率、实时性、资源占用等方面的要求,通过对码本数量和离散隐马尔科夫状态数选取的分析,最终确定本识别系统的码本容量和离散隐马尔科夫状态数。本文最后对全文工作进行了总结,指出当前工作中的不足,为以后的研究工作指明了努力方向。本文共有图22幅,表7个,参考文献39篇。
|
全文目录
致谢 5-6 中文摘要 6-7 ABSTRACT 7-13 1 绪论 13-21 1.1 选题背景及意义 13-14 1.2 语音识别系统介绍 14-19 1.2.1 语音识别的发展历史 14-16 1.2.2 语音识别系统分类 16-17 1.2.3 语音识别基本方法 17-18 1.2.4 语音识别的研究现状及发展前景 18-19 1.3 语音识别在导航系统中的应用 19-20 1.3.1 车载GPS导航系统 19 1.3.2 语音识别在导航系统中的应用 19-20 1.4 本文结构安排 20-21 2 语音识别基本原理 21-35 2.1 语音信号产生机理 21-22 2.2 语音信号预处理 22-24 2.3 语音信号特征提取 24-27 2.3.1 线性预测分析 24 2.3.2 线性预测倒谱参数 24-25 2.3.3 梅尔频率倒谱参数 25-27 2.4 矢量量化 27-29 2.4.1 矢量量化的原理 27-28 2.4.2 矢量量化的基本算法 28-29 2.5 隐马尔科夫模型 29-34 2.5.1 HMM的基本算法 30-33 2.5.2 HMM模型的分类 33-34 2.6 本章小结 34-35 3 基于GPS导航系统的语音识别系统设计 35-50 3.1 系统总体设计 35-36 3.2 读取语音文件 36-38 3.2.1 WAV文件格式 36-38 3.2.2 语音数据获取 38 3.3 预处理 38-39 3.4 端点检测 39-42 3.5 MFCC特征提取 42-44 3.6 VQ码本设计 44-45 3.7 基于DHMM的语音识别系统实现 45-49 3.7.1 DHMM的参数确定 45-46 3.7.2 基于DHMM的模型训练 46-49 3.7.3 基于DHMM的系统识别 49 3.8 本章小结 49-50 4 语音识别系统在导航设备中的应用分析 50-61 4.1 识别系统性能测试 50-53 4.1.1 建立测试语音库 50-51 4.1.2 识别系统性能 51-53 4.2 导航系统资源占用分析 53-55 4.2.1 ZHN600S导航仪平台 53-54 4.2.2 S3C2440处理器介绍 54 4.2.3 运算量分析 54-55 4.2.4 存储格式分析 55 4.3 嵌入式系统参数设置 55-60 4.3.1 码本容量的选择 55-57 4.3.2 DHMM状态数的确定 57-59 4.3.3 参数确定后语音识别系统性能 59-60 4.4 本章小结 60-61 5 总结与展望 61-63 5.1 工作总结 61 5.2 展望 61-63 参考文献 63-65 附录 A 65-66 作者简历 66-68 学位论文数据集 68
|
相似论文
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
- 压缩感知算法及其在矢量量化中的应用,TN911.7
- 数字助听器中语音增强技术的研究,TN912.35
- 移动音视频交互业务执行平台的研究,TN915.09
- 功率谱估计在宽带ADCP信号检测中的研究与应用,TN911.23
- Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
- 基于电话信道的声纹识别算法研究,TN912.34
- 语音人工带宽扩展算法研究,TN912.3
- 呼叫中心IVR系统的设计与实现,TN99
- 基于HMM的机器人语音识别系统的研究,TN912.34
- 基于改进MFCC的语音识别系统研究及设计,TN912.34
- 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
- 仿真机器人控制系统,TP242
- 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
- 基于词片网格的语音文档主题分类,TN912.3
- 基于HMM和PNN的混合语音识别模型研究,TN912.34
- 移动机器人语音识别控制仿真系统的设计与实现,TN912.34
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|