学位论文 > 优秀研究生学位论文题录展示
嵌入式孤立字语音识别研究
作 者: 蔡虎
导 师: 邹雪城
学 校: 华中科技大学
专 业: 软件工程
关键词: 语音识别 动态时间规整 隐马尔科夫 嵌入式 音频设备驱动 Linux
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 125次
引 用: 2次
阅 读: 论文下载
内容摘要
语音识别和嵌入式是当今热点,其产品应用前景十分广阔,将语音识别应用到嵌入式系统中,更是能够发挥两者的优点。本文主要研究嵌入式孤立字语音识别,主要研究设计语音识别算法:动态时间规整算法DTW和隐马尔科夫算法HMM,然后编写了基于linux和arm芯片的音频驱动并对其进行了测试。本文在语音识别算法方面,首先建立了语音识别系统的发声模型,然后对语音进行预处理,即对数字信号预加重、分帧和加窗,接着对语音信号提取特征参数,提取特征参数的方法采用线性预测倒谱系数法和美尔倒谱系数法,再接下来是要对提取出来的特征矢量进行矢量量化,从而压缩数据。最后重点分析设计了动态时间规整DTW(Dynamic Time Warping)识别算法和隐马尔科夫HMM(Hidden Markov Model)识别算法。DTW主要是通过寻找动态时间规整函数来使输入模块与参考模块之间的误差达到最小,从而得出语音识别的相似误差。隐马尔科夫HMM识别算法主要是解决求观察值概率的问题、求最佳状态序列的问题和在什么情况下观察值概率最大的问题。基于以上两个模型基础,本文设计了matlab语音识别代码,得到了期望识别结果。在嵌入式方面,本文采用的操作系统为linux系统,硬件平台使用友善之臂的mini2440开发板,主要使用了开发板上声卡资源和LED资源,以及调试所用的串口。编写了音频驱动/dev/dsp和/dev/mixer,它们分别对应着音频驱动的两个部分,一个是主要用来录音播音的,另一个是用来对声音的大小进行控制。驱动编译成功后,然后加载进系统内核,并通过音频测试程序来测试上述两个设备。在开发应用试验方面,本文是通过语音来控制LED灯,不同的语音信号发出时LED灯就会处于不同的状态,以达到语音控制嵌入式设备的目的。最后提出了语音控制机场地勤服务的应用,并做了一些语音识别技术的研究,为后续研究打下基础。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-12 1.1 课题研究背景及意义 8-9 1.2 语音识别方法 9-10 1.3 嵌入式系统特点 10-11 1.4 后续章节安排 11-12 2 语音识别信号分析及其设计 12-33 2.1 语音识别系统过程分析 12-13 2.2 语音信号的基础知识分析和模型选择 13-15 2.3 语音信号预处理 15-19 2.4 语音信号端点检测方法设计 19-23 2.5 语音信号特征提取及设计 23-28 2.6 矢量量化 28-31 2.7 预处理及特征参数提取实验设计 31-33 3 语音识别算法DTW、HMM及设计 33-46 3.1 动态时间规整算法DTW分析与设计 33-38 3.2 隐马尔科夫算法HMM分析与设计 38-46 4 嵌入式语音识别软硬件及音频驱动设计 46-57 4.1 嵌入式语音识别系统的组成 46-47 4.2 数字音频电路设计 47-49 4.3 语音芯片UDA1341TS驱动程序的设计和实现 49-57 5 系统应用设计及实验结果 57-64 5.1 语音识别算法验证 57-58 5.2 嵌入式语音控制LED灯 58-62 5.3 语音控制机场地面管理应用地勤服务 62-64 6 结论与展望 64-65 致谢 65-66 参考文献 66-68
|
相似论文
- 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
- 汽车的电动助力转向系统,U463.4
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 网络语音传输丢包的恢复技术,TN912.3
- 面向软件的故障注入工具的研究与实现,TP311.52
- 领域实体属性及事件抽取技术研究,TP391.1
- 基于ARM9的Windows CE系统移植,TP316.7
- 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
- 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
- 多线阵CCD视觉测量系统的数据采集与处理,TP274.2
- 基于ARM的TFT-LCD面板检测设备软件的研究,TN873.93
- LXI-VXI适配器研制,TP274
- 高性能恒温晶体振荡器温度控制系统的研究,TN752
- 扩招后全日制硕士研究生思想政治教育问题研究,G643.1
- 网位仪信号采集与处理平台的设计与实现,S951.2
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 基于TCP/IP协议的嵌入式图像传输系统接收终端的设计,TP368.1
- 嵌入式中医经脉理疗仪的研究,R197.39
- 数字电视中间件中图形界面引擎的研究与应用,TP391.41
- 碳纳米管复合修饰物电极及其在电分析化学中的应用,O657.1
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|