学位论文 > 优秀研究生学位论文题录展示
基于DSP的孤立词语音识别系统的研究与实现
作 者: 陈卫强
导 师: 俞子荣; 孙成立
学 校: 南昌航空大学
专 业: 控制工程
关键词: 语音识别 DSP芯片 嵌入式系统 隐马尔科夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2013年
下 载: 30次
引 用: 0次
阅 读: 论文下载
内容摘要
本文基于TMS320VC5502芯片设计了一个非特定人嵌入式语音识别系统。该系统采用乒乓式数据处理方式,能够保证语音信号的采集和语音信号的识别实时进行;采用了在线端点检测算法,可以有效检测出音频流中的说话语音;声学模型采用隐马尔科夫模型技术,可以克服传统DTW方法的缺陷,有效提高系统的识别精度。本文实现的语音识别系统主要由DSP硬件设备和相应的软件算法组成。采用TI公司的高速DSP芯片TMS320VC5502作为系统的硬件平台,通过麦克风实现语音信号的输入,然后由TLV320AIC23B音频编解码芯片采集处理,并由DMA管理器负责将语音信号传送至数据存储区。通过端点检测和特征提取,将语音信号转换为MFCC特征系数,最后由Viterbi算法得到最终的识别结果。该系统主要由语音信号的预处理、端点检测、特征参数提取、相似性度量等组成。本设计采用基于能量变化的方法进行端点检测,相比传统基于能量和过零率阈值的方法,可以提高检测的鲁棒性,降低由于噪声干扰引起的检测下降风险。采用声韵母隐马尔科夫模型作为识别模型,具有很好的可扩展性和识别性能。语音是人类交流的主要手段。嵌入式系统是语音识别技术重要的应用领域,它将原本需要手工操作的工作,通过语音交互可以方便地完成。本文设计的DSP嵌入式系统可以广泛应用于手持设备的命令控制,具有重要的应用价值和参考价值。
|
全文目录
摘要 4-5 Abstract 5-6 目录 6-9 第1章 绪论 9-12 1.1 语音识别国内外的发展状况 9-10 1.2 语音识别系统的主要技术难点 10 1.3 课题主要研究内容 10-11 1.4 论文的组织结构 11-12 第2章 语音识别的相关技术 12-17 2.1 语音识别系统的分类 12 2.2 语音识别的结构 12-13 2.3 语音信号生成的数学模型 13-17 2.3.1 激励模型 14 2.3.2 声道模型 14-15 2.3.3 辐射模型 15 2.3.4 语音信号数学模型 15-17 第3章 语音识别的基本原理 17-37 3.1 语音信号预处理 17-21 3.1.1 语音信号滤波、数字化 17-18 3.1.2 语音信号的预加重 18 3.1.3 分帧加窗处理 18-21 3.2 端点检测算法 21-24 3.3 语音信号的特征提取 24-29 3.3.1 语音信号的时域分析 24-26 3.3.2 语音信号的频域分析 26-29 3.4 语音识别的模型建立 29 3.4.1 模板匹配模型 29 3.4.2 随机模型(又称参数模型) 29 3.5 隐马尔科夫模型的定义 29-37 3.5.1 HMM的定义 30-31 3.5.2 HMM中的三个基本问题及其解决方案 31-36 3.5.3 HMM的类型 36-37 第四章 非特定人孤立词语音识别系统 37-47 4.1 系统结构 37-38 4.2 声学模型训练 38-41 4.2.1 声学单元选取 38-40 4.2.2 声韵母声学单元训练方法 40-41 4.3 词典编辑和模型构建 41-42 4.3.1 词典编辑 41 4.3.2 标注 41-42 4.3.3 词模型的动态生成 42 4.4 语音信号处理及识别 42-47 4.4.1 在线端点检测 42-46 4.4.2 语音识别 46-47 第五章 孤立词识别系统的DSP实现 47-64 5.1 硬件平台介绍 47-50 5.1.1 TMS320VC5502特点 47-48 5.1.2 TLV320AIC23B特点 48-49 5.1.3 Flash介绍 49-50 5.1.4 DARAM介绍 50 5.2 硬件接口设计 50-54 5.2.1 TLV320AIC23B接口格式设置 51-53 5.2.2 DMA寄存器设置 53-54 5.3 软件平台介绍 54-55 5.4 软件实现 55-64 5.4.1 初始化模块 56 5.4.2 数据采集模块 56-57 5.4.3 数据处理模块 57-61 5.4.4 模型识别模块 61-64 第六章 总结与展望 64-65 6.1 总结 64 6.2 展望 64-65 参考文献 65-68 发表论文情况说明 68-69 致谢 69-70
|
相似论文
- 汽车的电动助力转向系统,U463.4
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 网络语音传输丢包的恢复技术,TN912.3
- 领域实体属性及事件抽取技术研究,TP391.1
- 基于ARM9的Windows CE系统移植,TP316.7
- 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
- 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
- 多线阵CCD视觉测量系统的数据采集与处理,TP274.2
- LXI-VXI适配器研制,TP274
- 高性能恒温晶体振荡器温度控制系统的研究,TN752
- 基于DSP的水声信号采集系统研究,TP274.2
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 嵌入式中医经脉理疗仪的研究,R197.39
- 基于windows xp嵌入式系统的心电检测分析仪,R197.39
- 基于嵌入式系统钻孔成像装置的研究,P634.3
- 基于ARM9的孤立词语音识别系统设计,TN912.34
- 语音识别技术研究与实现,TN912.34
- IPsec VPN嵌入式硬件防火墙加密卡的应用研究,TP393.08
- 基于WEB的GPS监控系统设计与实现,TP311.52
- 以太网MAC层协议研究与FPGA实现,TP393.04
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|