学位论文 > 优秀研究生学位论文题录展示
嵌入式语音识别系统的研究与实现
作 者: 孙延冰
导 师: 刘宇红
学 校: 贵州大学
专 业: 通信与信息系统
关键词: 语音识别 特征提取 嵌入式 DTW
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 106次
引 用: 1次
阅 读: 论文下载
内容摘要
语音识别技术是近几年来语音处理领域出现的一个关键技术。语音识别的目的就是研制出一种具有人类听觉功能的机器,以便能够直接听懂人的讲话,并做出相应的反应。语音识别正在办公或商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号以及医疗和卫生等领域发挥重要的作用,并且极有可能成为下一代操作系统和应用程序的用户界面。语音识别研究取得了巨大的成就,形成了隐马尔可夫模型、矢量量化、动态时间规正等有效技术,出现了一些比较成功的语音识别系统。这种具备了语音识别功能的系统在互连网、通信、军事、国防等方面有着十分重要的价值。随着集成电路尤其是超大规模集成电路的快速发展,嵌入式的功能越来越强大,语音识别技术在嵌入式系统上的应用成为了可能。语音识别是一门内涵丰富、应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。本文基于语音信号产生的数学模型,从时域、频域、出发,对语音信号进行分析,论述了语音识别的基本理论。语音识别的方法有统计模式识别法(包括模板匹配法、随机模型法和概率语法分析法)、句法模式识别法、模糊数学识别法和人工神经网络识别法等。模板匹配法发展较成熟,目前已经达到了使用阶段。美尔倒谱分析和线性预测分析是应用较广的特征参数提取技术;模式匹配及模型训练技术有隐马尔可夫模型(HMM)、矢量量化(VQ)、动态时间规整(DTW)和人工神经网络(ANN)。在此基础上,本文讨论了语音识别系统的主要技术及其在本课题中的应用,并重点讨论了本课题中语音信号端点检测、特征参数的提取、识别算法的优劣以及在不同系统中的应用。根据实际情况搭建了一个基于DTW算法的孤立词,小词汇量,特定人的语音识别系统,使系统能够识别0—9十个数字。该系统包括以下几个部分,前端处理、端点检测、模板训练、语音识别等。
|
全文目录
目录 3-5 摘要 5-6 Abstract 6-7 第一章 前言 7-10 1.1 课题背景 7 1.2 语音识别技术的发展历史 7-8 1.3 语音识别研究的现况 8-9 1.4 主要研究内容和论文结构 9-10 第二章 语音信号处理 10-20 2.1 语音学知识 10-11 2.1.1 语音信号的发音器官 10 2.1.2 音素、音节及汉语的音调 10-11 2.2 语音信号产生的数学模型 11-12 2.3 语音信号分析 12-15 2.3.1 语音信号的时域分析 12-13 2.3.2 语音信号的频域分析 13-14 2.3.3 语音信号的倒谱分析 14-15 2.4 语音信号的预处理及特征提取 15-18 2.4.1 语音信号的预处理 15-16 2.4.2 语音信号的特征提取 16-18 2.5 语音识别的训练方法 18-20 2.5.1 偶然性训练法 18 2.5.2 鲁棒性训练法 18-19 2.5.3 聚类训练法 19-20 第三章 语音识别方法 20-39 3.1 语音识别系统结构 20 3.2 隐马尔可夫模型 20-29 3.2.1 隐马尔可夫模型基本原理 21 3.2.2 HMM的基本元素 21-22 3.2.3 隐马尔可夫模型的基本算法 22-26 3.2.4 隐马尔可夫模型的一些实际问题 26-28 3.2.5 HMM在应用中存在的问题 28-29 3.3 人工神经网络(ANN) 29-35 3.3.1 神经网络的基本概念 30-32 3.3.2 BP网络模型 32-34 3.3.3 神经网络在语音识别中的应用 34-35 3.4 动态时间规整 35-39 3.4.1 DTW算法的基本原理 36-37 3.4.2 DTW算法与孤立词的识别 37-39 第四章 语音识别系统的仿真和改进 39-52 4.1 系统组成 39 4.2 语音信号预处理 39-42 4.2.1 语音信号预加重 40-41 4.2.2 加窗分帧 41-42 4.2.3 端点检测 42 4.3 特征参数提取 42-44 4.3.1 线性预测倒谱系数 43 4.3.2 美尔倒谱系数 43-44 4.4 语音识别算法 44-46 4.5 实验结果分析及算法改进研究 46-52 4.5.1 实验结果 46-48 4.5.2 DTW算法的研究和改进 48-52 第五章 基于ARM的语音识别系统 52-65 5.1 语音识别的系统要求 52-53 5.2 UP-NET ARM 2410-S 53-58 5.3 嵌入式系统软件设计 58-59 5.4 系统软件开发流程 59-63 5.5 实验结果及分析 63-65 第六章 总结与展望 65-67 6.1 主要工作 65 6.2 前景展望 65-67 致谢 67-68 主要参考文献 68-71 附录 攻读硕士学位期间发表的论文 71-72
|
相似论文
- 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 汽车的电动助力转向系统,U463.4
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 面向软件的故障注入工具的研究与实现,TP311.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 基于ARM9的Windows CE系统移植,TP316.7
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
- 移动机器人视觉检测和跟踪研究,TP242.62
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|