学位论文 > 优秀研究生学位论文题录展示

嵌入式语音识别系统的研究与实现

作 者: 孙延冰
导 师: 刘宇红
学 校: 贵州大学
专 业: 通信与信息系统
关键词: 语音识别 特征提取 嵌入式 DTW
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 106次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语音识别技术是近几年来语音处理领域出现的一个关键技术。语音识别的目的就是研制出一种具有人类听觉功能的机器,以便能够直接听懂人的讲话,并做出相应的反应。语音识别正在办公或商业系统的数据库语音查询、工业生产部门的语声控制、电话与电信系统的自动拨号以及医疗和卫生等领域发挥重要的作用,并且极有可能成为下一代操作系统和应用程序的用户界面。语音识别研究取得了巨大的成就,形成了隐马尔可夫模型、矢量量化、动态时间规正等有效技术,出现了一些比较成功的语音识别系统。这种具备了语音识别功能的系统在互连网、通信、军事、国防等方面有着十分重要的价值。随着集成电路尤其是超大规模集成电路的快速发展,嵌入式的功能越来越强大,语音识别技术在嵌入式系统上的应用成为了可能。语音识别是一门内涵丰富、应用广泛的技术,它的实用性和趣味性使得人们对它有着迫切的应用需求。本文基于语音信号产生的数学模型,从时域、频域、出发,对语音信号进行分析,论述了语音识别的基本理论。语音识别的方法有统计模式识别法(包括模板匹配法、随机模型法和概率语法分析法)、句法模式识别法、模糊数学识别法和人工神经网络识别法等。模板匹配法发展较成熟,目前已经达到了使用阶段。美尔倒谱分析和线性预测分析是应用较广的特征参数提取技术;模式匹配及模型训练技术有隐马尔可夫模型(HMM)、矢量量化(VQ)、动态时间规整(DTW)和人工神经网络(ANN)。在此基础上,本文讨论了语音识别系统的主要技术及其在本课题中的应用,并重点讨论了本课题中语音信号端点检测、特征参数的提取、识别算法的优劣以及在不同系统中的应用。根据实际情况搭建了一个基于DTW算法的孤立词,小词汇量,特定人的语音识别系统,使系统能够识别0—9十个数字。该系统包括以下几个部分,前端处理、端点检测、模板训练、语音识别等。

全文目录


目录  3-5
摘要  5-6
Abstract  6-7
第一章 前言  7-10
  1.1 课题背景  7
  1.2 语音识别技术的发展历史  7-8
  1.3 语音识别研究的现况  8-9
  1.4 主要研究内容和论文结构  9-10
第二章 语音信号处理  10-20
  2.1 语音学知识  10-11
    2.1.1 语音信号的发音器官  10
    2.1.2 音素、音节及汉语的音调  10-11
  2.2 语音信号产生的数学模型  11-12
  2.3 语音信号分析  12-15
    2.3.1 语音信号的时域分析  12-13
    2.3.2 语音信号的频域分析  13-14
    2.3.3 语音信号的倒谱分析  14-15
  2.4 语音信号的预处理及特征提取  15-18
    2.4.1 语音信号的预处理  15-16
    2.4.2 语音信号的特征提取  16-18
  2.5 语音识别的训练方法  18-20
    2.5.1 偶然性训练法  18
    2.5.2 鲁棒性训练法  18-19
    2.5.3 聚类训练法  19-20
第三章 语音识别方法  20-39
  3.1 语音识别系统结构  20
  3.2 隐马尔可夫模型  20-29
    3.2.1 隐马尔可夫模型基本原理  21
    3.2.2 HMM的基本元素  21-22
    3.2.3 隐马尔可夫模型的基本算法  22-26
    3.2.4 隐马尔可夫模型的一些实际问题  26-28
    3.2.5 HMM在应用中存在的问题  28-29
  3.3 人工神经网络(ANN)  29-35
    3.3.1 神经网络的基本概念  30-32
    3.3.2 BP网络模型  32-34
    3.3.3 神经网络在语音识别中的应用  34-35
  3.4 动态时间规整  35-39
    3.4.1 DTW算法的基本原理  36-37
    3.4.2 DTW算法与孤立词的识别  37-39
第四章 语音识别系统的仿真和改进  39-52
  4.1 系统组成  39
  4.2 语音信号预处理  39-42
    4.2.1 语音信号预加重  40-41
    4.2.2 加窗分帧  41-42
    4.2.3 端点检测  42
  4.3 特征参数提取  42-44
    4.3.1 线性预测倒谱系数  43
    4.3.2 美尔倒谱系数  43-44
  4.4 语音识别算法  44-46
  4.5 实验结果分析及算法改进研究  46-52
    4.5.1 实验结果  46-48
    4.5.2 DTW算法的研究和改进  48-52
第五章 基于ARM的语音识别系统  52-65
  5.1 语音识别的系统要求  52-53
  5.2 UP-NET ARM 2410-S  53-58
  5.3 嵌入式系统软件设计  58-59
  5.4 系统软件开发流程  59-63
  5.5 实验结果及分析  63-65
第六章 总结与展望  65-67
  6.1 主要工作  65
  6.2 前景展望  65-67
致谢  67-68
主要参考文献  68-71
附录 攻读硕士学位期间发表的论文  71-72

相似论文

  1. 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 汽车的电动助力转向系统,U463.4
  4. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  5. 基于DSP的机器人语音命令识别系统研制,TN912.34
  6. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  7. 面向软件的故障注入工具的研究与实现,TP311.52
  8. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  9. Q学习在基于内容图像检索技术中的应用,TP391.41
  10. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  11. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  12. 基于ARM9的Windows CE系统移植,TP316.7
  13. 空间交会接近视觉测量方法研究,TP391.41
  14. 图像实时采集、存储与处理方法研究,TP391.41
  15. 唇读中的特征提取、选择与融合,TP391.41
  16. 多币种纸币处理技术的研究与实现,TP391.41
  17. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  18. 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
  19. 基于图像的路面破损识别,TP391.41
  20. 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
  21. 移动机器人视觉检测和跟踪研究,TP242.62

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com