学位论文 > 优秀研究生学位论文题录展示

基于非特定人语音识别的全音控盲人手机设计

作 者: 王璟珣
导 师: 滕召胜
学 校: 湖南大学
专 业: 控制科学与工程
关键词: 语音识别 隐马尔可夫模型 盲人手机 指令分级识别 拒识别 语音播报
分类号: TN929.53
类 型: 硕士论文
年 份: 2009年
下 载: 66次
引 用: 1次
阅 读: 论文下载
 

内容摘要


近年来,语音识别技术的发展为人们提供了一种先进的人机交互方式――语音交互方式。这种方式因其便捷、自然的特点,受到广泛的关注,并且已经开始应用于一些特定的场合与设备中,受到人们的广泛欢迎。而对于盲人来说,由于其视觉缺陷的阻碍,很多时候并不能享受到科技发展带来的好处;而语音交互的方式则可以有效的解决这一问题,使科技进步能更好的服务于这一残疾人群体。经过几十年的努力,语音识别的研究工作已经有了长足的发展,基于不同理论的语音识别方法目前已有许多种。然而多数的研究工作都是在大型机或PC机上进行的,关注的主要是新理论的发现与验证、如何继续提升识别算法的准确度等问题;而基于嵌入式系统的语音识别技术,作为语音识别实用化的重要步骤,目前还没能实现大规模的应用。现有的嵌入式终端设备上的语音识别,也主要是简单的、针对特定人使用的孤立词识别。因此,如何将复杂的语音识别算法在嵌入式系统上实现实用化,使语音交互技术变得成熟起来,是一项有挑战性的工作。因此,本文以如何让语音交互方式为盲人服务作为出发点,对语音识别的原理与思想进行了深入研究,详细探讨了基于隐马尔可夫模型的非特定人孤立词语音训练与识别算法,深入分析了基于Baum-Welch算法的模型训练方法和基于Viterbi解码的识别算法。根据实际应用的需要,研究了实际模型训练中多观察值序列情况下的初始参数设置、训练方法以及需要解决的数据溢出等问题;并以此为依据,提出并设计了一种基于连续隐马尔可夫模型的全音控盲人手机系统。系统采用Baum-Welch模型训练算法,由PC机训练出25条音控指令和0~9等10个数字的语音模型,然后将这些模型传递给DSP平台,从而实现嵌入式的非特定人孤立词语音识别。25条音控指令分别对应不同的控制操作,在识别完成后,系统根据识别结果作出相应处理;当需要进行无线通信时,系统会依据识别结果发送特定的AT命令组合,从而实现相应操作。依据手机菜单操作特点,本文提出了语音指令分级识别方法,充分提高了指令识别准确率;并针对实际应用进行了拒识别设计。针对盲人生理特点,系统设计了语音提示与短信播报等辅助语音功能,将3817个汉字、字母、数字的语音数据存入NandFlash,当需要语音播报时将播报内容的语音数据由DAC输出。最后在不同环境和条件下对系统进行了测试,并提出了改进的方向。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-15
  1.1 语音识别的研究背景与现状  10-11
  1.2 语音识别在嵌入式中的应用  11-13
  1.3 本文的研究内容与创新  13
  1.4 本文的结构安排  13-15
第2章 语音识别原理  15-22
  2.1 语音信号的特性分析  15
  2.2 语音识别系统的分类  15-17
  2.3 语音识别基本原理  17-20
    2.3.1 语音信号预处理  17-18
    2.3.2 特征参数提取  18-19
    2.3.3 匹配识别  19-20
  2.4 嵌入式语音识别系统的基本构成  20-22
第3章 基于隐马尔可夫模型的非特定人语音识别  22-34
  3.1 HMM 基本原理  22-29
    3.1.1 HMM 的定义  22-24
    3.1.2 HMM 的三个基本问题  24-27
    3.1.3 HMM 的分类  27-29
  3.2 CHMM 的训练  29-32
    3.2.1 参数初值的选取  29-30
    3.2.2 多观察值序列的Baum-Welch 训练  30
    3.2.3 训练算法实现的若干问题  30-32
  3.3 基于HMM 的嵌入式非特定人孤立词语音识别  32-34
第4章 基于CHMM 的全音控盲人手机设计  34-57
  4.1 系统构成与工作原理  34-44
    4.1.1 硬件平台设计  35-38
    4.1.2 软件系统设计  38-43
    4.1.3 功能与指标  43-44
  4.2 PC 机语音模型训练  44-49
    4.2.1 基于MATLAB7.0 的 CHMM 训练  44-47
    4.2.2 关键数据的传递  47-49
  4.3 语音识别在Blackfin533 上的实现  49-55
    4.3.1 语音信号的采集与预处理  49-51
    4.3.2 特征参数分析  51-52
    4.3.3 基于Viterbi 算法的语音识别  52-55
  4.4 AT 命令与无线通信  55-57
第5章 盲人手机音控系统应用设计与实验测试  57-70
  5.1 多级指令语音识别  57-60
    5.1.1 指令分级依据  57-58
    5.1.2 指令分级识别的实现  58-60
  5.2 拒识别设计  60-63
    5.2.1 拒识别算法  61-62
    5.2.2 拒识别的实现  62-63
  5.3 辅助语音操作方法  63-67
    5.3.1 数字录音  64-66
    5.3.2 语音播报  66-67
  5.4 盲人手机音控系统实验测试与分析  67-70
结论  70-72
参考文献  72-76
致谢  76-77
附录A 攻读硕士学位期间的学术成果  77-79
附录B 多元混合高斯概率密度计算程序  79-81
附录C Viterbi 识别程序  81-84
附录D Baum-Welch 模型训练程序  84-86
附录E 设计实物图  86

相似论文

  1. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  2. 网络语音传输丢包的恢复技术,TN912.3
  3. 领域实体属性及事件抽取技术研究,TP391.1
  4. 在智能手机环境下健康管理功能设计与研究,TN929.53
  5. 基于视觉的人体行为检测识别研究,TP391.41
  6. 隐马尔可夫模型在视频场景分析中的应用研究,TP391.41
  7. 语音识别在访问控制的应用,TN912.34
  8. 基于规则的Web文本信息抽取技术的研究,TP391.1
  9. 基于隐马尔科夫模型的操作员功能状态分类,TP273
  10. 基于HMM的社交网络连接关系研究,F49
  11. 基于特征加权连续隐马尔可夫模型的故障诊断方法研究,TH165.3
  12. 关于树上马尔可夫链场的若干强大数定律,O211.4
  13. 基于运动目标轨迹识别的人机交互系统研究,TP391.41
  14. 多线索融合的足球视频语义分析及事件检测,TP391.41
  15. 汉语语音合成系统的改进与实现,TN912.33
  16. 智能视频监控系统中人体异常行为检测与识别研究,TP391.41
  17. 基于半监督学习的时间序列分类研究与实现,TP181
  18. 基于隐马尔科夫模型的天津方言语音合成,TN912.33
  19. 基于隐马尔科夫模型的信号分类,O211.62
  20. 基于隐马尔可夫模型的时间序列聚类的研究,TP311.13
  21. 心音信号特征分析与识别算法的研究,R318.04

中图分类: > 工业技术 > 无线电电子学、电信技术 > 无线通信 > 移动通信 > 蜂窝式移动通信系统(大哥大、移动电话手机)
© 2012 www.xueweilunwen.com