学位论文 > 优秀研究生学位论文题录展示

基于HMM的嵌入式非特定人连续英语语音识别的研究与实现

作 者: 杨小翠
导 师: 孙丽华
学 校: 南昌大学
专 业: 通信与信息系统
关键词: 嵌入式 美尔倒谱系数(Mel-Frequency Ceptral Conefficients,MFCC) 隐马尔可夫模型(Hidden Markov Models,HMM) 英语语音识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 90次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音信号是人类交流传递信息的主要途径,让机器听懂人类的语言是人类的梦想。语音识别就是一门让机器通过读入语音信号并将其转换为文本或命令的技术。经过多年的发展,语音识别已经有了长足的发展,并显示出巨大的应用潜能。语音识别的模板匹配方法有:动态时间规整算法(DTW)、隐马尔可夫模型(HMM)和人工神经网络。DTW算法适合小词汇量的特定人孤立字词识别,在进行非特定人识别时的性能不太令人满意,且识别过程运算量较大:HMM则适合较大词汇量的非特定人连续语音识别;而人工神经网络则太过复杂。由于本文是中等词汇量的连续语音识别,所以采用HMM模板匹配方法。嵌入式语音识别的应用受到日益广泛的关注,它的应用形式和应用领域不断的扩展。嵌入式技术的蓬勃发展为嵌入式语音识别应用带来了广大的市场需求,所以基于嵌入式的语音识别研究更有价值。本文对语音识别系统的相关理论进行了介绍,主要有语音预处理、端点检测、特征参数提取、模板匹配等。具体研究了MFCC特征参数提取的相关理论,短时能量和过零率相结合的端点检测方法,以及适合于嵌入式中等词汇量的语音识别系统的模板匹配方法HMM模型等。本文先将一些常用的英语句子在matlab上进行仿真,然后在ARM上进行仿真。

全文目录


摘要  3-4
Abstract  4-7
第1章 引文  7-12
  1.1 课题研究背景及意义  7
  1.2 语音识别的国内外发展状况及发展趋势  7-9
  1.3 嵌入式系统的现状和发展趋势  9-10
  1.4 语音识别技术存在的研究难点  10-11
  1.5 课题研究内容及组织结构  11-12
第2章 语音识别基本原理  12-24
  2.1 语音信号的预处理  12-13
  2.2 语音信号的端点检测  13-15
  2.3 语音信号的特征分析  15-18
    2.3.1 线性预测及线性预测倒谱系数  15-17
    2.3.2 Mel倒谱系数(Mel—Frequency Cepstral Coefficient)  17-18
  2.4 语音识别的模板训练方法  18-20
  2.5 语音识别的模板匹配  20-24
第3章 基于HMM的语音识别  24-42
  3.1 HMM模型  24-30
    3.1.1 HMM基本概念  24-25
    3.1.2 HMM的类型  25
    3.1.3 HMM的三个基本问题  25-30
  3.2 基于HMM的语音识别原理  30-33
  3.3 HMM实现的一些实际问题  33-42
    3.3.1 初始模型参数的设定  33-35
    3.3.2 HMM训练方法的改进  35-39
    3.3.3 下溢问题  39-42
第4章 英语语音识别系统  42-49
  4.1 实验原理  42
  4.2 语音信号的采集  42-43
  4.3 语音信号的预处理  43-44
  4.4 语音信号的端点检测  44-45
  4.5 语音信号的特征提取  45-47
  4.6 语音模型库的建立  47
  4.7 语音识别  47-49
第5章 系统的实现及仿真调试  49-55
  5.1 语音识别的系统要求  49
  5.2 S3C2410简介  49-51
  5.3 Linux系统在ARM平台的移植  51-54
  5.4 使用JTAG对系统进行仿真调试  54-55
第6章 总结与展望  55-56
  6.1 总结  55
  6.2 展望  55-56
致谢  56-57
参考文献  57-60
攻读学位期间的研究成果  60

相似论文

  1. 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
  2. 汽车的电动助力转向系统,U463.4
  3. 基于ARM9的Windows CE系统移植,TP316.7
  4. 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
  5. 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
  6. 多线阵CCD视觉测量系统的数据采集与处理,TP274.2
  7. LXI-VXI适配器研制,TP274
  8. 高性能恒温晶体振荡器温度控制系统的研究,TN752
  9. 扩招后全日制硕士研究生思想政治教育问题研究,G643.1
  10. 基于TCP/IP协议的嵌入式图像传输系统接收终端的设计,TP368.1
  11. 嵌入式中医经脉理疗仪的研究,R197.39
  12. 数字电视中间件中图形界面引擎的研究与应用,TP391.41
  13. 基于windows xp嵌入式系统的心电检测分析仪,R197.39
  14. 基于嵌入式系统钻孔成像装置的研究,P634.3
  15. 交叉杆型并联机床运动学及Kane动力学研究,TH113
  16. 基于嵌入式Web技术的动态应变仪研究与实现,TP368.1
  17. 基于ARM&Linux的嵌入式安防控制系统的研究,TP277
  18. 一体化能量回馈电梯驱动控制系统实现,TP273
  19. 基于嵌入式系统的水厂加氯智能控制系统,TU991.2
  20. 智能控制的电力核相技术研究,TP368.1
  21. 基于μC/OS-Ⅱ的红外辐射测温系统研究,TN215

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com