学位论文 > 优秀研究生学位论文题录展示

基于DSP的连接数码语音识别研究与设计

作　者: 赵鹏
导　师: 苏娟
学　校: 湖南大学
专　业: 电路与系统
关键词: 语音识别连接数码离散隐含马尔可夫模型线性预测编码倒谱差分线性预测编码倒谱共振峰
分类号: TN912.34
类　型: 硕士论文
年　份: 2006年
下　载: 210次
引　用: 0次
阅　读: 论文下载

内容摘要

为了克服传统汉语数码语音识别系统抗噪性差、识别率低的特点,本文阐述了一种基于TMS320VC5402定点数字信号处理器(DSP)的连接汉语数码语音识别系统的设计和实践,力争使系统具有实时性、较强抗噪性、较高识别率和非特定人连接数码语音识别的特点。针对传统的“改进谱相减法语音增强”参数设定单一、环境适应能力差的缺点,提出了一种利用模糊理论和“改进的谱相减法”结合的“模糊谱相减法语音增强”;针对语音信号端点检测困难的特点,通过MATLAB仿真试验,给出了能够准确确定数码语音端点的初始和改进参数表;提出了利用基于线性预测编码倒谱参数和差分线性预测编码倒谱参数相结合的离散隐含马尔可夫模型进行第一级识别、利用共振峰参数进行第二级识别的两级汉语数码语音识别系统,在保证系统实时性的同时,实现连接汉语数码语音识别系统识别率的提高;在硬件实现上,详细阐述了基于TMS320VC5402的连接汉语数码语音识别系统各部分硬件设计;在软件开发上,给出了连接汉语数码语音识别的软件设计各部分的流程图,并对各部分进行了MATLAB仿真,并给出了仿真结果。最后,分别建立了数码语音识别仿真系统和连接数码语音训练系统。利用连接数码语音训练系统得到了男女各一套向量量化码本和男女各一套11个数码的非特定人连接数码语音离散隐含马尔可夫参数;基于这些参数,连接数码语音识别仿真系统成功实现了对输入数码语音的识别,并且系统具有较好的抗噪性。

全文目录

学位论文原创性声明和学位论文版权使用授权书  4-5
摘要  5-6
Abstract  6-9
第1章绪论  9-14
  1.1 引言  9
  1.2 研究汉语数码语音识别的意义  9-10
  1.3 数码语音识别研究现状及发展趋势  10-11
  1.4 选题背景及方案选择  11-12
  1.5 本文的主要研究工作  12-14
第2章连接数码语音识别技术基础  14-37
  2.1 语音信号分析  14-15
  2.2 语音识别的基本流程  15
  2.3 数码语音信号预处理  15-18
  2.4 数码语音信号特征参数的提取  18-23
  2.5 离散隐含马尔科夫模型  23-25
  2.6 向量量化  25-28
  2.7 隐含马尔可夫模型的三个问题  28-34
  2.8 两个DHMM 相似度的比较  34
  2.9 数字串的分割  34-35
  2.10 识别单元  35-37
第3章连接数码语音识别系统硬件设计  37-49
  3.1 DSP 部分设计  37-40
  3.2 语音输入模块设计  40-41
  3.3 电源模块设计  41-42
  3.4 扩展存储模块设计  42-44
  3.5 异步收发模块设计  44-46
  3.6 显示模块设计  46-47
  3.7 JTAG 仿真接口设计  47-48
  3.8 DSP 系统硬件结构图  48-49
第4章连接数码语音识别软件设计与仿真  49-70
  4.1 DSP 主程序流程  49-51
  4.2 DSP 进行语音读取的子程序  51-52
  4.3 窗函数的选择及预加重仿真  52
  4.4 语音增强子程序及其仿真  52-56
  4.5 语音端点检测子程序及其仿真  56-57
  4.6 参数提取子程序及其仿真  57-60
  4.7 语音识别子程序及其仿真  60-61
  4.8 DSP 并行自举程序设计  61-64
  4.9 系统的实时性分析  64
  4.10 FLAH ROM 的在线擦除和编程  64-66
  4.11 VHDL 语言编程  66-67
  4.12 单片机程序设计  67-70
第5章连接数码语音训练系统的设计实现  70-76
  5.1 初始码本的设计  70-72
  5.2 最终码本的建立  72-73
  5.3 非特定人连接数码语音训练  73-76
结论  76-78
参考文献  78-81
附录A （攻读学位期间所发表的学术论文）  81-82
附录B （硬件电路总图）  82-83
附录C （部分MATLAB 仿真程序）  83-86
附录D （Viterbi 算法的C 语言程序）  86-88
附录E （部分VHDL 编程）  88-90
附录F （训练后的DHMM 参数）  90-96
致谢  96

相似论文

多重ANN/HMM混合模型在语音识别中的应用,TN912.34
基于DSP的机器人语音命令识别系统研制,TN912.34
在智能手机环境下健康管理功能设计与研究,TN929.53
呼叫中心IVR系统的设计与实现,TN99
基于HMM和PNN的混合语音识别模型研究,TN912.34
面向机器人对话的语音识别关键技术的研究,TN912.34
基于双自由度自适应轮系多功能代步车,U489
基于切分的汉语连续语音识别技术研究,TN912.34
基于支持向量机的民族语语种识别研究,TN912.34
基于音素的错误发音自动检测方法研究与应用,TN912.34
基于ARM9的语音控制智能终端的设计,TN912.3
孤立词语音识别算法的研究和实现,TN912.34
分布式语音识别以及voice xml语言在声动炫铃中的应用,TN912.34
初级水平缅甸学生汉语元音习得的声学研究,H195
基于语音识别的机器人控制技术的研究,TP242
基于模糊混沌神经网络的语音识别方法研究,TN912.34
基于ZigBee技术的智能家居监控系统的设计与实现,TN929.5;TP212.9
基于嵌入式的特定人语音识别智能轮椅设计,TP368.12
基于稳健性PLPC的抗噪语音识别方法的研究,TN912.34
基于快速沃尔什变换的藏语音识别技术,TN912.34
基于DSP的语音识别技术的研究,TN912.34