学位论文 > 优秀研究生学位论文题录展示

分布式语音识别以及voice xml语言在声动炫铃中的应用

作 者: 练克刚
导 师: 张筱华;于翠波
学 校: 北京邮电大学
专 业: 电子与通信工程
关键词: 分布式语音识别 前端处理 语音重构 语音扩展标识语言
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 28次
引 用: 0次
阅 读: 论文下载
 

内容摘要


分布式语音识别(DSR)是近年来出现的新技术,具有广阔的应用前景。研究了分布式语音识别系统(DSR)的架构,实现并测试了客户端/服务器架构的分布式语音识别系统。系统采用多服务器、多客户端的系统架构,采用负载平衡的方式分配识别资源,能够达到稳定高效的性能。结合ETSI关于DSR的最新标准,介绍了声动炫铃DSR系统的组成,分析了DSR的主要技术,如前端特征提取算法、特征压缩与纠检错、服务器端的语音重构算法等.最后对DSR技术的应用做了简单展望。声动炫铃炫铃系统根据声动炫铃系统原型的IVR架构设计,应用语音合成、语音识别等语音关键技术,包括使用voice xml标准语言为工具开发出一个可实用的系统:用户可以随时随地通过拨打一个特服号进入到系统,通过按键或者语音说出歌曲或歌手名称的方式与系统进行交互,就可以随意搜索定制自己的炫铃,专门的用户语言界面,操作简单方便;对于电话流程部分,主要利用VXML来完成流程开发。

全文目录


摘要  4-5
Abstract  5-9
第一章 前言  9-12
  1.1. 论文背景  9-10
  1.2. 论文内容  10-12
第二章 论文背景知识介绍  12-19
  2.1. 语音识别技术介绍  12-14
  2.2. VoiceXML介绍  14-16
  2.3. 炫铃业务  16-19
第三章 声动炫铃系统中的语音识别技术  19-31
  3.1. 分布式语音识别系统介绍  19-25
    3.1.1. 语音识别的原理  19-20
    3.1.2. 基于语法的识别引擎  20
    3.1.3. 常见的语音识别系统结构  20-22
    3.1.4. 分布式语音识别系统架构和工作原理  22-25
  3.2. 声动炫铃系统中分布式语音识别的实现  25-31
    3.2.1 引擎的三种调用方式  25-27
    3.2.1 语法  27-29
    3.2.2 系统的稳定性和健壮性  29-31
第四章 声动炫铃系统中的Voice XML技术  31-38
  4.1. VoiceXML用户交互界面  31-32
  4.2. 基于VoiceXML的交互式语音应答  32-38
    4.2.1. VoiceXML的体系结构  32-35
    4.2.2 在IVR系统中运用VoiceXML技术  35-38
第五章 基于分布式语音识别和Voice XML的声动炫铃系统的具体实现  38-56
  5.1. 声动炫铃系统网络结构  38-39
  5.2. 声动炫铃系统静态结构  39-40
  5.3. 声动炫铃系统平台静态结构  40-42
  5.4. Web Service、IVR和ASR接口集成  42-47
  5.5. Voice XML流程实现  47-49
  5.6. 声动炫铃业务的实现  49-56
    5.6.1. 炫铃业务的总体功能  49-50
    5.6.2. 主菜单  50-52
    5.6.3. 下载铃音  52-53
    5.6.4. 设置铃音  53
    5.6.5. 赠送铃音  53-54
    5.6.6. 炫铃管理  54-56
第六章 声动炫铃系统测试  56-66
  6.1. 测试方法  56-59
    6.1.1. 白盒测试  56-57
    6.1.2. 黑盒测试  57-59
  6.2. 集成测试  59-60
  6.3. 语音识别测试  60-65
    6.3.1. 响应时间测试  60-61
    6.3.2. 识别时间测试  61-62
    6.3.3. 识别率测试  62-65
  6.4. 性能测试  65-66
第七章 声动炫铃系统的应用案例  66-70
  7.1. 声动炫铃业务的发展情况  66
  7.2. 声动炫铃系统部署方案  66-67
  7.3. 声动炫铃系统应用评测  67-70
第八章 总结和展望  70-73
  8.1. 论文总结  70
  8.2. 系统展望  70-73
参考文献  73-76
致谢  76

相似论文

  1. 分布式语音识别技术在移动电话中的应用研究,TN929.53
  2. 基于骨导信号的语音重构技术,TB535
  3. 分布式语音识别以及voice xml语言在声动炫铃中的应用,TN912.34
  4. 基于定点DSP的语音控制系统研究与设计,TN912.34
  5. X射线探测与前端处理模块测试系统开发研究,TP274.51
  6. 基于FPGA的超声诊断仪前端及显示模式的设计,TP274.53
  7. 数码相机显示驱动电路的研究与设计,TB852.1
  8. 便携式生理信号采集系统的设计与实现,TH772
  9. 噪声环境下说话人识别技术研究,TN912.34
  10. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  11. 基于DSP的机器人语音命令识别系统研制,TN912.34
  12. 基于多重分形的语音情感识别研究,TN912.34
  13. 基于MIDI的乐器控制系统和音符的自动识别方法研究,TN912.34
  14. 基于ARM的自动笛语识别系统研究与实现,TN912.34
  15. 基于EMD的说话人识别研究,TN912.34
  16. 面向连续语音识别的半监督学习方法的研究,TN912.34
  17. 基于云计算的语音输入方案研究,TN912.34
  18. 3-5岁听障儿童连续语音重复能力的特征及干预研究,TN912.34
  19. 多信道条件下的说话人认证,TN912.34
  20. 嵌入式孤立字语音识别研究,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com