学位论文 > 优秀研究生学位论文题录展示

Instlink语音引擎的研究与实现

作 者: 王猛
导 师: 吴宇红
学 校: 西安电子科技大学
专 业: 通信与信息系统
关键词: 语音编码 CELP Speex 语音预处理 编码逻辑 引擎设计实现
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目前VoIP越来越多的应用于全球IP互联的Internet环境中,并随着下一代网络体系的发展、全IP网络的逐渐应用获得更大的发展。而对于一个VoIP意义上的多方通信系统,语音业务作为其最传统的业务,也是最常用的业务,它的性能优劣是通信系统不可忽视的质量指标。低编码位率、鲁棒性好、适合无线环境的语音编码算法的重要性越来越明显。而且大多数的语音算法都有专利限制或者速率单一等问题,成为企业通信系统发展的制约因素。Speex是基于CELP的开源算法,集成窄带、宽带、超宽带的可变速率,能根据网络状况自适应的选择不同的语音编码速率,减少误帧和丢帧对话音的影响、以期获得尽量好的话音质量,但缺乏系统的语音引擎解决方案。本文首先介绍了关于语音编解码的基础知识,在对CELP关键算法原理分析的基础上,透彻研究了Speex语音编解码算法原理、算法所实现的特点、不同的编码模式及其体系的架构与其性能特点,对语音预处理的技术、Speex编码适应性、数据采集和原始编解码器的逻辑细节进行了系统的分析。在此基础上,结合Instlink多方通信系统,提出基于Speex编解码技术的语音引擎方案,实现其编码模块、解码模块、控制系统、混音模块,并在Instlink系统上运行。实现单端语音和会议语音功能。

全文目录


摘要  3-4
Abstract  4-7
第一章 绪论  7-11
  1.1 研究的背景和意义  7
  1.2 发展和研究现状  7-8
  1.3 论文的主要工作  8-9
  1.4 论文的内容安排  9-11
第二章 语音编码技术基础  11-17
  2.1 语音编解码基础  11-17
    2.1.1 语音压缩编码的意义及作用  12
    2.1.2 低速率语音编码技术的发展现状  12-13
    2.1.3 语音编码的分类  13-14
    2.1.4 语音编码器的性能衡量标准  14-17
第三章 Speex 编码原理  17-31
  3.1 语音编码模式选择  20-21
    3.1.1 窄带  20
    3.1.2 宽带  20-21
    3.1.3 超宽带  21
  3.2 算法细节  21-25
    3.2.1 窄带子模式  21-25
    3.2.2 宽带子模式  25
  3.3 基本子模式解析  25-27
  3.4 位分配  27-28
  3.5 编码特性  28-31
第四章 语音处理技术  31-41
  4.1 编码预处理  31-36
    4.1.1 混响消除  31-32
    4.1.2 回声消除  32-35
    4.1.3 噪声消除  35
    4.1.4 自动增益控制  35-36
  4.2 适应不同应用环境下的处理  36-37
    4.2.1 抖动缓冲  36
    4.2.2 重采样  36-37
  4.3 数据采集和发送  37-41
    4.3.1 声卡数据采集,播放  37-38
    4.3.2 Speex 流媒体容器OGG  38-41
第五章 Speex 编解码逻辑分析  41-49
  5.1 编码过程  41-42
    5.1.1 编码流程  41-42
    5.1.2 编码过程中的数据  42
  5.2 解码过程  42-44
    5.2.1 解码器流程  42-44
    5.2.2 解码过程的数据  44
  5.3 编解码整体数据及编解码参数  44-46
    5.3.1 整体数据流程  44-45
    5.3.2 编码参数及中间生成数据  45-46
  5.4 函数调用关系  46-49
第六章 基于Instlink 系统的语音引擎的实现  49-63
  6.1 语音引擎的层次设计  49
  6.2 Speex 编码多样性的整合  49-50
  6.3 数据设计  50-53
    6.3.1 数据信息  50-52
    6.3.2 数据间关系  52-53
  6.4 组件设计  53-55
    6.4.1 组件介绍  53-55
    6.4.2 组件间关系  55
  6.5 语音处理流程  55-57
    6.5.1 编码流程  55-56
    6.5.2 解码流程  56-57
  6.6 控制逻辑  57-58
    6.6.1 单端控制逻辑  57
    6.6.2 会议控制逻辑  57-58
  6.7 混音  58-60
  6.8 应用Speex 作VOIP 时要注意的地方  60-63
第七章 总结与展望  63-65
致谢  65-67
参考文献  67-69
作者在读研期间的成果  69-70

相似论文

  1. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  2. iLBC语音编码技术的研究及DSP的设计与优化,TN912.3
  3. 甚低速率语音编码器算法研究,TN912.3
  4. 基于MELP的低速率语音编码算法研究,TN912.3
  5. MELPe语音编码关键技术研究,TN912.3
  6. 基于GSM的CSD信道加密语音实时通信技术研究,TN912.3
  7. G.729语音编解码算法的研究及其DSP实现,TN919.81
  8. 基于ML2724扩频通信系统的研究与应用,TN914.42
  9. 基于STM32无线语音传输系统的通信协议,TN912.32
  10. 自适应低速率语音编解码研究与实现,TN912.3
  11. 低速率语音编码参数高效量化算法研究,TN912.3
  12. 基于Speex技术的无线语音编/解码和传输系统设计,TN912.32
  13. 地震现场信息采集无线传输系统,TP274.2
  14. G.726语音编码的分析研究及在嵌入式AdHoc网络上的实现,TN929.5
  15. 基于DSP的语音编解码系统研究,TN912.3
  16. 基于数字对讲机的MELP声码器算法研究与实现,TN912.3
  17. 水下小型语音通信平台硬件设计及调试,TN912.3
  18. 基于AMR标准的语音编码VLSI设计,TN912.3
  19. 基于瞬时幅度加噪声模型的语音压缩,TN912.3
  20. AMR语音编码器,TN912.3
  21. 数字无中心系统中语音编码技术的开发与应用,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com