学位论文 > 优秀研究生学位论文题录展示

MFLP甚低速率语音编解码算法研究

作 者: 郭莉
导 师: 王炳锡
学 校: 中国人民解放军信息工程大学
专 业: 信号与信息处理
关键词: 矢量量化 参数内插 混合激励 甚低速率语音编码 多帧联合
分类号: TN912.3
类 型: 硕士论文
年 份: 2005年
下 载: 177次
引 用: 4次
阅 读: 论文下载
 

内容摘要


随着数字通信业务的发展,以及恶劣条件下的无线通信等领域对低速率语音编码的迫切要求,2.4kbps及其以下的高质量甚低速率语音编码算法成为目前研究的热点。 混合激励线性预测(MELP)声码器是现代低速率语音编码中最有潜力的算法之一,该算法对传统LPC二元激励进行了改进,可以更好地模拟自然语言特征,在低速率上合成出较高质量的语音。本文以该算法为基本模型,对基音周期、能量、LSF、清浊音和激励谱描述等几个语音编码参数进行了详细的分析和实验,给出了这些参数的帧间相关性、统计特性、及其对表征自然语音的作用。针对各参数的不同特性,文中深入讨论了甚低速率声码器中参数的选择、提取和量化方法,为甚低速率语音编码算法的构造和实现打下了坚实的基础。 在甚低速率语音编码中,由于没有足够的比特数描述语音信号的谱信息,往往很难得到高质量的合成语音,本文提出采用多帧联合、高效量化、参数内插和增大帧长等方法降低编码速率,保证合成语音的质量。在理论研究的基础上文中设计并实现了1.2kbpsMFLP和0.8kbpsMFLP两种甚低速率语音编码算法,给出了这两种声码器的工作原理,并对其在不同语言、不同信道下的合成语音质量进行了性能评测。 非正式主观听觉测试表明该1.2kbpsMFLP甚低速率声码器合成语音质量优于传统2.4kbpsLPC-10算法,与美国联邦标准2.4kbpsMELP算法相当;0.8kbpsMFLP声码器合成语音保证了较高的可懂度和清晰度,并具有一定的自然度。

全文目录


摘要  4-5
Abstract  5-6
第一章 概述  6-15
  1.1 语音编码的研究概况及发展方向  6-7
  1.2 低速率语音编码概述  7-10
    1.2.1 理论依据  7
    1.2.2 理论极限  7-8
    1.2.3 特征参数及各参数的听觉特性  8
    1.2.4 特征参数的表示和量化技术  8-9
    1.2.5 语音编码算法的性能评测  9-10
  1.3 现代低速率语音编码算法介绍  10-13
  1.4 论文研究的主要内容和章节安排  13-15
    1.4.1 论文研究的主要内容  13-14
    1.4.2 论文的章节安排  14-15
第二章 1.2kbpsMFLP声码器  15-44
  2.1 算法分析  15-17
    2.1.1 甚低速率语音编码的主要实现方法  15-16
    2.1.2 1.2kbpsMFLP算法原理  16-17
  2.2 特征参数的提取  17-23
    2.2.1 预处理  18
    2.2.2 基音周期的计算  18-21
    2.2.3 带通清浊判决的计算  21-22
    2.2.4 增益的计算  22-23
    2.2.5 线性预测分析  23
  2.3 特征参数的量化编码  23-28
    2.3.1 基音周期的量化  24
    2.3.2 带通清浊判决的量化  24-26
    2.3.3 增益的量化  26
    2.3.4 线性预测系数的量化  26-27
    2.3.5 发送比特流  27-28
  2.4 解码器原理  28-32
    2.4.1 比特流的解包和参数解码  28-29
    2.4.2 噪声衰减  29
    2.4.3 参数插值  29-30
    2.4.4 混合激励的生成  30-31
    2.4.5 自适应谱增强  31
    2.4.6 线性预测合成  31
    2.4.7 增益的校正  31-32
    2.4.8 脉冲散布滤波  32
    2.4.9 合成环路控制  32
  2.5 LSF参数的提取和量化  32-40
    2.5.1 LPC参数的提取  32-33
    2.5.2 LSF参数的定义  33-35
    2.5.3 LPC参数和 LSF参数的互换  35-37
    2.5.4 LSF的多级矢量量化 MSVQ  37-40
    2.5.5 超级帧中的LSF参数内插  40
  2.6 1.2kbpsMFLP算法的实现及结果分析  40-44
    2.6.1 算法模拟  40-41
    2.6.2 实验结果性能分析  41-44
第三章 0.8kbps MFLP声码器  44-50
  3.1 0.8kbps MFLP算法基本原理  44
  3.2 帧长的选择  44-45
  3.3 参数的提取和量化  45-46
    3.3.1 LSF参数的提取和量化  45-46
    3.3.2 其它参数的提取和量化  46
  3.4 0.8kbpsMFLP算法的实现及结果分析  46-50
    3.4.1 算法模拟  46-48
    3.4.2 实验结果性能分析  48-50
第四章 甚低速率语音编码性能测试  50-56
  4.1 合成语音质量测试  50-51
  4.2 算法延时测试  51-52
  4.3 多种语言通用性的测试  52-56
第五章 结论和进一步研究方向  56-59
  5.1 论文工作总结  56-57
  5.2 进一步研究方向  57-59
参考文献  59-62
致谢  62-63
附录  63

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
  3. 压缩感知算法及其在矢量量化中的应用,TN911.7
  4. Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
  5. 语音人工带宽扩展算法研究,TN912.3
  6. 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
  7. 甚低速率语音编码器算法研究,TN912.3
  8. 端到端保密通信中的类语音调制解调研究,TN918
  9. AMR-WB+编码算法关键技术及码流识别研究,TN912.3
  10. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  11. 基于MELP的低速率语音编码算法研究,TN912.3
  12. 基于文本无关的说话人识别研究,TN912.34
  13. 高速公路交通事件检测建模及应用研究,U491.116
  14. 多路并行实时说话人识别算法研究与实现,TN912.34
  15. 低速率语音编码参数高效量化算法研究,TN912.3
  16. 基于语音信号特征的语音零水印,TP309.7
  17. 噪声环境下的说话人识别研究,TN912.34
  18. 基于SOM的入侵检测算法的研究与改进,TP393.08
  19. 基于小波变换和矢量量化的图像压缩编码研究,TP391.41
  20. 基于视频的运动分析关键技术研究,TP391.41
  21. 基于数字对讲机的MELP声码器算法研究与实现,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com