学位论文 > 优秀研究生学位论文题录展示

嵌入式变速率语音编码中线性预测系数的矢量量化研究

作 者: 李海婷
导 师: 鲍长春
学 校: 北京工业大学
专 业: 电路与系统
关键词: 嵌入式语音编码 线性预测 导抗谱频率参数 矢量量化
分类号: TN912.3
类 型: 硕士论文
年 份: 2007年
下 载: 123次
引 用: 1次
阅 读: 论文下载
 

内容摘要


网络技术的迅猛发展使得以分组交换为基础的IP电话技术得到了越来越广泛的应用。如何减小分组丢失对接收端合成语音质量的影响,已经成为语音编码领域亟待解决的问题。在此背景下,嵌入式变速率语音编码方法应运而生。国际电信联盟(ITU-T)于2005年提出了制定最新国际语音编码标准G.VBR的计划,使嵌入式变速率语音编码成为近两年来语音编码领域的研究热点。嵌入式变速率语音编码多采用码激励线性预测语音编码技术,这使得线性预测系数的量化成为至关重要的环节,量化的效果将会直接影响到整个编码器的性能。为此,本文就线性预测系数的矢量量化技术展开了深入研究。线性预测系数在量化之前,通常要转换成为线谱频率参数或导抗谱频率参数。在线谱频率参数矢量量化方面,本文提出了一种改进的基于哈德码变换的码书快速搜索算法,使矢量量化中码书搜索的速度相对于全搜索算法有了很大的提高。在导抗谱频率参数矢量量化方面,本文针对现有量化算法在处理语音分组丢失时效果不佳的问题,结合嵌入式变速率语音编码算法的特点,提出了三种应用于宽带导抗谱频率参数的量化方案。首先提出了一种改进的应用于宽带导抗谱频率参数量化的转换分类分裂矢量量化方案。该方案采用无记忆的量化方式,在编码比特数为42bits/frame时达到了透明量化的性能,但其唯一的缺点就是所需的码书存储量较大。针对此问题,本文又提出了一种转换分类乘积码锥形矢量量化方案。该方案在量化精度与复杂度之间进行了折衷,具有低复杂度、低存储的特点,在编码比特数为46bits/frame时达到了透明量化的性能。但是,考虑到应用于嵌入式变速率语音编码器中的导抗谱频率参数量化方案要在有丢失帧与无丢失帧时都具有尽可能好的量化效果,本文最后提出了一种各维非等系数帧间预测分裂矢量量化方案。该方案在无丢失帧的情况下用46bits/frame进行量化即可达到透明量化的性能,且在有丢失帧的情况下错误的延续性较小,实现了平衡有丢失帧与无丢失帧时量化性能的目的。最后,将本文提出的46bits/frame各维非等系数帧间预测分裂矢量量化方案应用到一种8~32kb/s嵌入式变速率语音编码器中。此编码器由本人所在的北京工业大学语音与音频信号处理实验室开发,并作为G.VBR候选编码器之一,由华为公司提交给ITU-T。实验结果表明,在纯净语音情况下该编码器基本达到了ITU-T对G.VBR候选编码器各层合成语音质量的要求。

全文目录


摘要  5-7
ABSTRACT  7-11
第1章 绪论  11-17
  1.1 课题背景  11-14
  1.2 研究目标  14
  1.3 主要研究内容  14-15
  1.4 本文的组织安排  15-17
第2章 线性预测分析  17-37
  2.1 线性预测分析的基本原理  17-20
  2.2 线性预测系数的解法  20-22
  2.3 线谱频率分析  22-28
    2.3.1 线谱频率参数的定义及性质  23-25
    2.3.2 LSF参数与LP系数间的相互转换  25-28
  2.4 导抗谱频率分析  28-34
    2.4.1 导抗谱频率参数的定义及性质  28-31
    2.4.2 ISF参数与LP系数间的相互转换  31-34
  2.5 ISF参数与LSF参数的比较  34-35
  2.6 本章小结  35-37
第3章 LSF参数矢量量化中的码书快速搜索算法  37-43
  3.1 背景概述  37-38
  3.2 改进的基于哈德码变换的码书快速搜索算法  38-41
  3.3 实验结果及分析  41-42
  3.4 本章小结  42-43
第4章 ISF参数的矢量量化算法  43-65
  4.1 ISF参数的转换分类分裂矢量量化  43-49
    4.1.1 转换分类分裂矢量量化原理  43-45
    4.1.2 一种426its/frame的转换分类分裂矢量量化器  45-46
    4.1.3 量化器设计及性能分析  46-49
  4.2 ISF参数的转换分类乘积码锥形矢量量化  49-56
    4.2.1 转换分类乘积码锥形矢量量化原理  50-52
    4.2.2 一种466its/frame的转换分类乘积码锥形矢量量化器  52-53
    4.2.3 量化器设计及性能分析  53-56
  4.3 ISF参数的各维非等系数帧间预测分裂矢量量化  56-64
    4.3.1 各维非等系数帧间预测分裂矢量量化原理  57-62
    4.3.2 一种466its/frame的各维非等系数帧间预测分裂矢量量化器  62-63
    4.3.3 量化器设计及性能分析  63-64
  4.4 本章小结  64-65
第5章 嵌入式变速率语音编码中的线性预测分析与量化  65-79
  5.1 嵌入式变速率语音编码概述  65-66
  5.2 一种8~32kb/s嵌入式变速率语音编码器  66-73
    5.2.1 编码端结构  67-69
    5.2.2 解码端结构  69-70
    5.2.3 编解码模式  70-71
    5.2.4 码流的嵌入式结构及比特分配  71-72
    5.2.5 算法延时  72-73
    5.2.6 算法复杂度  73
  5.3 嵌入式变速率语音编码器中的线性预测分析与量化  73-77
  5.4 测试结果  77-78
  5.5 本章小结  78-79
结论  79-81
参考文献  81-86
攻读硕士学位期间发表和递交的论文及专利  86-87
攻读硕士学位期间参加的科研项目与获奖情况  87-88
致谢  88

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 网络语音传输丢包的恢复技术,TN912.3
  3. 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
  4. 压缩感知算法及其在矢量量化中的应用,TN911.7
  5. Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
  6. 语音人工带宽扩展算法研究,TN912.3
  7. 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
  8. 甚低速率语音编码器算法研究,TN912.3
  9. 端到端保密通信中的类语音调制解调研究,TN918
  10. AMR-WB+编码算法关键技术及码流识别研究,TN912.3
  11. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  12. 基于MELP的低速率语音编码算法研究,TN912.3
  13. 基于文本无关的说话人识别研究,TN912.34
  14. 高速公路交通事件检测建模及应用研究,U491.116
  15. 多路并行实时说话人识别算法研究与实现,TN912.34
  16. 自适应低速率语音编解码研究与实现,TN912.3
  17. 低速率语音编码参数高效量化算法研究,TN912.3
  18. 基于语音信号特征的语音零水印,TP309.7
  19. 噪声环境下的说话人识别研究,TN912.34
  20. 基于SOM的入侵检测算法的研究与改进,TP393.08
  21. 基于小波变换和矢量量化的图像压缩编码研究,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com