学位论文 > 优秀研究生学位论文题录展示

低速率语音编码算法研究

作 者: 计哲
导 师: 唐昆
学 校: 清华大学
专 业: 信息与通信工程
关键词: 语音编码 超低速率 特征参数量化 参数解码端恢复
分类号: TN912.3
类 型: 博士论文
年 份: 2011年
下 载: 195次
引 用: 0次
阅 读: 论文下载
 

内容摘要


低速率语音编码算法在现代通信系统中有着非常广泛的应用,超低速率下的语音压缩编码算法是目前语音信号处理领域的重要研究课题之一。正弦激励线性预测(Sinusoidal excitation linear prediction, SELP)编码算法采用基于线性预测的正弦混合激励技术,在2.4kbps及更低速率的语音压缩编码算法中具有非常优越的性能。论文的研究目的是在SELP模型的基础上,对语音编码算法中的关键技术进行分析和研究,设计实现150bps的超低速率语音压缩编码算法。论文首先提出了高效的特征参数量化算法。在线谱频率参数(Line spectralfrequency, LSF)的标量量化中,提出了基于动态规划的全局最优LSF差值量化算法,并采用多码本进一步提高参数的量化性能,该算法能够在每帧28bits达到LSF参数的透明量化。在对基音周期参数进行矢量量化时,利用人耳的听觉特性,提出了基于感觉加权的失真度量准则,提高了参数的量化性能,并设计了一种码字搜索的整型优化算法,降低了基音周期最优码字的误搜索概率。针对超低速率语音编码算法中,特征参数量化比特不足的问题,提出了利用参数间相关性的特征参数解码端恢复算法。首先提出基于隐马尔可夫模型(HiddenMarkov model, HMM)的能量参数恢复算法,根据LSF参数和子带清浊音(Unvoiced/Voiced, U/V)参数估计能量参数的变化轨迹。随后提出基于高斯混合模型(Gaussian Mixed Model, GMM)的U/V参数恢复算法,利用LSF参数和归一化能量参数,对U/V参数的概率分布特性进行估计,从而节省了参数量化所需的比特数。随后,从解码端角度考虑,提出了特征参数插值方式的改进算法,以提高清浊音过渡时声码器的合成语音自然度。为了提高声码器的抗连续丢包处理能力,提出基于分模式线性预测的丢包隐藏算法,改善了连续丢包情况下的合成语音质量。最后,综合上述研究成果,设计并实现了150bps SELP语音编码算法,合成语音的客观平均意见分(Mean Opinion Score, MOS)为2.424,判断韵字测试(Diagnostic rhyme test, DRT)的准确率达到82.9%,码本存储量为120Kword,算法延时为325ms,总体性能指标超出国家十一五专项项目的要求。

全文目录


摘要  4-5
Abstract  5-10
主要符号对照表  10-12
第1章 绪论  12-24
  1.1 引言  12-13
  1.2 语音编码技术概述  13-15
    1.2.1 语音的发声模型  13
    1.2.2 语音的主要编码方式  13-14
    1.2.3 语音压缩的理论依据  14-15
  1.3 超低速率的语音编码技术  15-18
    1.3.1 多帧联合矢量量化算法  15-16
    1.3.2 重要帧抽取算法  16-17
    1.3.3 基于语音识别的编码算法  17-18
  1.4 语音压缩的理论极限和开发潜力  18-20
    1.4.1 语音编码速率的理论极限  18-19
    1.4.2 进一步开发的潜力  19-20
  1.5 声码器性能的评价指标  20-22
    1.5.1 平均意见分测试  20-21
    1.5.2 判断韵字测试  21
    1.5.3 算法的复杂度和编解码延时  21-22
  1.6 论文的工作背景、目标和本文安排  22-24
第2章 SELP 声码器的关键技术  24-33
  2.1 SELP 模型的基本原理  24
  2.2 参数分析算法  24-27
    2.2.1 预处理  24
    2.2.2 线性预测分析  24-25
    2.2.3 基音周期分析与平滑  25-26
    2.2.4 子带清浊音分析  26
    2.2.5 余量谱幅度分析  26-27
    2.2.6 能量参数提取  27
  2.3 语音合成算法  27-28
  2.4 参数量化算法  28-32
    2.4.1 LSF 参数量化  28-30
    2.4.2 预测矢量量化  30-31
    2.4.3 基于模式的矢量量化  31
    2.4.4 帧间加权矢量量化  31-32
  2.5 本章小结  32-33
第3章 高效的参数量化算法  33-51
  3.1 有记忆的全局最优 LSF 差值量化算法  33-41
    3.1.1 LSF 参数的特性  33-34
    3.1.2 LSF 差值标量量化算法  34-37
    3.1.3 有记忆的全局最优 LSF 差值量化算法  37-39
    3.1.4 算法性能测试  39-41
  3.2 基音周期失真度量的改进算法  41-47
    3.2.1 基音周期参数的特性  41
    3.2.2 基音周期失真度量改进  41-45
    3.2.3 算法性能测试  45-47
  3.3 基音周期码字搜索优化算法  47-50
    3.3.1 基音周期的码字整型优化算法  47-49
    3.3.2 算法性能测试  49-50
  3.4 本章小结  50-51
第4章 参数相关性研究及其恢复算法  51-68
  4.1 特征参数的相关性分析  52-53
  4.2 能量参数解码端恢复算法  53-59
    4.2.1 能量参数的特性  53-54
    4.2.2 HMM 模型介绍  54-55
    4.2.3 基于 HMM 模型的能量参数恢复算法  55-57
    4.2.4 算法性能测试  57-59
  4.3 U/V 参数解码端恢复算法  59-67
    4.3.1 U/V 参数的特性  60
    4.3.2 基于 GMM 模型的 U/V 参数恢复算法  60-62
    4.3.3 改进的 U/V 参数解码端恢复算法  62-64
    4.3.4 算法性能测试  64-67
  4.4 本章小结  67-68
第5章 解码端语音质量提高算法  68-78
  5.1 特征参数插值方式的改进算法  68-72
    5.1.1 参数插值的原理和方法  68-69
    5.1.2 参数插值方式改进  69-71
    5.1.3 算法性能测试  71-72
  5.2 声码器抗连续丢包处理算法  72-77
    5.2.1 抗丢包处理算法的背景和原理  72-73
    5.2.2 分模式线性预测的算法原理  73-74
    5.2.3 分模式线性预测的丢包隐藏算法  74-75
    5.2.4 算法性能测试  75-77
  5.3 本章小结  77-78
第6章 150bps 声码器设计方案  78-90
  6.1 声码器的模型框架  78-81
    6.1.1 编码端的设计  78-79
    6.1.2 解码端的设计  79-80
    6.1.3 特征参数的比特分配方式  80-81
  6.2 特征参数的量化和恢复  81-85
    6.2.1 LSF 参数的量化  81-83
    6.2.2 基音周期参数的量化  83-84
    6.2.3 能量参数的量化  84-85
    6.2.4 子带 U/V 参数的恢复  85
  6.3 声码器性能测试  85-88
    6.3.1 客观语音质量  85
    6.3.2 主观语音质量  85-86
    6.3.3 声码器的抗误码性能  86-88
    6.3.4 声码器的码本存储量及算法延时  88
  6.4 本章小结  88-90
第7章 结论  90-92
参考文献  92-97
致谢  97-99
个人简历、在学期间发表的学术论文与研究成果  99-100

相似论文

  1. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  2. 基于BF533的多路语音编码模块的设计与实现,TN912.3
  3. iLBC语音编码技术的研究及DSP的设计与优化,TN912.3
  4. MELP声码器优化设计及与LPC-10编码的转换,TN912.3
  5. 甚低速率语音编码器算法研究,TN912.3
  6. 基于MELP的低速率语音编码算法研究,TN912.3
  7. MELPe语音编码关键技术研究,TN912.3
  8. 基于ML2724扩频通信系统的研究与应用,TN914.42
  9. 自适应低速率语音编解码研究与实现,TN912.3
  10. 低速率语音编码参数高效量化算法研究,TN912.3
  11. 基于ZigBee的无线音频传输系统的设计与实现,TN929.5
  12. 实时语音传输系统的设计与软件实现,TN912.3
  13. 一款改进型语音编解码算法的研究与实现,TN912.3
  14. 地震现场信息采集无线传输系统,TP274.2
  15. G.726语音编码的分析研究及在嵌入式AdHoc网络上的实现,TN929.5
  16. 基于DSP的语音编解码系统研究,TN912.3
  17. 基于数字对讲机的MELP声码器算法研究与实现,TN912.3
  18. 水下小型语音通信平台硬件设计及调试,TN912.3
  19. 基于AMR标准的语音编码VLSI设计,TN912.3
  20. 基于瞬时幅度加噪声模型的语音压缩,TN912.3
  21. AMR语音编码器,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com