学位论文 > 优秀研究生学位论文题录展示

超低速率语音编码算法研究

作 者: 何洪华
导 师: 唐昆
学 校: 清华大学
专 业: 信息与通信工程
关键词: 语音编码 超低速率 清浊音恢复 重要帧 抗误码
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 33次
引 用: 0次
阅 读: 论文下载
 

内容摘要


超低速率语音编码技术一直是许多国家高校和研究所的重要研究课题,它广泛应用于短波通信和水声通信等领域。此外,在军事保密通信和信道价格昂贵的卫星通信中,超低速率语音编码技术也得到了广泛的应用。在超低速率语音编码中,分配给各个特征参数的比特数极其有限,这给参数的量化带来了极大的困难。为了解决低速率语音编码中比特受限的问题,本文提出了一种基于二阶隐马尔可夫模型的清浊音参数恢复算法。算法采用二阶隐马尔可夫模型,通过归一化的能量参数和LPC倒谱系数估计出序列中的全带清浊音判决和各个子带的清浊音度。解码器实现该算法后,编码器就无需对清浊音参数进行量化传输,从而节约原本用于浊音度参数量化传输的比特。多帧参数联合编码的技术由于其优越的量化性能常常在超低速率语音编码算法研究中被应用。而随着编码速率的降低,多帧联合编码的帧数相应增加,这使得算法的时间复杂度和空间复杂度也相应增加。为了解决参数维数增加导致的维数灾难,本文提出了基于统计的LSF参数重要帧量化算法,该算法在不影响合成语音质量的前提下,大大地降低了LSF参数量化算法的时间复杂度和码本存储量。综合以上技术和现有成熟编码技术,本文设计并实现了参数相关150bps声码器。该声码器的编码算法占用码本空间约为86K words,合成语音客观平均意见得分(Mean Opinion Score, MOS)达到2.41,非正式主观测试中单字识别准确率超过82%,性能指标超过十一五项目需求。最后,针对声码器在实际应用中遇到的问题,本文还设计并实现了一个自动增益控制模块,实现对声码器编码前的输入信号进行自适应调整语音幅度。此外,为了增加2.4Kbps声码器的抗误码性能,本文利用LSF参数自身的相关性,对LSF参数进行了检错与纠错处理,提高了声码器在实际应用中的鲁棒性。

全文目录


摘要  2-3
Abstract  3-9
第1章 绪论  9-17
  1.1 背景  9
  1.2 语音编码基本原理  9-11
    1.2.1 语音编码模型  10
    1.2.2 语音编码依据  10-11
  1.3 语音编码分类  11-12
    1.3.1 波形编码  11
    1.3.2 参数编码  11-12
    1.3.3 混合编码  12
  1.4 超低速率语音编码技术  12-14
    1.4.1 分段编码技术  12-13
    1.4.2 语音识别和合成技术  13
    1.4.3 多帧参数联合编码技术  13-14
  1.5 语音编码算法的性能指标  14-16
    1.5.1 编码速率  14
    1.5.2 语音质量  14-15
    1.5.3 算法延时  15-16
    1.5.4 算法复杂度  16
  1.6 论文的背景、目标和安排  16-17
第2章 正弦激励线性预测模型  17-23
  2.1 SELP 模型简介  17
  2.2 SELP 模型参数分析算法  17-20
    2.2.1 预处理  18
    2.2.2 线性预测分析  18
    2.2.3 基音周期分析  18-19
    2.2.4 子带清浊音分析  19
    2.2.5 能量参数分析  19
    2.2.6 余量谱幅度分析  19-20
  2.3 SELP 模型合成算法  20-22
    2.3.1 混合激励信号的产生  21
    2.3.2 增益调制  21-22
    2.3.3 语音合成  22
  2.4 本章小结  22-23
第3章 基于二阶隐马尔可夫模型的清浊音恢复算法  23-33
  3.1 引言  23-24
  3.2 清浊音参数恢复算法  24-27
    3.2.1 清浊音参数的 HMM2 模型  24-26
    3.2.2 清浊音参数恢复算法  26-27
  3.3 模型参数训练  27-28
  3.4 仿真实验  28-30
    3.4.1 清浊音参数恢复性能  28-30
    3.4.2 对合成语音质量的影响  30
  3.5 算法复杂度分析  30-32
    3.5.1 时间复杂度  31
    3.5.2 空间复杂度  31-32
  3.6 本章小结  32-33
第4章 基于统计的 LSF 参数重要帧量化算法  33-40
  4.1 重要帧量化算法  33-34
  4.2 基于统计的 LSF 参数重要帧量化算法  34-37
    4.2.1 非重要帧恢复算法  34-35
    4.2.2 训练插值系数  35-36
    4.2.3 重要帧的选取原则  36-37
  4.3 性能测试  37-38
  4.4 算法复杂度分析  38-39
  4.5 本章小结  39-40
第5章 声码器预处理与后处理相关技术研究  40-52
  5.1 自动增益控制  40-46
    5.1.1 问题分析  40-41
    5.1.2 自动增益控制算法  41-42
    5.1.3 性能测试  42-45
    5.1.4 复杂度分析  45-46
  5.2 LSF 参数抗信道误码算法  46-51
    5.2.1 问题分析  46
    5.2.2 抗误码性恢复算法  46-49
    5.2.3 性能测试  49-51
    5.2.4 复杂度分析  51
  5.3 本章小节  51-52
第6章 参数相关 150bps 声码器设计与实现  52-61
  6.1 参数相关 150bps 声码器设计方案  52-55
    6.1.1 编码端设计  52-53
    6.1.2 解码端设计  53-54
    6.1.3 比特分配  54-55
  6.2 参数相关 150bps 声码器参数量化  55-58
    6.2.1 线谱频率参数量化  55-57
    6.2.2 能量参数量化  57-58
    6.2.3 基音周期参数量化  58
  6.3 参数相关 150bps 声码器性能测试  58-60
    6.3.1 客观 MOS 分测试  58-59
    6.3.2 主观可懂度测试  59-60
    6.3.3 抗误码性能测试  60
    6.3.4 算法复杂度分析  60
  6.4 本章小结  60-61
第7章 结论  61-63
参考文献  63-66
致谢  66-67
个人简历、在学期间发表的学术论文与研究成果  67

相似论文

  1. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  2. 基于BF533的多路语音编码模块的设计与实现,TN912.3
  3. 无线网络H.264视频传输的抗误码技术研究,TN919.81
  4. 基于T-DMB的视音频抗误码处理技术研究,TN919.81
  5. 基于ZigBee的无线音频传输系统的设计与实现,TN929.5
  6. 具有抗误码能力的水下视频图像高效编码方法研究,TN919.81
  7. 基于DSP的语音编解码系统研究,TN912.3
  8. 图像压缩传输信源信道编码研究,TN919.8
  9. 基于Wyner-Ziv思想的视频编码关键技术研究,TN919.81
  10. 基于TMS320VC5402的G.729语音编解码器研究,TN912.3
  11. 基于SIP的VoIP加密传输终端系统的研究与设计,TN916.2
  12. VoIP中宽带语音编码研究与DSP实现,TN912.3
  13. 基于网络QoS的AMR语音编码算法研究,TN912.3
  14. 基于G.726/G.729的嵌入式语音采集压缩系统的设计,TN912.3
  15. 基于H.264解码端差错隐藏技术的研究,TN919.81
  16. Instlink语音引擎的研究与实现,TN912.3
  17. CCSDS图像压缩算法的抗误码性能研究,TP391.41
  18. 基于SOPC的VoIP系统设计,TP368.12
  19. 基于正弦模型的线性预测低速率语音编码算法研究,TN912.3
  20. G.723.1标准在TMS320VC5402上的实现,TN916.3
  21. 语音处理技术在VTS系统中的应用研究,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com