学位论文 > 优秀研究生学位论文题录展示

语音人工带宽扩展算法研究

作 者: 赵承勇
导 师: 殷福亮;陈喆
学 校: 大连理工大学
专 业: 通信与信息系统
关键词: 语音带宽扩展 音频水印 高频参数 宽带语音 矢量量化
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 13次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在固定电话通信网中,传输的语音是8KHz采样频率的窄带语音。窄带语音缺失了高频部分的能量,所以这种语音听起来“单薄、无力”。随着宽带编解码系统的出现,宽带语音的通信成为可能。但是,通信网络的升级是一个复杂、漫长、渐进的过程,如何尽早在现有网络传输条件下获得宽带语音的品质就成为一个亟待解决的现实问题。有一种方法可以在不改变网络结构的情况下实现宽带语音通信,这就是语音人工带宽扩展。本文研究了基于信息隐藏技术的语音带宽扩展算法,主要工作如下:(1)研究语音的数字模型、线性预测分析及其自相关的解法、音频水印矢量量化技术。(2)论述了提取高频语音的时域包络参数、频域包络参数、平均时域包络参数和平均频域包络参数的方法,并对提取的参数用矢量量化技术进行压缩。设计出使用高频参数合成高频分量的方法。(3)研究音频水印的特性和各种水印嵌入算法,设计了两种改进型最低有效位水印嵌入算法,并将压缩的高频信息嵌入到窄带语音中。(4)研究G.711.1协议中高频分量的合成,提取出了高频语音的MDCT系数,并对提取的系数进行压缩编码。(5)用C语言对本文提出的语音带宽扩展方法进行了实现,完成了语音质量客观测试和主观测试,并对两种算法进行了比较。实验结果表明,本文提出的两种带宽扩展算法合成的宽带语音都达到了预期的效果。带宽扩展算法的复杂度控制在了一定的范围,合成的宽带语音的听觉效果较窄带语音有了较大改善。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-13
  1.1 研究背景  8-9
  1.2 语音带宽扩展的历史和现状  9-11
  1.3 本文主要工作及组织结构  11-13
2 语音分析及预处理  13-19
  2.1 语音的数字化  13
  2.2 语音的预处理  13-14
  2.3 语音信号的特征参数  14-15
  2.4 语音信号的线性预测分析  15-19
3 音频水印矢量量化技术  19-25
  3.1 音频水印  19-23
  3.2 矢量量化技术  23-25
4 已有带宽扩展方法简介  25-31
  4.1 基于分层编码的语音带宽扩展方法  25
  4.2 基于预测的语音带宽扩展方法  25-29
  4.3 基于信息隐藏的语音带宽扩展  29-31
5 带宽扩展算法  31-47
  5.1 基于信息隐藏技术的带宽扩展算法  31-39
    5.1.1 信号QMF处理  31-32
    5.1.2 提取高频参数  32-35
    5.1.3 低频语音的处理  35
    5.1.4 嵌入水印信息  35-36
    5.1.5 水印信息的提取  36
    5.1.6 恢复高频语音  36-39
    5.1.7 QMF进行信号合成  39
  5.2 基于G.711.1的带宽扩展算法  39-47
    5.2.1 MDCT系数提取  40
    5.2.2 MDCT系数加权处理  40-41
    5.2.3 均方根计算与MDCT系数归一化  41
    5.2.4 矢量量化编码  41-42
    5.2.5 增益的量化  42-43
    5.2.6 水印嵌入算法  43
    5.2.7 MDCT参数解码  43-45
    5.2.8 逆MDCT变换  45-47
6 语音带宽扩展系统的实现  47-57
  6.1 系统结构的设计和实现  47-49
  6.2 系统仿真  49-57
    6.2.1 语音库的选取  49-50
    6.2.2 客观测试  50-54
    6.2.3 主观测试  54-57
结论  57-58
参考文献  58-61
攻读硕士学位期间发表学术论文情况  61-62
致谢  62-63

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
  3. 压缩感知算法及其在矢量量化中的应用,TN911.7
  4. Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
  5. 语音质量测量系统,TN912.3
  6. 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
  7. 甚低速率语音编码器算法研究,TN912.3
  8. 端到端保密通信中的类语音调制解调研究,TN918
  9. AMR-WB+编码算法关键技术及码流识别研究,TN912.3
  10. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  11. 基于MELP的低速率语音编码算法研究,TN912.3
  12. 基于文本无关的说话人识别研究,TN912.34
  13. 高速公路交通事件检测建模及应用研究,U491.116
  14. 多路并行实时说话人识别算法研究与实现,TN912.34
  15. 低速率语音编码参数高效量化算法研究,TN912.3
  16. 变换域鲁棒音频水印算法研究,TP309.7
  17. 自适应音频水印算法研究,TP309.7
  18. 基于特征的数字音频水印技术研究,TP309.7
  19. 基于语音信号特征的语音零水印,TP309.7
  20. 噪声环境下的说话人识别研究,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com