学位论文 > 优秀研究生学位论文题录展示

语音人工带宽扩展算法研究

作　者: 赵承勇
导　师: 殷福亮；陈喆
学　校: 大连理工大学
专　业: 通信与信息系统
关键词: 语音带宽扩展音频水印高频参数宽带语音矢量量化
分类号: TN912.3
类　型: 硕士论文
年　份: 2011年
下　载: 13次
引　用: 0次
阅　读: 论文下载

内容摘要

在固定电话通信网中,传输的语音是8KHz采样频率的窄带语音。窄带语音缺失了高频部分的能量,所以这种语音听起来“单薄、无力”。随着宽带编解码系统的出现,宽带语音的通信成为可能。但是,通信网络的升级是一个复杂、漫长、渐进的过程,如何尽早在现有网络传输条件下获得宽带语音的品质就成为一个亟待解决的现实问题。有一种方法可以在不改变网络结构的情况下实现宽带语音通信,这就是语音人工带宽扩展。本文研究了基于信息隐藏技术的语音带宽扩展算法,主要工作如下：(1)研究语音的数字模型、线性预测分析及其自相关的解法、音频水印和矢量量化技术。(2)论述了提取高频语音的时域包络参数、频域包络参数、平均时域包络参数和平均频域包络参数的方法,并对提取的参数用矢量量化技术进行压缩。设计出使用高频参数合成高频分量的方法。(3)研究音频水印的特性和各种水印嵌入算法,设计了两种改进型最低有效位水印嵌入算法,并将压缩的高频信息嵌入到窄带语音中。(4)研究G.711.1协议中高频分量的合成,提取出了高频语音的MDCT系数,并对提取的系数进行压缩编码。(5)用C语言对本文提出的语音带宽扩展方法进行了实现,完成了语音质量客观测试和主观测试,并对两种算法进行了比较。实验结果表明,本文提出的两种带宽扩展算法合成的宽带语音都达到了预期的效果。带宽扩展算法的复杂度控制在了一定的范围,合成的宽带语音的听觉效果较窄带语音有了较大改善。

全文目录

摘要  4-5
Abstract  5-8
1 绪论  8-13
  1.1 研究背景  8-9
  1.2 语音带宽扩展的历史和现状  9-11
  1.3 本文主要工作及组织结构  11-13
2 语音分析及预处理  13-19
  2.1 语音的数字化  13
  2.2 语音的预处理  13-14
  2.3 语音信号的特征参数  14-15
  2.4 语音信号的线性预测分析  15-19
3 音频水印及矢量量化技术  19-25
  3.1 音频水印  19-23
  3.2 矢量量化技术  23-25
4 已有带宽扩展方法简介  25-31
  4.1 基于分层编码的语音带宽扩展方法  25
  4.2 基于预测的语音带宽扩展方法  25-29
  4.3 基于信息隐藏的语音带宽扩展  29-31
5 带宽扩展算法  31-47
  5.1 基于信息隐藏技术的带宽扩展算法  31-39
    5.1.1 信号QMF处理  31-32
    5.1.2 提取高频参数  32-35
    5.1.3 低频语音的处理  35
    5.1.4 嵌入水印信息  35-36
    5.1.5 水印信息的提取  36
    5.1.6 恢复高频语音  36-39
    5.1.7 QMF进行信号合成  39
  5.2 基于G.711.1的带宽扩展算法  39-47
    5.2.1 MDCT系数提取  40
    5.2.2 MDCT系数加权处理  40-41
    5.2.3 均方根计算与MDCT系数归一化  41
    5.2.4 矢量量化编码  41-42
    5.2.5 增益的量化  42-43
    5.2.6 水印嵌入算法  43
    5.2.7 MDCT参数解码  43-45
    5.2.8 逆MDCT变换  45-47
6 语音带宽扩展系统的实现  47-57
  6.1 系统结构的设计和实现  47-49
  6.2 系统仿真  49-57
    6.2.1 语音库的选取  49-50
    6.2.2 客观测试  50-54
    6.2.3 主观测试  54-57
结论  57-58
参考文献  58-61
攻读硕士学位期间发表学术论文情况  61-62
致谢  62-63

语音人工带宽扩展算法研究

内容摘要

全文目录

相似论文