学位论文 > 优秀研究生学位论文题录展示

宽带音频的非线性频带展宽技术

作 者: 刘鑫
导 师: 鲍长春
学 校: 北京工业大学
专 业: 电路与系统
关键词: 音频编码 频带展宽 高斯混合模型 隐马尔科夫模型 非线性预测
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 45次
引 用: 2次
阅 读: 论文下载
 

内容摘要


本文在深入研究传统音频频带扩展技术的基础上,分析了超宽带音频信号的高低频相关性,首先,根据低频谱包络和感知音色特征,研究了高频子带能量的估计方法;其次,基于非线性动力学中的相空间重构和最近邻匹配的方法,研究了高频频谱细节的非线性预测方法,最后,在实际编码器上实现了由宽带到超宽带音频信号的盲目频带扩展。在高频子带能量估计方面,本文引入了高斯混合模型,并用其拟合高低频特征的联合概率密度,在最小均方误差准则的基础上构建了一套基于高斯混合模型的高频子带能量估计算法,保证了在平稳特征数据下高频子带能量估计的准确性。在此基础上,将隐马尔科夫模型引入到音频频带扩展算法中,并基于最小均方误差准则构建了一套基于隐马尔科夫模型的高频子带能量估计算法,进一步改善了重建音频的感知质量,有效地解决了扩展后高频子带能量的时域突变问题,提高了在复杂特征数据条件下重建音频频谱能量的平滑性。在频谱细节恢复方面,本文利用相空间重构技术验证了音频信号在频域内的非线性特征,并利用低频相轨迹的局部演变规律,提出了基于最近邻匹配的高频频谱细节非线性扩展方法。在实际编码器应用方面,本文组合隐马尔科夫模型和非线性预测技术,构建了一套完整的“盲目式”宽带向超宽带音频信号的非线性频带扩展算法,并将其应用到24kb/s速率下的G.722.1宽带音频编码器中,主观和客观质量评价表明,频带扩展后的G.722.1编码器质量与同码率下的G.722.1C超宽带编码器相当。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-17
  1.1 课题背景  9-14
  1.2 研究目标  14
  1.3 研究内容  14-15
  1.4 论文结构  15-17
第2章 传统音频频带扩展概述和算法框架  17-29
  2.1 语音信号的频带扩展  17-22
    2.1.1 语音产生机制和源滤波器模型  17-19
    2.1.2 基于源滤波器模型的语音频带扩展算法概述  19-22
  2.2 音频信号的频带扩展  22-25
  2.3 宽带向超宽带音频频带扩展算法框架  25-28
  2.4 本章小结  28-29
第3章 基于高斯混合模型的高频子带能量估计算法  29-49
  3.1 高频谱包络参数的贝叶斯估计  29-31
  3.2 高斯混合模型  31-36
    3.2.1 高斯混合模型基本原理  31-32
    3.2.2 模型参数的计算  32-36
  3.3 基于高斯混合模型的高频子带能量估计算法  36-42
    3.3.1 宽带时频特征和超宽带高频子带能量的提取  37-40
    3.3.2 基于联合概率密度的高频子带能量估计  40-42
  3.4 算法性能测试  42-48
  3.5 本章小结  48-49
第4章 基于隐马尔科夫模型的高频子带能量估计改进算法  49-61
  4.1 隐马尔科夫模型基本原理  49-53
    4.1.1 马尔科夫状态的统计模型  49-51
    4.1.2 参数估计准则  51-53
  4.2 基于隐马尔科夫模型的高频子带能量估计算法  53-56
  4.3 算法性能测试  56-59
  4.4 本章小结  59-61
第5章 基于最近邻匹配的高频谱细节非线性扩展算法  61-77
  5.1 音频信号的非线性分析  61-69
    5.1.1 相空间重构技术  61-67
    5.1.2 音频频域信号的李雅普诺夫指数分析  67-69
  5.2 基于最近邻匹配的高频细节重建方法  69-72
  5.3 算法性能测试  72-75
  5.4 本章小结  75-77
第6章 非线性频带扩展算法在宽带音频编码器中的应用  77-85
  6.1 G.722.1与G.722.1C编解码框架  77-80
    6.1.1 G.722.1编解码算法框架  77-79
    6.1.2 G.722.1C算法框架  79-80
  6.2 G.722.1宽带音频编码器中非线性频带扩展应用  80-81
  6.3 算法性能测试  81-84
  6.4 本章小结  84-85
结论  85-87
参考文献  87-91
攻读硕士学位期间所发表的学术论文  91-93
致谢  93

相似论文

  1. 高质量语音转换系统中关键技术的研究,TN912.3
  2. 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
  3. 多特征融合的视觉跟踪算法研究,TP391.41
  4. 基于神经网络建模的聚丙烯牌号切换非线性预测控制,TQ325.14
  5. 无线传感器网络中的追击者—逃跑者跟踪问题研究,TP212.9
  6. AVS音频编码算法研究,TN911.21
  7. 基于PADK的音频编码器开发平台设计,TN762
  8. 低水胶比机制砂配制高性能混凝土及其性能的非线性方法预测,TU528
  9. 卫星姿态确定的非线性滤波方法研究,V448.2
  10. 高斯混合模型及在探测网络社区结构中的应用,TP393.094
  11. 运动人体检测与异常行为识别技术研究与实现,TP391.41
  12. 面向智能视频监控的事件检测建模及优化,TP391.41
  13. 层析芯片阳性信号的信息提取和定量分析研究,TP391.41
  14. 虚拟人运动合成技术及其工程应用研究,TP391.41
  15. 基于H.323的网络视频会议监视系统的研究与实现,TN948.63
  16. 基于因子分析的说话人确认,TN912.34
  17. 音频分类技术研究,TN912.3
  18. 音频信号检测技术研究,TN912.3
  19. 关于若干回归模型的研究,O212.1
  20. 基于隐马尔科夫模型的股价走势预测,F830.91
  21. 基于分类及相似性的图像型垃圾邮件检测技术研究,TP393.098

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com