学位论文 > 优秀研究生学位论文题录展示
AMR-WB+编码算法关键技术及码流识别研究
作 者: 王军
导 师: 张连海
学 校: 解放军信息工程大学
专 业: 军事情报学
关键词: 导抗谱频率 矢量量化 变换码激励 格型矢量量化 码流识别
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 50次
引 用: 0次
阅 读: 论文下载
内容摘要
第三代移动通信系统中普遍使用变速率的音频编码方式,以此满足语音和音乐等信号的高质量编码传输需求。AMR-WB+算法是该领域的研究热点之一。论文研究了AMR-WB+的相关技术及码流识别算法,主要工作如下:研究了导抗谱频率(ISF)的计算及量化方法。首先给出了ISF的定义以及与线性预测系数的转化方法,然后通过改进已有文献的转换分类分裂矢量量化(SSVQ)算法,提出了一种能够降低比特率的ISF量化方法。该方法在对输入矢量做转换分类后,不再直接对原矢量进行分裂矢量量化,而是将输入矢量与相应的分类矢量相减,对得到的差矢量再做分裂矢量量化。实验表明新方法能够在每帧37比特时达到透明量化,低于SSVQ的每帧44比特,也低于AMR-WB+的每帧46比特,并且码本存储量仅为SSVQ方法的三分之一研究了变换码激励(TCX)编码技术。论文给出了TCX编解码流程,重点研究了利用格型矢量量化方法量化频谱系数的算法机制。在此基础上实现了编码速率为12.8kbps的TCX编解码算法。最后利用平均分段信噪比和非正式主观测听相结合的方法验证了TCX对音乐信号编码的有效性。研究了编码码流的特征,在此基础上实现了编码类型识别。以AMR-WB+等十二种编码码流为对象,研究了帧长、零一概率等常用码流特征。通过对各种特征的研究,对于AMR-WB+编码,利用帧长及帧首部判定帧类型;对于定速率的参数编码,提出了一种帧长结合特征帧的码流识别方法。帧长结合特征帧方法首先通过帧间相似度判定帧长,对相同帧长的不同编码方式再利用特征帧模板和相应的匹配度门限值进一步识别。实验表明这两种方法能有效识别编码码流。
|
全文目录
表目录 7-8 图目录 8-9 摘要 9-10 ABSTRACT 10-11 第一章 绪论 11-20 1.1 语音编码的发展方向 11 1.2 AMR-WB+编码器的主要特点及其研究意义 11-12 1.3 早期AMR系列编码器 12-15 1.3.1 CELP编码 12-13 1.3.2 AMR编码 13-14 1.3.3 AMR-WB编码 14-15 1.4 AMR-WB+编码器概述 15-18 1.4.1 编码器框架结构 15 1.4.2 ACELP/TCX混合编码结构 15-17 1.4.3 BWE编码 17-18 1.4.4 立体声编码 18 1.5 论文的研究内容及组织安排 18-20 1.5.1 论文的研究内容 18-19 1.5.2 论文的组织安排 19-20 第二章 ISF及其量化方法研究 20-31 2.1 ISF的定义 20-21 2.2 ISF与LP系数的相互转化 21-24 2.2.1 根据LP系数求解ISF 21-23 2.2.2 根据ISF求解LP系数 23-24 2.3 ISF与LSF的比较 24 2.4 ISF量化研究 24-27 2.4.1 VQ基本原理与分类 25-26 2.4.2 SVQ原理 26 2.4.3 SSVQ原理 26 2.4.4 评价声道谱量化器的手段 26-27 2.5 一种37bits/frame的ISF量化方法 27-28 2.6 实验结果与分析 28-30 2.6.1 实验参数设置 28-29 2.6.2 实验结果分析 29-30 2.7 本章小结 30-31 第三章 12.8kbps TCX编码 31-47 3.1 总体介绍 31 3.2 格型矢量量化简介 31-34 3.3 12.8kbps TCX编码原理 34-42 3.3.1 预处理 34 3.3.2 线性预测系数提取及量化 34-35 3.3.3 感觉加权滤波及加窗 35-36 3.3.4 变换域映射及谱系数整形 36-37 3.3.5 谱系数的量化 37-41 3.3.6 增益计算 41-42 3.3.7 发送比特流 42 3.4 12.8kbps TCX解码原理 42-45 3.4.1 声道谱参数的解码 42-43 3.4.2 频谱参数的解码 43-44 3.4.3 背景噪声因子的解码 44 3.4.4 低频去加重及时域信号的恢复 44 3.4.5 增益的解码 44 3.4.6 逆感觉加权 44 3.4.7 后置处理 44-45 3.5 实验结果及分析 45-46 3.6 本章小结 46-47 第四章 AMR-WB+及其它常见编码算法码流分析研究 47-58 4.1 AMR-WB+编码帧特征 47-50 4.2 码流分析的目标 50-51 4.3 码流分析常用特征及提取 51-54 4.3.1 帧长 51 4.3.2 游程长度分布 51-52 4.3.3 零一概率 52-53 4.3.4 特征帧 53-54 4.4 帧长结合特征帧的码流识别方法 54 4.5 实验及结果分析 54-57 4.5.1 实验设置 54-55 4.5.2 AMR-WB+编码码流的测试 55 4.5.3 其它编码流的类型识别 55-57 4.6 本章小结 57-58 结束语 58-60 参考文献 60-63 附录 63-66 作者简历 攻读硕士学位期间完成的主要工作 66-67 致谢 67
|
相似论文
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
- 压缩感知算法及其在矢量量化中的应用,TN911.7
- Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
- 语音人工带宽扩展算法研究,TN912.3
- 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
- 甚低速率语音编码器算法研究,TN912.3
- 端到端保密通信中的类语音调制解调研究,TN918
- 基于Windows CE的说话人识别系统的设计与实现,TN912.34
- 基于MELP的低速率语音编码算法研究,TN912.3
- 基于文本无关的说话人识别研究,TN912.34
- 高速公路交通事件检测建模及应用研究,U491.116
- 多路并行实时说话人识别算法研究与实现,TN912.34
- 低速率语音编码参数高效量化算法研究,TN912.3
- 基于语音信号特征的语音零水印,TP309.7
- 噪声环境下的说话人识别研究,TN912.34
- 基于SOM的入侵检测算法的研究与改进,TP393.08
- 基于小波变换和矢量量化的图像压缩编码研究,TP391.41
- 基于视频的运动分析关键技术研究,TP391.41
- 基于条件高斯混合模型的宽带ISF参数分裂矢量量化研究,TN912.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|