学位论文 > 优秀研究生学位论文题录展示
MFLP甚低速率语音编解码算法研究
作 者: 郭莉
导 师: 王炳锡
学 校: 中国人民解放军信息工程大学
专 业: 信号与信息处理
关键词: 矢量量化 参数内插 混合激励 甚低速率语音编码 多帧联合
分类号: TN912.3
类 型: 硕士论文
年 份: 2005年
下 载: 177次
引 用: 4次
阅 读: 论文下载
内容摘要
随着数字通信业务的发展,以及恶劣条件下的无线通信等领域对低速率语音编码的迫切要求,2.4kbps及其以下的高质量甚低速率语音编码算法成为目前研究的热点。 混合激励线性预测(MELP)声码器是现代低速率语音编码中最有潜力的算法之一,该算法对传统LPC二元激励进行了改进,可以更好地模拟自然语言特征,在低速率上合成出较高质量的语音。本文以该算法为基本模型,对基音周期、能量、LSF、清浊音和激励谱描述等几个语音编码参数进行了详细的分析和实验,给出了这些参数的帧间相关性、统计特性、及其对表征自然语音的作用。针对各参数的不同特性,文中深入讨论了甚低速率声码器中参数的选择、提取和量化方法,为甚低速率语音编码算法的构造和实现打下了坚实的基础。 在甚低速率语音编码中,由于没有足够的比特数描述语音信号的谱信息,往往很难得到高质量的合成语音,本文提出采用多帧联合、高效量化、参数内插和增大帧长等方法降低编码速率,保证合成语音的质量。在理论研究的基础上文中设计并实现了1.2kbpsMFLP和0.8kbpsMFLP两种甚低速率语音编码算法,给出了这两种声码器的工作原理,并对其在不同语言、不同信道下的合成语音质量进行了性能评测。 非正式主观听觉测试表明该1.2kbpsMFLP甚低速率声码器合成语音质量优于传统2.4kbpsLPC-10算法,与美国联邦标准2.4kbpsMELP算法相当;0.8kbpsMFLP声码器合成语音保证了较高的可懂度和清晰度,并具有一定的自然度。
|
全文目录
摘要 4-5 Abstract 5-6 第一章 概述 6-15 1.1 语音编码的研究概况及发展方向 6-7 1.2 低速率语音编码概述 7-10 1.2.1 理论依据 7 1.2.2 理论极限 7-8 1.2.3 特征参数及各参数的听觉特性 8 1.2.4 特征参数的表示和量化技术 8-9 1.2.5 语音编码算法的性能评测 9-10 1.3 现代低速率语音编码算法介绍 10-13 1.4 论文研究的主要内容和章节安排 13-15 1.4.1 论文研究的主要内容 13-14 1.4.2 论文的章节安排 14-15 第二章 1.2kbpsMFLP声码器 15-44 2.1 算法分析 15-17 2.1.1 甚低速率语音编码的主要实现方法 15-16 2.1.2 1.2kbpsMFLP算法原理 16-17 2.2 特征参数的提取 17-23 2.2.1 预处理 18 2.2.2 基音周期的计算 18-21 2.2.3 带通清浊判决的计算 21-22 2.2.4 增益的计算 22-23 2.2.5 线性预测分析 23 2.3 特征参数的量化编码 23-28 2.3.1 基音周期的量化 24 2.3.2 带通清浊判决的量化 24-26 2.3.3 增益的量化 26 2.3.4 线性预测系数的量化 26-27 2.3.5 发送比特流 27-28 2.4 解码器原理 28-32 2.4.1 比特流的解包和参数解码 28-29 2.4.2 噪声衰减 29 2.4.3 参数插值 29-30 2.4.4 混合激励的生成 30-31 2.4.5 自适应谱增强 31 2.4.6 线性预测合成 31 2.4.7 增益的校正 31-32 2.4.8 脉冲散布滤波 32 2.4.9 合成环路控制 32 2.5 LSF参数的提取和量化 32-40 2.5.1 LPC参数的提取 32-33 2.5.2 LSF参数的定义 33-35 2.5.3 LPC参数和 LSF参数的互换 35-37 2.5.4 LSF的多级矢量量化 MSVQ 37-40 2.5.5 超级帧中的LSF参数内插 40 2.6 1.2kbpsMFLP算法的实现及结果分析 40-44 2.6.1 算法模拟 40-41 2.6.2 实验结果性能分析 41-44 第三章 0.8kbps MFLP声码器 44-50 3.1 0.8kbps MFLP算法基本原理 44 3.2 帧长的选择 44-45 3.3 参数的提取和量化 45-46 3.3.1 LSF参数的提取和量化 45-46 3.3.2 其它参数的提取和量化 46 3.4 0.8kbpsMFLP算法的实现及结果分析 46-50 3.4.1 算法模拟 46-48 3.4.2 实验结果性能分析 48-50 第四章 甚低速率语音编码性能测试 50-56 4.1 合成语音质量测试 50-51 4.2 算法延时测试 51-52 4.3 多种语言通用性的测试 52-56 第五章 结论和进一步研究方向 56-59 5.1 论文工作总结 56-57 5.2 进一步研究方向 57-59 参考文献 59-62 致谢 62-63 附录 63
|
相似论文
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
- 压缩感知算法及其在矢量量化中的应用,TN911.7
- Pre~2VOD:一种VCR操作支持的VOD/P2P系统,TN948.64
- 语音人工带宽扩展算法研究,TN912.3
- 基于矢量量化的高光谱图像无损压缩算法研究,TP751.1
- 甚低速率语音编码器算法研究,TN912.3
- 端到端保密通信中的类语音调制解调研究,TN918
- AMR-WB+编码算法关键技术及码流识别研究,TN912.3
- 基于Windows CE的说话人识别系统的设计与实现,TN912.34
- 基于MELP的低速率语音编码算法研究,TN912.3
- 基于文本无关的说话人识别研究,TN912.34
- 高速公路交通事件检测建模及应用研究,U491.116
- 多路并行实时说话人识别算法研究与实现,TN912.34
- 低速率语音编码参数高效量化算法研究,TN912.3
- 基于语音信号特征的语音零水印,TP309.7
- 噪声环境下的说话人识别研究,TN912.34
- 基于SOM的入侵检测算法的研究与改进,TP393.08
- 基于小波变换和矢量量化的图像压缩编码研究,TP391.41
- 基于视频的运动分析关键技术研究,TP391.41
- 基于数字对讲机的MELP声码器算法研究与实现,TN912.3
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|