学位论文 > 优秀研究生学位论文题录展示
基于神经网络的音频频带扩展算法研究
作 者: 刘浩杰
导 师: 鲍长春
学 校: 北京工业大学
专 业: 电路与系统
关键词: 频带扩展 非线性预测 相空间重构 神经网络
分类号: TN912.3
类 型: 硕士论文
年 份: 2013年
下 载: 13次
引 用: 0次
阅 读: 论文下载
内容摘要
本文在深入研究传统的盲目式和非盲目式音频频带扩展方法的基础上,基于非线性动力学理论和神经网络模型,实现了一套完整的宽带(0~7kHz)音频到超宽带(0~14kHz)音频的盲目式频带扩展算法,并进一步将该技术应用到实际编码器中。首先,在确定音频信号的非线性特征的基础上,本文分别采用RBF神经网络和BP神经网络对相空间重构后的频域序列进行细节谱预测。结合音频信号细节谱预测时的实际情况,引入了模糊理论优化RBF神经网络,以提高其泛化效果。此外,采用修正学习率和附加动量项等方法提高其训练速度,以适应线上预测细节谱的需求。其次,在高频子带能量估计方面,本文采用RBF神经网络拟合低频的特征参数与高频子带能量间的映射关系,实现对高频能量的准确恢复。利用超宽带音频现下训练RBF神经网络并实时估计高频子带能量,结合非线性预测得到的细节谱,构建了一套完整的宽带音频向超宽带音频扩展的盲目式频带扩展算法。最后,在实际编码器应用方面,本文将基于神经网络的音频频带扩展技术应用到ITU-T G.722.1宽带音频编解码器中,并与ITU-T G.722.1C超宽带音频编解码器得到的超宽带音频进行对比。主客观测试均表明,24kbps码率时G.722.1与所提频带扩展算法相结合得到的超宽带音频质量,与同码率下的G.722.1C编解码器得到的超宽带音频质量相当。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-20 1.1 课题背景 10-11 1.2 研究现状 11-15 1.3 算法框架 15-18 1.4 研究目标 18 1.5 研究内容 18-19 1.6 论文的组织安排 19-20 第2章 音频信号的非线性分析 20-30 2.1 非线性动力学理论 20-21 2.2 音频频域序列的非线性特性验证 21-24 2.2.1 音频序列的非线性验证 22-24 2.2.2 音频序列的确定性验证 24 2.3 音频频域序列相空间重构 24-29 2.3.1 延迟时间的确定 25-27 2.3.2 嵌入维的确定 27-29 2.3.3 相空间重构 29 2.4 本章小结 29-30 第3章 基于 BP 神经网络的音频信号谱细节非线性预测 30-46 3.1 引言 30-31 3.2 BP 神经网络简介 31-37 3.2.1 BP 神经网络结构介绍 31-32 3.2.2 BP 神经网络学习过程 32-36 3.2.3 BP 神经网络算法改进 36-37 3.3 高频细节谱的非线性预测 37-41 3.3.1 BP 神经网络预测算法框架 37 3.3.2 BP 神经网络预测模型的构造 37-38 3.3.3 细节谱非线性预测 38-39 3.3.4 谱包络调整 39-41 3.4 性能测试 41-44 3.4.1 客观质量评测 42-43 3.4.2 主观质量评测 43-44 3.5 本章小结 44-46 第4章 基于改进的 RBF 神经网络的细节谱非线性预测 46-62 4.1 RBF 神经网络简介 46-50 4.1.1 RBF 神经网络结构介绍 46-47 4.1.2 RBF 神经网络较 BP 神经网络的优势 47-48 4.1.3 K 均值聚类 48-50 4.1.4 RBF 神经网络的训练 50 4.2 模糊理论简介 50-52 4.2.1 模糊数学 51 4.2.2 模糊推理 51-52 4.3 模糊理论与神经网络结合 52-54 4.3.1 神经网络与模糊理论的可结合性 52-53 4.3.2 神经网络与模糊理论的结合方式 53-54 4.4 模糊 RBF 神经网络设计 54-58 4.4.1 模糊 RBF 神经网络的一般结构 54-55 4.4.2 模糊规则库的确定 55-57 4.4.3 模糊 RBF 神经网络的音频细节谱预测 57-58 4.5 性能测试 58-60 4.6 本章小结 60-62 第5章 基于 RBF 神经网络的高频子带能量估计算法 62-72 5.1 算法框架 62-63 5.2 高频子带能量估计的训练部分 63-67 5.2.1 低频特征参数选择 63-64 5.2.2 谱包络估计的 RBF 神经网络训练 64-67 5.3 高频子带能量估计的包络估计部分 67 5.4 性能评测 67-71 5.5 本章小结 71-72 第6章 非线性频带扩展算法在宽带音频编码器中的应用 72-80 6.1 G.722.1 与 G.722.1C 编解码框架 72-74 6.1.1 G.722.1 宽带音频编解码器框架 72-74 6.1.2 G.722.1C 超宽带音频编解码器框架 74 6.2 频带扩展算法在 G.722.1 中的应用 74-75 6.3 性能测试 75-77 6.4 本章小结 77-80 结论 80-82 参考文献 82-86 攻读硕士学位期间所发表的学术论文 86-88 攻读硕士学位期间参加的科研项目 88-90 致谢 90
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 视觉伺服四自由度机械臂的研究,TP242.6
- 机械臂视觉伺服系统的研究,TP242.6
- 压电驱动微工作台的控制与校正技术研究,TP273
- 某武器检测装置的控制系统设计,TP183
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于神经网络辨识的同步发电机励磁控制研究,TM31
- 基于BP神经网络的水稻干燥智能控制研究,S226.6
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 海上平台消防系统研究,U698.4
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|