学位论文 > 优秀研究生学位论文题录展示
基于时—频分析的歌声分离
作 者: 谢秀琴
导 师: 刘若伦
学 校: 山东大学
专 业: 电路与系统
关键词: 时-频分析 歌声分离 主音高检测 听觉滤波器 计算听觉场景分析
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 161次
引 用: 3次
阅 读: 论文下载
内容摘要
为实现对大型在线音乐数据进行自动分析、组织和检索,乐音分离在近几年越来越受到人们的关注。非立体声分离是希望从单一声道的多音音乐中恢复出每一个声源/乐器声线,这是一个非常具有挑战性的问题。而本文要研究的是歌声分离,也就是从单一声道的多音音乐中将歌唱声分离出来,并且能达到较好的分离效果。概括地说,现有的非立体声乐音分离系统都是基于传统的信号处理技术(主要是正弦模型),统计技术(如稀疏编码和非负矩阵分解),或者基于心理声学的研究(计算听觉场景分析,CASA)。音乐信号是一种典型的非平稳信号,因此对于分析音乐信号,时-频(T-F)分析方法是有效的。T-F分析方法是非平稳信号处理的一个重要分支,它是利用时间和频率的联合函数来表示非平稳信号,并对其进行分析和处理。T-F分析方法按照T-F联合函数的不同可以分为线性和非线性两种。常见的线性T-F表示主要有短时傅立叶变换(STFT)、Gabor展开以及小波变换等。非线性T-F方法主要有Wigner-Ville分布(WVD)和Cohen类。此外,听觉滤波器也逐渐成为对信号进行T-F分析的重要方式。CASA研究的主要目标是分析一个听觉场景,并识别场景中的各种声音。我们也是根据CASA的思想建立了基于T-F分析的歌声分离系统。该分离系统由四个模块组成:T-F分解、主音高检测、歌声T-F信息的提取和歌声的合成。在T-F分解阶段我们采用了STFT和Gammatone滤波器两种T-F分析技术,由此设计出两种分离方法。基于STFT的歌声分离系统,在T-F分解阶段是利用STFT将输入的时域信号变换到T-F域。经过这样的处理,信号的频谱具有随时间变化的特点。基于Gammatone滤波器的歌声分离系统,是利用一个Gammatone滤波器组将输入信号分解成多个频带的时域信号,然后将每个滤波器的输出划分为重叠的帧。两种方法的主音高的检测模块是一致的。虽然基音提取的方法有很多,但是大多数乐音信号是多音信号,所以想要从多音信号中提取出歌声的音高相当困难。而我们利用乐音的谐波特性进行音高的提取。第三阶段是进行歌声T-F信息的提取。基于STFT的方法,是根据检测到的主音高,将每一帧信号的频谱中的各次谐波结构提取出来。而在基于Gammatone滤波器的方法中,除了要用到主音高,还需要计算相关图谱和交叉通道互相关,以及端点检测。最后一步,STFT方法中是对提取的歌声的短时谱进行反变换。而在第二种分离方法中,对各通道进行叠加求和就可以得到分离的歌声。
|
全文目录
摘要 8-10 ABSTRACT 10-12 第一章 绪论 12-19 1.1.课题研究的背景和意义 12-13 1.2.T-F分析的发展 13-16 1.2.1.线性T-F表示 13-14 1.2.2.非线性T-F表示 14-15 1.2.3.听觉滤波器 15-16 1.3.声音分离技术 16-17 1.4.本文的研究内容及章节安排 17-19 第二章 音乐信号的时-频分析 19-28 2.1.短时傅里叶变换 19-20 2.2.小波变换 20-22 2.3.Wigner-Ville分布 22-23 2.4.Gammatone滤波器 23 2.5.T-F分析方法的比较 23-28 第三章 主音高检测 28-39 3.1.基音检测方法介绍 28-29 3.2.DFT与NDFT的比较 29-31 3.2.1.离散傅里叶变换 29-30 3.2.2.非均匀离散傅里叶变换 30-31 3.3.基于NDFT的主音高检测 31-39 3.3.1.设计NDFT 31-33 3.3.2.计算谱包络 33-34 3.3.3.主音高的搜索 34-39 第四章 歌声分离系统 39-54 4.1.基于STFT的歌声分离 39-46 4.1.1.T-F分解 39-40 4.1.2.歌声短时谱的提取 40-43 4.1.3.歌声的合成 43-46 4.2.基于Gammatone滤波器组的歌声分离 46-53 4.2.1.T-F分解 46-47 4.2.2.听觉特征提取 47-49 4.2.3.歌声听觉T-F信息的提取 49-53 4.3.两种分离方法的比较 53-54 第五章 总结 54-56 参考文献 56-60 致谢 60-61 攻读学位期间发表的学术论文 61-62 学位论文评阅及答辩情况表 62
|
相似论文
- 高频雷达信号电离层污染及时频分析方法研究,TN958.93
- 海杂波背景下的舰船目标雷达成像算法研究,TN958
- 地波辐射源的调制类型识别与参数估计,TN957.51
- 频带熵方法及其在滚动轴承故障诊断中的应用,TH165.3
- 时频分析在RCS测试中的应用方法研究,TN953
- 扩频通信系统中的干扰抑制研究,TN914.42
- 瞬变电磁信号的预处理和激电效应识别研究,P631.325
- 航空重力测量数据滤波处理算法研究,P223
- 光学色散补偿薄膜的研究,O484.1
- 动静脉波病理特征提取与多维非线性分析方法的研究,R318.0
- 基于计算听觉场景分析的混合语音分离研究,TP391.42
- 大气压下短气隙放电过程分析,TM85
- 基于振荡神经网络的语音分离算法的研究,TN912.3
- 地球物理勘探中的数学方法,O242.1
- 多音音乐音高估计研究,TN912.3
- 音乐的时频分析与音高估计算法,O411
- 广义S变换时频分析的应用研究,TN911.7
- 基于S-Method时频分解后的高频雷达机动目标信号检测算法,TN957.51
- 基于分数傅立叶变换的纹理图像分割方法研究,TP391.41
- 直扩系统中宽带非线性调频干扰抑制技术研究,TN914.42
- 泥石流冲击信号识别方法研究,P642.23
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|