学位论文 > 优秀研究生学位论文题录展示

基于时—频分析的歌声分离

作 者: 谢秀琴
导 师: 刘若伦
学 校: 山东大学
专 业: 电路与系统
关键词: 时-频分析 歌声分离 主音高检测 听觉滤波器 计算听觉场景分析
分类号: TN912.3
类 型: 硕士论文
年 份: 2009年
下 载: 161次
引 用: 3次
阅 读: 论文下载
 

内容摘要


为实现对大型在线音乐数据进行自动分析、组织和检索,乐音分离在近几年越来越受到人们的关注。非立体声分离是希望从单一声道的多音音乐中恢复出每一个声源/乐器声线,这是一个非常具有挑战性的问题。而本文要研究的是歌声分离,也就是从单一声道的多音音乐中将歌唱声分离出来,并且能达到较好的分离效果。概括地说,现有的非立体声乐音分离系统都是基于传统的信号处理技术(主要是正弦模型),统计技术(如稀疏编码和非负矩阵分解),或者基于心理声学的研究(计算听觉场景分析,CASA)。音乐信号是一种典型的非平稳信号,因此对于分析音乐信号,时-频(T-F)分析方法是有效的。T-F分析方法是非平稳信号处理的一个重要分支,它是利用时间和频率的联合函数来表示非平稳信号,并对其进行分析和处理。T-F分析方法按照T-F联合函数的不同可以分为线性和非线性两种。常见的线性T-F表示主要有短时傅立叶变换(STFT)、Gabor展开以及小波变换等。非线性T-F方法主要有Wigner-Ville分布(WVD)和Cohen类。此外,听觉滤波器也逐渐成为对信号进行T-F分析的重要方式。CASA研究的主要目标是分析一个听觉场景,并识别场景中的各种声音。我们也是根据CASA的思想建立了基于T-F分析的歌声分离系统。该分离系统由四个模块组成:T-F分解、主音高检测、歌声T-F信息的提取和歌声的合成。在T-F分解阶段我们采用了STFT和Gammatone滤波器两种T-F分析技术,由此设计出两种分离方法。基于STFT的歌声分离系统,在T-F分解阶段是利用STFT将输入的时域信号变换到T-F域。经过这样的处理,信号的频谱具有随时间变化的特点。基于Gammatone滤波器的歌声分离系统,是利用一个Gammatone滤波器组将输入信号分解成多个频带的时域信号,然后将每个滤波器的输出划分为重叠的帧。两种方法的主音高的检测模块是一致的。虽然基音提取的方法有很多,但是大多数乐音信号是多音信号,所以想要从多音信号中提取出歌声的音高相当困难。而我们利用乐音的谐波特性进行音高的提取。第三阶段是进行歌声T-F信息的提取。基于STFT的方法,是根据检测到的主音高,将每一帧信号的频谱中的各次谐波结构提取出来。而在基于Gammatone滤波器的方法中,除了要用到主音高,还需要计算相关图谱和交叉通道互相关,以及端点检测。最后一步,STFT方法中是对提取的歌声的短时谱进行反变换。而在第二种分离方法中,对各通道进行叠加求和就可以得到分离的歌声。

全文目录


摘要  8-10
ABSTRACT  10-12
第一章 绪论  12-19
  1.1.课题研究的背景和意义  12-13
  1.2.T-F分析的发展  13-16
    1.2.1.线性T-F表示  13-14
    1.2.2.非线性T-F表示  14-15
    1.2.3.听觉滤波器  15-16
  1.3.声音分离技术  16-17
  1.4.本文的研究内容及章节安排  17-19
第二章 音乐信号的时-频分析  19-28
  2.1.短时傅里叶变换  19-20
  2.2.小波变换  20-22
  2.3.Wigner-Ville分布  22-23
  2.4.Gammatone滤波器  23
  2.5.T-F分析方法的比较  23-28
第三章 主音高检测  28-39
  3.1.基音检测方法介绍  28-29
  3.2.DFT与NDFT的比较  29-31
    3.2.1.离散傅里叶变换  29-30
    3.2.2.非均匀离散傅里叶变换  30-31
  3.3.基于NDFT的主音高检测  31-39
    3.3.1.设计NDFT  31-33
    3.3.2.计算谱包络  33-34
    3.3.3.主音高的搜索  34-39
第四章 歌声分离系统  39-54
  4.1.基于STFT的歌声分离  39-46
    4.1.1.T-F分解  39-40
    4.1.2.歌声短时谱的提取  40-43
    4.1.3.歌声的合成  43-46
  4.2.基于Gammatone滤波器组的歌声分离  46-53
    4.2.1.T-F分解  46-47
    4.2.2.听觉特征提取  47-49
    4.2.3.歌声听觉T-F信息的提取  49-53
  4.3.两种分离方法的比较  53-54
第五章 总结  54-56
参考文献  56-60
致谢  60-61
攻读学位期间发表的学术论文  61-62
学位论文评阅及答辩情况表  62

相似论文

  1. 高频雷达信号电离层污染及时频分析方法研究,TN958.93
  2. 海杂波背景下的舰船目标雷达成像算法研究,TN958
  3. 地波辐射源的调制类型识别与参数估计,TN957.51
  4. 频带熵方法及其在滚动轴承故障诊断中的应用,TH165.3
  5. 时频分析在RCS测试中的应用方法研究,TN953
  6. 扩频通信系统中的干扰抑制研究,TN914.42
  7. 瞬变电磁信号的预处理和激电效应识别研究,P631.325
  8. 航空重力测量数据滤波处理算法研究,P223
  9. 光学色散补偿薄膜的研究,O484.1
  10. 动静脉波病理特征提取与多维非线性分析方法的研究,R318.0
  11. 基于计算听觉场景分析的混合语音分离研究,TP391.42
  12. 大气压下短气隙放电过程分析,TM85
  13. 基于振荡神经网络的语音分离算法的研究,TN912.3
  14. 地球物理勘探中的数学方法,O242.1
  15. 多音音乐音高估计研究,TN912.3
  16. 音乐的时频分析与音高估计算法,O411
  17. 广义S变换时频分析的应用研究,TN911.7
  18. 基于S-Method时频分解后的高频雷达机动目标信号检测算法,TN957.51
  19. 基于分数傅立叶变换的纹理图像分割方法研究,TP391.41
  20. 直扩系统中宽带非线性调频干扰抑制技术研究,TN914.42
  21. 泥石流冲击信号识别方法研究,P642.23

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com