学位论文 > 优秀研究生学位论文题录展示

关于音乐的检索研究-基于旋律的哼唱音乐检索

作 者: 王芳
导 师: 刘齐跃
学 校: 河北科技大学
专 业: 通信与信息系统
关键词: 主旋律特征 基音提取 音符切分 旋律匹配
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 15次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着多媒体及网络技术的飞速发展,多媒体信息的数据量急剧的增多,人们已经不能满足于通过歌名、歌词、演唱者等信息进行的文本检索。特别是当人们只记得歌曲的某一旋律片段时,如何快速的通过音乐旋律来检索相关音乐就成为了现在急需要解决的问题。基于旋律的哼唱检索技术现已成为当今的研究热点之一,但直到现在它还没有被广泛的推广起来。这主要是因为,现在大多数的哼唱检索系统都是基于对MIDI音频文件的检索,并且对哼唱者及哼唱环境有着严格的要求。在现实生活中,人们接触到的都是MP3格式、WMA格式及WAV格式的音乐文件,MIDI格式的音乐文件少之又少,因此如何对MP3等格式的音频文件进行哼唱检索,并且哼唱条件适用于普通大众,这就是本文解决的问题。针对上述要解决的问题,本文主要做了如下几方面的工作:1)通过对声音特征参数的分析,从中选出决定乐曲主旋律特征的参数。这一特征参数要满足:不管什么人、用什么样的方式演唱,只要音调相同,特征参数就要相同。2)由于本文要检索的是带有背景音乐的音频文件,因此本文通过对常见音符音高值算法的分析研究,提出了一种新的音符音高值算法。这种算法不但计算量小,同时也降低了背景音乐对检索工作造成的困扰。3)通过对音阶与音高间存在的特定关系的分析,在常见的旋律匹配算法的基础上,针对它们各自的优缺点提出了一种改进的字符串匹配算法,进而提高了匹配检索的准确度。4)最后在上述分析的基础上,实现了在普通环境下对MP3、WAV等不同格式的音频文件的哼唱检索,并对多种不同的情况进行了仿真实验比对及结果分析。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-15
  1.1 课题研究意义及应用前景  8-9
  1.2 国内外研究概况  9-11
  1.3 存在及要解决的问题  11-12
  1.4 课题研究方案  12-13
  1.5 论文的组织结构  13-15
第2章 匹配参数的确定  15-27
  2.1 声音的性质  15
  2.2 声音特征参数分析  15-26
    2.2.1 能量  16
    2.2.2 共振峰  16-21
    2.2.3 MFCC-Mel 倒谱系数  21-22
    2.2.4 基音  22-26
  2.3 本章小结  26-27
第3章 主旋律特征提取前的工作  27-32
  3.1 音频文件检索及格式转换  27-28
    3.1.1 音频文件检索  27-28
    3.1.2 格式转换  28
  3.2 哼唱输入模块的预处理  28-31
    3.2.1 滤波去噪  29-30
    3.2.2 加窗与分帧  30-31
  3.3 音乐数据模块的预处理  31
  3.4 本章小结  31-32
第4章 主旋律特征提取及匹配算法  32-49
  4.1 基音提取  32
  4.2 基音提取后处理  32-35
    4.2.1 能量检测  32-33
    4.2.2 过零率检测  33
    4.2.3 平滑处理  33-35
  4.3 音符切分  35-36
  4.4 音符音高算法研究  36-37
    4.4.1 常用算法  36-37
    4.4.2 本文提出的算法  37
  4.5 旋律匹配算法研究  37-41
    4.5.1 常用匹配算法  37-38
    4.5.2 改进字符串匹配算法  38-41
  4.6 实验及结果分析  41-48
  4.7 本章小结  48-49
第5章 哼唱检索系统及实验  49-60
  5.1 哼唱检索系统  49-51
    5.1.1 临时乐曲库  49
    5.1.2 反馈形式  49-50
    5.1.3 哼唱检索系统  50-51
  5.2 实验  51-57
    5.2.1 同首歌的不同段落分别哼唱检索  52-53
    5.2.2 检索节奏快背景音乐大的歌曲  53-54
    5.2.3 同一首歌存在不同的格式版本  54-55
    5.2.4 同一首歌存在不同的演唱版本  55-56
    5.2.5 同一首歌用不同的哼唱形式检索  56-57
  5.3 系统界面介绍  57-59
  5.4 本章小结  59-60
结论  60-62
参考文献  62-66
攻读硕士学位期间所发表的学术论文  66-67
致谢  67

相似论文

  1. 基于哼唱的音乐检索系统,TN912.3
  2. 基于音乐旋律匹配算法的研究,TP301.6
  3. 乐音识别跟踪系统关键技术的研究与实现,TN912.34
  4. 基于内容的MP3音乐检索研究和实现,TP391.3
  5. 基于声音样本匹配的语音应用系统技术研究,TP391.42
  6. 哼唱检索处理技术的研究,TP391.3
  7. 基于听觉神经原理的语音信号处理,TN912.3
  8. 基于哼唱的音乐检索技术研究,TP391.3
  9. 基于内容的音乐检索研究,TP391.3
  10. 基于内容的音频检索研究,TP391.3
  11. 哼唱音乐检索技术研究,TP391.3
  12. 基于旋律哼唱的音乐检索,TP391.3
  13. 超低速率语音编码算法研究,TN912.3
  14. 基于独立分量分析和基音提取技术的盲源分离,TN912.3
  15. 基于和谐泛音检测的主旋律提取技术,TP391.42
  16. 说话人识别中语音特征参数提取方法的研究,TN912.3
  17. 基于哼唱的音乐检索系统的研究与实现,TP391.3
  18. 音频指纹识别系统的设计,TP391.41
  19. 语音识别及汉语声调提取的研究和改进,TN912.34
  20. 哼唱检索中特征提取研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com