学位论文 > 优秀研究生学位论文题录展示

基于旋律哼唱的音乐检索

作 者: 谭瑞东
导 师: 孙怡
学 校: 大连理工大学
专 业: 通信与信息系统
关键词: 音乐哼唱检索 基音提取 特征表达 匹配检索
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 164次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络技术和多媒体技术的迅速发展,大量的多媒体信息都可以从网上获得。其中,音频作为多媒体中的一种重要媒体,其数据量也在迅速增长。因此,如何方便快捷的找到想要的音乐已经成为了一个突出的问题。而利用旋律哼唱进行检索显然是一种非常理想的方法,在近年来也引起了众多研究者的兴趣。作为基于内容音乐检索的一个分支,基于旋律哼唱的音乐检索是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,在网络音乐共享以及生活娱乐方面都具有非常重要的意义。本文在该领域主要进行了五个方面的工作,其中包括:(1)通过对音乐信号基本理论的研究,提出了利用音高差和音长比表现音乐旋律的方法。与仅利用音高差对旋律特征进行表达的传统方法相比,该方法对旋律的变化特征进行了更好的描述,因此准确性也更高。(2)总结了从MIDI文件中提取音符音高和音长等音乐旋律特征的优点,确定MIDI格式作为数据库音乐的文件存储格式,并实现了在MIDI文件中确定主旋律的算法。(3)提出了在哼唱音乐片段处理过程中,信号预处理、基音提取、特征后处理、音符切分等相关步骤的具体实现方法。同时考虑了人们的哼唱习惯和实际处理中碰到的问题,使得对哼唱音乐的处理更加准确。(4)提出了基于校正距离矩阵的特征匹配算法,计算了哼唱音乐与数据库音乐音高差和音长比的相关度,并将结果排序后返回给用户。(5)分析了实验中对结果产生影响的各种因素,总结了系统的优点和缺点,并在实验环境、检索时间和命中率等方面与其它算法进行了比较。哼唱音乐检索系统的研究具有广泛的理论研究价值和实际应用价值。人们希望计算机能够理解音乐,因此本文的工作是在该领域的一次有益探索。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-16
  1.1 音乐哼唱检索的研究意义  9
  1.2 音乐哼唱检索的发展及研究概况  9-11
  1.3 音乐检测技术相关理论  11-15
    1.3.1 声音信号的短时平稳性  11-12
    1.3.2 共振腔影响  12
    1.3.3 特征旋律表达  12-13
    1.3.4 声音信号数字化存储  13-14
    1.3.5 音乐哼唱检索系统组成  14-15
  1.4 本文主要工作及论文安排  15-16
2 数据库音频文件的特征提取  16-22
  2.1 数据库音乐的存储方式  16-18
  2.2 MIDI音乐文件格式分析  18-19
  2.3 MIDI文件旋律特征提取  19-21
    2.3.1 确定主旋律  19-20
    2.3.2 提取音乐旋律特征  20-21
    2.3.3 生成特征文件  21
  2.4 本章小结  21-22
3 哼唱音乐的特征提取  22-34
  3.1 音乐信号预处理  22-24
  3.2 音乐信号基音提取  24-29
  3.3 基音提取后处理  29-31
    3.3.1 能量检测  30
    3.3.2 过零率检测  30-31
    3.3.3 中值平滑滤波  31
  3.4 音符切分  31-32
  3.5 特征参数计算  32-33
  3.6 本章小结  33-34
4 旋律特征的匹配检索  34-41
  4.1 字符串匹配算法分析  34-37
    4.1.1 精确匹配检索  34-36
    4.1.2 模糊匹配检索  36-37
  4.2 基于校正距离矩阵的旋律模糊匹配  37-40
    4.2.1 右对齐匹配  37
    4.2.2 校正距离矩阵的含义与计算方法  37-40
    4.2.3 相关度计算  40
  4.3 本章小结  40-41
5 实验分析  41-46
  5.1 哼唱音乐检索系统架构  41
  5.2 系统实验结果分析  41-45
    5.2.1 实验前的考虑  41-42
    5.2.2 实验环境  42-43
    5.2.3 实验结果和数据分析  43
    5.2.4 实验结果比较  43-45
  5.3 本章小结  45-46
6 结论与展望  46-47
参考文献  47-49
附录A 语音信号线性预测分析  49-51
攻读硕士学位期间发表学术论文情况  51-52
致谢  52-53

相似论文

  1. 两个与棉纤维发育相关基因的克隆与鉴定及七个与脂肪酸代谢相关基因的表达分析,S562
  2. 基于听觉神经原理的语音信号处理,TN912.3
  3. 基于独立分量分析和基音提取技术的盲源分离,TN912.3
  4. 基于语义网络的病理诊断案例表示及不确定性研究,TP399
  5. 基于内容的智能图像检索技术,TP391.3
  6. WEB海事案例库及语义匹配研究,U692
  7. 汉语连续语音三字词基音提取及声调识别,TN912.3
  8. 结合语音识别技术的音乐哼唱检索研究,TN912.3
  9. 说话人识别中语音特征参数提取方法的研究,TN912.3
  10. 基于部件的软件重用技术研究,TP311.52
  11. 基于骨架的目标表示和识别技术研究,TP391.41
  12. 鲁棒语音识别技术的研究,TN912.34
  13. 趋向补语研究及其偏误分析,H146
  14. 文昌鱼cathepsin、β-MSP和allantoicase基因的特征、表达和进化研究,Q951
  15. 大豆、拟南芥持绿基因的克隆、表达调控及功能研究,S565.1
  16. 三维模型的表达、分析及其在三维仿真与模型检索中的应用,TP391.41
  17. 基于局部特征表达的高分辨率SAR图像城区场景分类方法研究,TN957.52
  18. 水稻新型硝酸盐转运蛋白基因OsTNrt2.1的克隆、表达和遗传转化,S511
  19. 数字化舞蹈艺术的特征表达与视频检索技术,TP399
  20. 混合交通中运动目标特征表达与分类算法研究,U491.262

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com