学位论文 > 优秀研究生学位论文题录展示

基于和谐泛音检测的主旋律提取技术

作 者: 张俊杰
导 师: 吴亚栋
学 校: 上海交通大学
专 业: 语音识别
关键词: 基于内容的音乐检索 哼唱检索 基于和谐泛音检测的主旋律提取 能量突出度检测 两阶段音符切分
分类号: TP391.42
类 型: 硕士论文
年 份: 2007年
下 载: 264次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着音乐媒体信息的持续增长,在海量音乐数据库中检索变得越来越困难,这种趋势对音乐信息检索提出了更高的要求。现有的网上音乐检索局限于分类浏览和基于文字的查找功能。基于内容的音乐检索(CMR: Content-based Music Retrieval)这一技术,尤其是哼唱检索(QBH: Query By Humming),作为一种传统文字检索所无法替代的检索手段,也越来越受到学者、开发商和广大用户们的注意。哼唱检索是属基于内容的音乐检索的一种方式,该方式允许用户通过哼唱的形式来检索所需的歌曲。为了找到一首歌曲,用户即使记不住曲名或者歌手名也不要紧,他还可以通过哼唱片断旋律找到所要的歌曲。这种新型的人机接口,对于在互联网上实现基于内容的音乐检索有着巨大的现实意义。经过本实验室的多年努力,我们已经构建起了一套行之有效的哼唱检索系统。该系统能够接受多种方式的哼唱输入,检索速度快,搜索准确率高。但是也存在一定的局限性,比如乐曲库只能接受单音轨MIDI格式的音乐文件,对于那些多音轨MIDI、多音混合MP3等压缩文件格式以及wav等非压缩文件格式的音频数据,读取其主旋律仍是一个待开发的领域,需要进一步研究。本文针对多音轨混合音wav格式的音频文件,提出了一种基于和谐泛音检测的主旋律提取算法。该算法应用了泛音的概念,在音频信号的频谱中检测泛音显著度,通过分析泛音显著度指标计算得到多音音频的主基频。通过对多音轨MIDI格式文件转成的

全文目录


摘要  5-7
ABSTRACT  7-11
第一章 前言  11-15
  1.1 研究动机  11-12
  1.2 参与项目背景  12-13
  1.3 研究内容概述  13-14
  1.4 我的工作  14-15
第二章 基于内容的音乐检索综述  15-25
  2.1 研究综述  15-18
  2.2 基于内容的音乐检索小结  18-20
    2.2.1 三个关键问题  18
    2.2.2 解决方案  18-19
    2.2.3 我们的系统构架  19-20
  2.3 音高检测(PITCH DETECTION)  20-23
    2.3.1 时域检测  20-23
    2.3.2 频域检测  23
    2.3.3 基于人耳模式的检测方法  23
  2.4 研究目标  23-25
第三章 基于和谐泛音检测的主旋律提取  25-47
  3.1 哼唱检索引擎概述  25-26
  3.2 旋律提取模块  26-38
    3.2.1 一些基本概念  26-29
    3.2.2 泛音分析  29-31
    3.2.3 基于和谐泛音检测的主旋律提取  31-38
  3.3 旋律表示  38-39
  3.4 旋律匹配  39-41
  3.5 乐曲模板库的构造  41-42
  3.6 哼唱检索引擎的对外接口  42-47
    3.6.1 C 语言API 接口  42-43
    3.6.2 命令行接口  43-44
    3.6.3 基于和谐泛音检测的主旋律提取接口  44-47
第四章 实验与分析  47-58
  4.1 基于和谐泛音检测的主基频提取实验  48-52
    4.1.1 测试环境  48
    4.1.2 测试数据  48
    4.1.3 测试结果  48-52
  4.2 主旋律提取实验  52-58
    4.2.1 测试环境  52
    4.2.2 测试数据  52
    4.2.3 测试衡量指标  52-53
    4.2.4 测试结果  53-54
    4.2.5 一些实验结果对比图  54-58
第五章 总结和展望  58-60
参考文献  60-63
致谢  63-65
攻读硕士学位期间已发表或录用的论文  65

相似论文

  1. 基于哼唱的音乐检索系统,TN912.3
  2. 一种哼唱检索算法的研究,TP391.3
  3. 基于内容的MP3音乐检索研究和实现,TP391.3
  4. 基于声谱图的音乐检索,TP391.3
  5. 基于内容的音乐检索研究,TP391.3
  6. 基于内容的音乐检索系统研究,TP391.42
  7. 基于重复模式的连续哼唱输入音乐检索研究,TN912.3
  8. 音乐旋律快速匹配技术的研究,TP391.4
  9. 基于哼唱的音乐检索技术研究与实现,TP391.3
  10. 智能计算及应用研究,TP18
  11. 基于内容的相关反馈式音乐检索方法研究,TN912.3
  12. 基于内容的音乐检索关键技术研究,TP391.3
  13. 结合语音识别技术的音乐哼唱检索研究,TN912.3
  14. 基于Web的音乐哼唱检索关键技术研究,TP391.3
  15. 基于哼唱的MP3音乐检索研究,TP391.42
  16. 音乐哼唱检索关键技术研究,TN912.3
  17. 基于哼唱的音乐检索技术研究,TP391.3
  18. 基于内容的音乐检索研究,TP391.3
  19. 基于内容的音乐检索技术研究与实现,TP391.3
  20. 基于内容的音乐检索关键技术研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com