学位论文 > 优秀研究生学位论文题录展示
基于和谐泛音检测的主旋律提取技术
作 者: 张俊杰
导 师: 吴亚栋
学 校: 上海交通大学
专 业: 语音识别
关键词: 基于内容的音乐检索 哼唱检索 基于和谐泛音检测的主旋律提取 能量突出度检测 两阶段音符切分
分类号: TP391.42
类 型: 硕士论文
年 份: 2007年
下 载: 264次
引 用: 2次
阅 读: 论文下载
内容摘要
随着音乐媒体信息的持续增长,在海量音乐数据库中检索变得越来越困难,这种趋势对音乐信息检索提出了更高的要求。现有的网上音乐检索局限于分类浏览和基于文字的查找功能。基于内容的音乐检索(CMR: Content-based Music Retrieval)这一技术,尤其是哼唱检索(QBH: Query By Humming),作为一种传统文字检索所无法替代的检索手段,也越来越受到学者、开发商和广大用户们的注意。哼唱检索是属基于内容的音乐检索的一种方式,该方式允许用户通过哼唱的形式来检索所需的歌曲。为了找到一首歌曲,用户即使记不住曲名或者歌手名也不要紧,他还可以通过哼唱片断旋律找到所要的歌曲。这种新型的人机接口,对于在互联网上实现基于内容的音乐检索有着巨大的现实意义。经过本实验室的多年努力,我们已经构建起了一套行之有效的哼唱检索系统。该系统能够接受多种方式的哼唱输入,检索速度快,搜索准确率高。但是也存在一定的局限性,比如乐曲库只能接受单音轨MIDI格式的音乐文件,对于那些多音轨MIDI、多音混合MP3等压缩文件格式以及wav等非压缩文件格式的音频数据,读取其主旋律仍是一个待开发的领域,需要进一步研究。本文针对多音轨混合音wav格式的音频文件,提出了一种基于和谐泛音检测的主旋律提取算法。该算法应用了泛音的概念,在音频信号的频谱中检测泛音显著度,通过分析泛音显著度指标计算得到多音音频的主基频。通过对多音轨MIDI格式文件转成的
|
全文目录
摘要 5-7 ABSTRACT 7-11 第一章 前言 11-15 1.1 研究动机 11-12 1.2 参与项目背景 12-13 1.3 研究内容概述 13-14 1.4 我的工作 14-15 第二章 基于内容的音乐检索综述 15-25 2.1 研究综述 15-18 2.2 基于内容的音乐检索小结 18-20 2.2.1 三个关键问题 18 2.2.2 解决方案 18-19 2.2.3 我们的系统构架 19-20 2.3 音高检测(PITCH DETECTION) 20-23 2.3.1 时域检测 20-23 2.3.2 频域检测 23 2.3.3 基于人耳模式的检测方法 23 2.4 研究目标 23-25 第三章 基于和谐泛音检测的主旋律提取 25-47 3.1 哼唱检索引擎概述 25-26 3.2 旋律提取模块 26-38 3.2.1 一些基本概念 26-29 3.2.2 泛音分析 29-31 3.2.3 基于和谐泛音检测的主旋律提取 31-38 3.3 旋律表示 38-39 3.4 旋律匹配 39-41 3.5 乐曲模板库的构造 41-42 3.6 哼唱检索引擎的对外接口 42-47 3.6.1 C 语言API 接口 42-43 3.6.2 命令行接口 43-44 3.6.3 基于和谐泛音检测的主旋律提取接口 44-47 第四章 实验与分析 47-58 4.1 基于和谐泛音检测的主基频提取实验 48-52 4.1.1 测试环境 48 4.1.2 测试数据 48 4.1.3 测试结果 48-52 4.2 主旋律提取实验 52-58 4.2.1 测试环境 52 4.2.2 测试数据 52 4.2.3 测试衡量指标 52-53 4.2.4 测试结果 53-54 4.2.5 一些实验结果对比图 54-58 第五章 总结和展望 58-60 参考文献 60-63 致谢 63-65 攻读硕士学位期间已发表或录用的论文 65
|
相似论文
- 基于哼唱的音乐检索系统,TN912.3
- 一种哼唱检索算法的研究,TP391.3
- 基于内容的MP3音乐检索研究和实现,TP391.3
- 基于声谱图的音乐检索,TP391.3
- 基于内容的音乐检索研究,TP391.3
- 基于内容的音乐检索系统研究,TP391.42
- 基于重复模式的连续哼唱输入音乐检索研究,TN912.3
- 音乐旋律快速匹配技术的研究,TP391.4
- 基于哼唱的音乐检索技术研究与实现,TP391.3
- 智能计算及应用研究,TP18
- 基于内容的相关反馈式音乐检索方法研究,TN912.3
- 基于内容的音乐检索关键技术研究,TP391.3
- 结合语音识别技术的音乐哼唱检索研究,TN912.3
- 基于Web的音乐哼唱检索关键技术研究,TP391.3
- 基于哼唱的MP3音乐检索研究,TP391.42
- 音乐哼唱检索关键技术研究,TN912.3
- 基于哼唱的音乐检索技术研究,TP391.3
- 基于内容的音乐检索研究,TP391.3
- 基于内容的音乐检索技术研究与实现,TP391.3
- 基于内容的音乐检索关键技术研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com
|