学位论文 > 优秀研究生学位论文题录展示
基于哼唱内容的音乐检索技术研究
作 者: 尹文慧
导 师: 华斌
学 校: 天津财经大学
专 业: 计算机应用技术
关键词: 哼唱检索 旋律特征 时间序列 动态时间规整
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
哼唱检索是多媒体检索中基于内容检索的一种方式。哼唱检索系统能够让用户寻找到即使他仅仅只知道部分旋律的一首歌。用户只是简单的通过电脑的麦克风哼唱出这段音调,然后系统通过查询包括这段音调的歌曲旋律数据库,返回一个查询结果的相关歌曲列表。这样用户就能从返回的结果中找到目标歌曲。大多数多媒体研究团体的研究用到了轮廓信息这个概念。旋律轮廓是连续音符在音高上的相对差异的序列。我们确实可以在听的时候用这种方法决定两个旋律的相似度。然而,提取哼唱轮廓信息是一个易错的音符切割过程,因此依靠音符切分这类系统的检索精度比较低。还有一些系统为了匹配旋律时获得高精度而大量使用动态时间规划算法造成系统检索非常耗时。本文的研究方法与之前的方法相比,不仅在检索精度上提高,在匹配速度上也有了很大提高。为了避免音符切分,本文引入时间序列的方法。把音乐当作一个时间序列,研究并改进了一些时间序列数据库的成熟技术和快速匹配音乐检索技术。分析了多音轨MIDI格式音乐旋律提取时的音轨选择方法和轮廓算法。阐述了将曲调和哼唱旋律表示为时间序列的方法,并详细说明了两个时间序列进行相似性匹配时用到的局部动态时间规整算法,提出了一个压缩检索空间的有效的检索方法,在现有的DTW算法上引入了一个通用的时间序列检索框架。最后通过实验结果证明本文的方法是高效可扩展的。
|
全文目录
内容摘要 4-5 Abstract 5-9 第1章 导论 9-16 1.1 课题研究背景及意义 9-10 1.1.1 研究背景 9 1.1.2 研究意义 9-10 1.2 国内外研究现状 10-13 1.2.1 哼唱检索国外研究现状 10-12 1.2.2 哼唱检索国内研究现状 12-13 1.3 本论文的主要研究内容和组织结构 13-14 1.3.1 研究内容 13-14 1.3.2 论文组织结构 14 1.4 本章小结 14-16 第2章 基于哼唱内容的音乐检索基础 16-26 2.1 乐理基础 16-18 2.1.1 乐理知识 16-17 2.1.2 音乐四要素 17-18 2.2 音乐格式 18-23 2.2.1 WAV格式 18-20 2.2.2 MIDI音乐格式 20-23 2.2.3 音乐文件特征比较 23 2.3 基于哼唱的音乐检索系统概述 23-25 2.3.1 系统概述 23-24 2.3.2 哼唱检索难点分析 24-25 2.4 本章小结 25-26 第3章 音频信号特征提取 26-37 3.1 MIDI文件主旋律提取 26-30 3.1.1 预处理 26-27 3.1.2 主音轨提取 27-28 3.1.3 旋律特征提取 28-30 3.2 哼唱音乐的旋律提取 30-36 3.2.1 预处理 30-31 3.2.2 基频提取和音符切分 31-36 3.3 本章小结 36-37 第4章 时间序列数据库 37-42 4.1 时间序列技术概述 37-39 4.1.1 经典时间序列方法 37-38 4.1.2 现代时间序列方法 38-39 4.2 旋律特征时间序列化 39-40 4.3 时间序列降维技术 40-41 4.4 本章小结 41-42 第5章 哼唱检索旋律匹配研究 42-58 5.1 近似旋律匹配算法 42-46 5.1.1 近似字符串匹配算法 42-43 5.1.2 基于统计模型的匹配方法 43-44 5.1.3 动态时间规整算法 44-46 5.2 基于时间序列的改进的DTW匹配算法 46-48 5.2.1 统一时间规整算法 46-47 5.2.2 K阶动态时间规整算法 47-48 5.3 在数据库上进行DTW高效检索 48-51 5.4 实验设计 51-57 5.4.1 精度实验 52-53 5.4.2 系统扩展性能 53-54 5.4.3 时间序列索引实验 54-57 5.5 本章小结 57-58 第6章 总结与展望 58-59 参考文献 59-61 后记 61
|
相似论文
- 发育于热带地区玄武岩的时间序列土壤中石英和植硅体的变化特征,S153
- 朝阳地区参考作物腾发量演变特征与预测模型研究,S161.4
- 基于混沌时间序列的桥梁变形预测分析,U441
- 基因表达时序数据聚类和比对分析方法研究,TP311.13
- 中国区域降水时空变化模式分析,P426.614
- 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
- 基于相似性分析的时间序列异常检测研究,TP311.13
- 不同发展模式下和龙市建设用地总量研究,F301
- 小数据集时间序列PS-InSAR技术及其地表沉降应用,P642.26
- 时间序列非线性分析及其应用,S11
- 关于地震余震的记录值分析,P315.63
- 基于混沌支持向量机的采动地表变形分析及预计模型研究,TD325
- 基于结构突变理论的我国GDP时间序列实证分析,F124
- 基于小波—混沌理论的CHIBOR预测模型研究,F224
- 阶梯型时间序列时域分析及应用,O211.61
- 西露天矿开采对抚顺发电有限责任公司厂区地表变形机理及预测研究,TD325
- 基于数据挖掘技术的金融指数预测,F830
- 混沌时间序列一种长期预测方法研究,O415.5
- 数字图像加密中的混沌算法研究,TP309.7
- 个人熟悉性和恐惧表情在面孔知觉过程中对杏仁核激活相互作用的fMRI研究,R445.2
- 停车诱导在智能移动终端上的设计与实现,TN929.53
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|