学位论文 > 优秀研究生学位论文题录展示
基于内容的音乐检索关键技术研究
作 者: 苏启院
导 师: 韩国强;袁华强
学 校: 华南理工大学
专 业: 计算机应用技术
关键词: 哼唱检索 音乐旋律 基音周期检测 近似匹配 DTW算法
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 65次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机网络技术和多媒体技术的快速发展,音乐信息的数据量急剧增长。如何从浩瀚的音乐数据中快速准确地找到想要的音乐已成为现代信息检索领域的一个热门的研究课题。传统的基于文本的音乐检索只能通过输入歌曲名或演唱者名等信息进行检索,已无法满足人们对音乐检索的需求。基于内容的检索允许用户通过哼唱的形式来检索所需的歌曲,用户即使忘记歌曲名或演唱者名等信息,只要他能哼唱出歌曲的部分片断就能找到所要的歌曲。这种新型的人机接口,对于音乐检索有着巨大的现实意义,也越来越受到学者、开发商和广大用户们的注意。本文以国家自然科学基金项目“三维戏曲动画合成技术研究(NO.U0935003)”为背景,针对哼唱检索涉及的关键技术进行研究,主要包括:音乐旋律特征的表达、音乐旋律特征的提取、音乐旋律的匹配。在分析音乐的本质特征和音乐旋律表示方法的基础上,提出了一种改进的综合使用音高差和音长比的二元旋律特征表示法。该方法能够较准确地表示音乐信号中旋律特征,并具有较好的检索精度。在音乐旋律特征的提取上,通过对传统基因周期检测技术的分析,发现传统基因周期检测技术存在各种各样的缺陷。针对这些缺陷本文进行基因周期检测时,先对原始语音信号进行多级小波变换,将较高几个层次上的逼近信号进行加权求和处理,然后再结合自相关函数法和平均幅度差函数法对合成后的信号进行基音周期检测。并对男女声信号采用了不同的加权系数,使两种信号都能得到光滑的旋律轮廓曲线。在旋律匹配检索模块中,本文提出了一种数值索引的方式,对旋律特征库中的音高差值信息建立索引,并在此基础上设计了一个旋律匹配算法。最后本文设计了一个简单的基于哼唱的音乐检索系统,通过详细的实验证明了本文提出方法的有效性和可行性。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第一章 绪论 10-16 1.1 研究的背景和意义 10-11 1.2 国内外研究现状 11-13 1.3 本文的研究内容和成果 13-14 1.4 论文的组织结构 14-16 第二章 音乐旋律特征表示方法研究 16-29 2.1 基本乐理知识 16-19 2.2 音乐信号的特征 19-23 2.2.1 时域特征 20-22 2.2.2 频域特征 22-23 2.2.3 声学感知特征 23 2.3 WAV音乐及其格式 23-25 2.3.1 WAV文件介绍 23 2.3.2 WAV文件结构 23-25 2.4 音乐旋律的表示方法 25-27 2.4.1 常见的音乐旋律表示方法 25-27 2.4.2 本文的音乐旋律表示方法 27 2.5 本章小结 27-29 第三章 音乐旋律特征提取方法研究 29-43 3.1 传统的基音周期检测方法 29-35 3.1.1 自相关函数法(ACF) 29-32 3.1.2 平均幅度差函数法(AMDF) 32-33 3.1.3 小波变换法(DWT) 33-35 3.1.4 传统的基音周期检测方法的优势和不足 35 3.2 本文的基音周期检测技术 35-40 3.2.1 算法的原理介绍 35-36 3.2.2 基音周期检测流程 36-40 3.3 哼唱音乐旋律特征的提取 40-42 3.4 后台音乐旋律特征的提取 42 3.5 本章总结 42-43 第四章 音乐旋律匹配算法研究 43-59 4.1 经典的旋律匹配算法 43-50 4.1.1 字符串近似匹配算法 43-45 4.1.2 基于统计模型的算法 45 4.1.3 线性对齐匹配算法 45-46 4.1.4 动态时间规整算法 46-50 4.2 本文的旋律匹配算法 50-58 4.2.1 动态时间规整算法的改进 50-52 4.2.2 基于R-tree数值索引的旋律匹配算法 52-58 4.2.2.1 数值转换函数 52-53 4.2.2.2 数值索引的构建 53-56 4.2.2.3 旋律匹配算法 56-58 4.3 本章小结 58-59 第五章 系统设计和实验分析 59-67 5.1 系统结构设计 59-61 5.2 基音周期检测实验 61-63 5.3 DTW匹配算法实验 63-64 5.4 系统实验结果和分析 64-66 5.5 本章小结 66-67 总结和展望 67-69 本文结论 67 研究展望 67-69 参考文献 69-72 攻读硕士学位期间取得的研究成果 72-73 致谢 73
|
相似论文
- 近似字符串匹配研究及其在URL检测中的应用,TP393.08
- 基于哼唱的音乐检索系统,TN912.3
- 一种哼唱检索算法的研究,TP391.3
- 基于XML的元数据近似匹配模型研究,TP312
- 基音周期检测算法研究及在语音合成中的应用,TN912.3
- 基于多带激励模型的低速率语音编码技术研究,TN912.3
- 婴儿啼哭声的特征分析与识别,TN912.34
- 基于LB_Hust距离的时间序列数据聚类,TP311.13
- 基于哼唱的音乐检索系统,TP391.3
- 用改进人工蜂群算法优化基于内容的哼唱音乐检索系统,TP391.3
- 基于内容的音乐检索关键技术研究,TP391.3
- 知识化制造系统自重构的研究,TH166
- 大规模特征串匹配技术的研究,TP393.08
- HMM模型在哼唱检索中的应用,TP391.3
- 基于旋律哼唱的音乐检索,TP391.3
- 音乐旋律自动抽取与哼唱检索系统关键技术研究,TP391.3
- 哼唱检索处理技术的研究,TP391.3
- 结合语音识别技术的音乐哼唱检索研究,TN912.3
- 基于内容的音乐检索研究,TP391.3
- 基于哼唱的音乐检索技术研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|