学位论文 > 优秀研究生学位论文题录展示

音乐特征分析及其在音乐检索中的应用

作 者: 薛振武
导 师: 周军
学 校: 上海交通大学
专 业: 信号与信息处理
关键词: 基频矩阵 动态时间规整 高度动态调整 可变长搜索
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 89次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网的发展和信息时代的到来,数字音乐的数量越来越庞大。如今网上有很多站点提供音乐在线播放和下载,这些站点往往收录了成千上万甚至更多的音乐;即使是在个人电脑上,收藏的音乐通常也会有几千首。越来越多的音乐使人们获得了更为丰富的艺术体验,但同时也给音乐库的管理和检索带来了很大的困难,因此有必要研究新的智能化的音乐管理和检索方法。基于哼唱的音乐检索是一种智能化的音乐检索方法,它与传统的基于文本的检索方法有着根本的区别。本文的研究内容就是基于哼唱的音乐检索,它涉及到两个关键的问题:如何准确地从音乐中提取得到特征(通常是基音提取)以及如何准确地进行特征间的匹配(通常是使用动态时间规整算法)。在特征分析方面,基于哼唱的音乐检索绝大部分都使用了基音作为音乐的特征,所以特征分析的关键就是如何准确地从音乐中提取得到基音特征。针对背景音乐对基音提取的干扰,本文提出了一种新的基于基频矩阵的基音提取算法,该算法利用基频矩阵来进行基音提取,从各种可能的基频中找出最为可能的基频值,即使在很强的背景音乐下依然能够准确提取得到歌手唱声的基音,从而保证了检索系统的准确性。在特征匹配方面,虽然目前常用的动态时间规整算法能够实现时间对准,可以纠正哼唱输入的时间误差,但是哼唱输入除了时间误差外还有音调误差,本文对动态时间规整算法进行了改进,引入了高度(音调)动态调整,在特征匹配的过程中动态调整哼唱输入的音调高低,使之能够纠正哼唱输入的音调误差,提高了特征匹配的准确性。另外考虑到特征匹配的算法复杂度太高,本文引入了可变长搜索,它在已知匹配起点后能够一次得到匹配的长度,简化了搜索的复杂度,从而提高了检索的速度。在使用本文提出和改进的算法对2250首wav格式的音乐组成的音乐库和100首哼唱输入进行的实验中,Top 10的准确率达到87%,Top 5达到70%,Top 3达到59%,而Top 1也达到36%,证明了本文提出的基于基频矩阵的基音提取算法以及改进后的动态时间规整算法是可行而且有效的。

全文目录


摘要  5-7
ABSTRACT  7-11
第1章 绪论  11-18
  1.1 研究背景和意义  11-12
  1.2 基于哼唱的音乐检索  12-14
  1.3 基于哼唱的音乐检索的发展现状  14-16
  1.4 本文主要内容  16-18
第2章 语音信号处理基础  18-26
  2.1 语音信号产生模型  18-20
  2.2 语音信号的时域处理  20-21
  2.3 语音信号的谱分析  21-22
  2.4 语音信号的倒谱域处理  22-23
  2.5 常用的基音提取算法  23-25
  2.6 本章小结  25-26
第3章 音乐特征分析  26-41
  3.1 常用的音乐特征  26-29
  3.2 本文使用的音乐特征——基音轨迹  29
  3.3 目前常用基音提取算法的主要问题  29-32
  3.4 基于基频矩阵的基音提取方法  32-38
    3.4.1 构造基频矩阵  32-35
    3.4.2 搜索基频矩阵  35-36
    3.4.3 选出最有可能的基频  36-37
    3.4.4 基于基频矩阵的基音提取算法的流程图  37-38
  3.5 基于基频矩阵的基音提取方法性能的初步评估  38-40
    3.5.1 单帧信号的基音提取  38-39
    3.5.2 整首音乐的基音轨迹  39-40
  3.6 本章小结  40-41
第4章 音乐特征匹配  41-57
  4.1 动态时间规整算法  41-43
  4.2 动态时间规整算法的性能改进  43-49
    4.2.1 现有动态时间规整算法的不足  43-45
    4.2.2 高度动态调整  45-46
    4.2.3 高度动态调整的理论依据  46-48
    4.2.4 高度动态调整的初步评估  48-49
  4.3 音乐特征匹配算法的速度改进  49-55
    4.3.1 音乐特征匹配算法的复杂度  49-52
    4.3.2 可变长搜索  52-54
    4.3.3 使用可变长搜索后音乐特征匹配算法的复杂度  54-55
  4.4 本章小结  55-57
第5章 实验与仿真  57-67
  5.1 实验环境  57-58
  5.2 音乐特征分析实验  58-61
    5.2.1 实验目的与内容  58-59
    5.2.2 实验结果与分析  59-61
  5.3 音乐特征匹配实验  61-63
    5.3.1 高度动态调整  61-62
    5.3.2 可变长搜索  62-63
  5.4 音乐检索实验  63-66
    5.4.1 实验目的与内容  63-64
    5.4.2 实验结果与比较分析  64-66
  5.5 本章小结  66-67
第6章 总结与展望  67-70
  6.1 本文总结  67-68
  6.2 后续工作  68-70
参考文献  70-74
缩略语  74-75
致谢  75-76
攻读硕士学位期间已发表的论文  76

相似论文

  1. 基于视频的签名识别算法研究,TP391.41
  2. 移动机器人语音识别控制仿真系统的设计与实现,TN912.34
  3. 基于视频与文本信息的说话者人脸标注,TP391.41
  4. 复杂背景下基于表观模型的手势识别研究,TP391.41
  5. 基于DTW的相似度查询在完井深度计算中的应用,TE257
  6. 基于旋律的音乐检索系统设计与实现,TP391.3
  7. 基于语言混合特征的情感识别研究,TN912.3
  8. 移动机器人语音识别系统的研究与实现,TN912.34
  9. 基于元音长度调整的中文语音识别,TN912.34
  10. 基于步态加速度信号的身份认证方法研究,TN911.7
  11. 基于图像序列和压力的步态识别研究,TP391.41
  12. 基于二维步态的身份识别,TP391.41
  13. 特定人孤立词语音识别系统的ASIC设计,TN912.34
  14. 嵌入式孤立字语音识别研究,TN912.34
  15. 基于DSP的车载语音识别系统研究与实现,TN912.34
  16. 咳嗽自动分类技术研究,TN912.34
  17. 语音识别算法及其在嵌入式中的应用,TN912.34
  18. 糖尿病溃疡足压力测量软件平台设计与分析,R587.2
  19. 基于单片机的语音识别系统设计及实现,TN912.34
  20. 基于小波变换和DTW算法的ECG身份识别系统研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com