学位论文 > 优秀研究生学位论文题录展示

基于WEB的哼唱检索系统研究和实现

作 者: 张奕林
导 师: 华斌
学 校: 天津财经大学
专 业: 计算机应用技术
关键词: 哼唱检索 基音频率提取 旋律匹配 改进的RA算法
分类号: TP391.41
类 型: 硕士论文
年 份: 2013年
下 载: 5次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着多媒体和网络技术的快速发展,数字化的音乐产品日益增多。传统基于文本信息的检索方式,仅通过歌曲名称、歌曲的演唱者及歌词等进行音乐检索,已经不能满足人们的需求。伴随着不断扩大的音乐数量,用户难以记住所有的文本信息,面对海量信息,人们或许只记得一个旋律,或许是一个片段。因此如何快速、有效的通过哼唱旋律检索音乐信息成为一个亟待解决的问题。音乐检索相对于日渐成熟的视频与图像检索较为滞后,并逐渐成为现代多媒体检索技术领域的研究热点。基于内容的检索以一种新的角度管理音乐信息,从音乐的节奏、旋律、音高等信息中来进行检索。哼唱式音乐检索作为基于内容的检索的一个分支,它可以通过用户哼唱的方式来搜索所需要的歌曲。本文研究了一个基于web的哼唱检索系统,用户可以用哼唱的方式作为输入,系统在MIDI音乐库中进行检索匹配后返回用户哼唱的歌曲信息。本文的主要工作包括两个方面:提出一个具有一定抗噪性的完整的基音频率提取框架;改进了RA (Recursive Alignment)匹配算法。本文的哼唱检索系统在搜集的1300首MIDI音乐库上,用821首哼唱片段进行检索实验,得到TOP-10检索准确率为92.2%,通过实验证明了本文提出的基音频率提取框架和改进的RA算法的有效性。

全文目录


内容摘要  4-5
Abstract  5-9
第1章 绪论  9-17
  1.1 研究的背景与研究的意义  9-12
    1.1.1 研究背景  9-10
    1.1.2 研究意义  10-12
  1.2 国内外研究现状  12-14
  1.3 本文的研究内容  14-15
  1.4 论文组织结构  15-16
  1.5 本章小结  16-17
第2章 音频信号的特征提取  17-28
  2.1 音频信号的基本理论  17-18
  2.2 时域特征与算法  18-21
    2.2.1 短时能量(SHORT-TIME ENERGY)  19
    2.2.2 过零率(ZERO-CROSSING RATE)  19-20
    2.2.3 短时自相关函数(ACF)  20
    2.2.4 短时平均幅度差函数(AMDF)  20-21
  2.3 频域特征与算法  21
  2.4 音乐旋律基频的提取  21-23
  2.5 哼唱旋律基频的提取  23-26
    2.5.1 减谱法去噪  23-24
    2.5.2 预加重  24-25
    2.5.3 加窗与分帧  25
    2.5.4 基音检测  25-26
  2.6 本章小结  26-28
第3章 旋律匹配算法研究  28-39
  3.1 基于音符(NOTE-BASED)的匹配算法  28-30
    3.1.1 BF(BRUTE FORCE)算法  28-29
    3.1.2 KMP(KNUTH-MORRIS-PRATT)算法  29-30
    3.1.3 BM算法(BOYER-MOORE)  30
  3.2 基于帧(FRAME-BASED)的匹配算法  30-38
    3.2.1 DTW(DYNAMIC TIME WARPING)动态时间规整算法  30-32
    3.2.2 线性伸缩(LINEAR SCALING,LS)算法  32-33
    3.2.3 RA(RECURSIVE ALIGNMENT)算法  33-36
    3.2.4 改进的RA算法  36-38
  3.3 本章小结  38-39
第4章 系统实现  39-53
  4.1 系统功能和结构  39-40
  4.2 演示系统开发环境  40
  4.3 MIDI音乐特征提取模块  40-43
    4.3.1 MIDI音乐数据库的设计  42-43
  4.4 哼唱旋律特征提取模块  43-48
    4.4.1 哼唱旋律特征提取界面  47-48
  4.5 旋律匹配  48-51
    4.5.1 基音频率的后处理  48-50
    4.5.2 初步筛选和旋律匹配  50-51
  4.6 旋律匹配结果返回  51-52
  4.7 本章小结  52-53
第5章 系统实现结果和评估  53-58
  5.1 评估系统性能的参数  53-54
    5.1.1 检索准确度和MRR(MEAN RECIPROCAL RANK)  53
    5.1.2 检索消耗时间  53-54
  5.2 哼唱检索系统的性能  54-58
    5.2.1 哼唱检索系统的整体性能  54-55
    5.2.2 改进RA算法的性能  55-56
    5.2.3 基音频率提取框架的性能  56-58
  5.3 本章小结  58
第6章 结束语  58-61
  6.1 工作总结  58-59
  6.2 问题与展望  59-61
参考文献  61-64
后记  64

相似论文

  1. 基于哼唱的音乐检索系统,TN912.3
  2. 一种哼唱检索算法的研究,TP391.3
  3. 用改进人工蜂群算法优化基于内容的哼唱音乐检索系统,TP391.3
  4. 基于哼唱的音乐检索系统,TP391.3
  5. 基于哼唱的歌曲检索系统的研究与设计,TP391.3
  6. 基于音乐旋律匹配算法的研究,TP301.6
  7. 乐音识别跟踪系统关键技术的研究与实现,TN912.34
  8. 基于音乐旋律的特征聚类算法研究及其应用,TP311.13
  9. 基于内容的音乐检索关键技术研究,TP391.3
  10. 基于内容的MP3音乐检索研究和实现,TP391.3
  11. 基于内容的音乐检索技术研究与实现,TP391.3
  12. 基于内容的音乐检索研究,TP391.3
  13. 哼唱检索处理技术的研究,TP391.3
  14. 基于哼唱的音乐检索技术研究,TP391.3
  15. 基于内容的音乐检索研究,TP391.3
  16. 音乐旋律自动抽取与哼唱检索系统关键技术研究,TP391.3
  17. 哼唱音乐检索技术研究,TP391.3
  18. 基于旋律哼唱的音乐检索,TP391.3
  19. HMM模型在哼唱检索中的应用,TP391.3
  20. 基于重复模式的连续哼唱输入音乐检索研究,TN912.3
  21. 音乐旋律快速匹配技术的研究,TP391.4

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com