学位论文 > 优秀研究生学位论文题录展示
基于多标签分类法的和弦音乐的音色识别
作 者: 陈艮生
导 师: 胡荷芬
学 校: 上海师范大学
专 业: 计算机应用技术
关键词: 多标签分类器 机器学习 和弦音乐 音色识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 50次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,随着在线音乐库的蓬勃发展,用户希望通过自动索引方式找到他们喜爱的音乐,通过音乐来舒缓现代社会快节奏、高竞争压力下的心境和情绪,已经成为一种时尚。音色识别,是音乐信息检索的主要任务之一。因为同一音乐用不同的乐器来演奏或合奏,会带给听众不同的感觉和效果。人们按照自己的喜好选择不同乐器的音乐旋律,这种需求正在不断的增长。由此,音色识别已成为计算机音乐检索领域中的研究方向之一。许多传统的声学特征提取方法已经成功的应用在独奏乐器的音色识别领域中。令人遗憾的是,这些独奏乐器的音色评估算法显然不能适用于现实音乐环境中的和弦音乐的音色识别。因此,对和弦音乐进行音色识别具有重要的现实意义,但也存在一定的难度,特别是当音色相近的乐器合奏产生谐波互相重叠,区分音色的难度会更大。从音频文件中,识别由多种乐器演奏的声音对音乐检索是非常有效的,对自动索引和浏览音乐数据也是非常有帮助的。这也激励人们在音色分类以及基于内容的音乐信息检索方面进行更多的研究。本文首先介绍了音乐背景知识以及研究的现状与目标,参考了MPEG-7的音色特征值标准,增加了时间属性,提出了新的时域特征值。实验表明,用了新的时域特征值与传统特征值进行比较,在乐器分类的正确分类数和置信度上有一定提高。然后分析了独奏音乐分类算法优缺点,并对和弦音乐音色的多标签分类问题进行了研究,利用了传统的多标签分类法和决策树算法,提出了这两类算法的组合算法,即基于多标签决策树(ML-Decision Tree)的分类算法,实验结果表明,基于多标签决策树(ML-Decision Tree)的分类算法比单标签分类法的识别率有一定提高。又利用了传统的多标签分类法和K最近邻算法,提出了这两类算法的组合算法,即基于多标签K最近邻居算法(ML-KNN)分类算法,实验结果表明,基于多标签K最近邻居算法(ML-KNN)分类算法比基于多标签决策树(ML-Decision Tree)的分类算法的识别率有一定提高。
|
全文目录
中文摘要 4-6 Abstract 6-10 第一章 绪论 10-20 1.1 引言 10 1.2 研究背景 10-14 1.2.1 音乐术语 11-12 1.2.2 音频的存储方式 12-13 1.2.3 多标签分类 13-14 1.3 研究现状及目标 14-17 1.3.1 音乐检索的现状 14-15 1.3.2 多标签分类的研究现状 15-16 1.3.3 研究目标 16-17 1.4 音色识别的应用 17-18 1.5 本人的主要工作和创新点 18-19 1.6 课题来源 19 1.7 论文章节安排 19-20 第二章 音色特征库 20-31 2.1.M PEG-7 标准以及相关知识 20-23 2.1.1 基本频谱(BASIC SPECTRAL) 20-21 2.1.2 时域音色(TIMBRAL TEMPORAL) 21-22 2.1.3 频谱音色(TIMBRAL SPECTRAL) 22 2.1.4 频谱基底(SPECTRAL BASIS) 22-23 2.2 新的时域音色特征的设计 23-30 2.2.1 帧的预处理 23-24 2.2.2 新的时域音色特征 24-25 2.2.3 实验 25-30 2.3 本章小结 30-31 第三章 基于多标签决策树分类算法的和弦音乐音色识别 31-44 3.1 独奏音乐的分类算法 31-32 3.2 基于多标签决策树分类算法的基本框架 32-36 3.2.1 多标签分类法 32-33 3.2.2 多标签决策树分类算法 33-36 3.3 ML-DECISION TREE算法 36-37 3.4 多标签分类法的性能评价准则 37-38 3.5 实验过程与分析 38-40 3.6 实验结果 40-43 3.7 本章小结 43-44 第四章 基于多标签K-最近邻分类算法的和弦音乐音色识别 44-50 4.1 基于多标签K-最近邻分类算法的基本框架 44-46 4.1.1 K-最近邻(KNN) 44-45 4.1.2 基于多标签K-最近邻分类算法 45-46 4.2 ML-KNN 算法 46-47 4.3 实验过程与分析 47-48 4.4 本章小结 48-50 第五章 总结 50-52 5.1 工作总结 50 5.2 工作展望 50-52 致谢 52-53 参考文献 53-56 攻读硕士学位期间发表的论文和科研项目 56
|
相似论文
- 基于数据分布特征的文本分类研究,TP391.1
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
- 社会化网络中的推荐算法及其应用,TP391.3
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于统计与图模型的若干机器学习算法及其应用,TP181
- P2P流量识别方法研究,TP393.06
- 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
- 基于SIFT特征和SVM的场景分类,TP391.41
- 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
- 随机森林特征选择,TP311.13
- 互联网流量应用基准分类技术的研究,TP393.06
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
- 弥散张量成像的脑连接模式分析,R445.2
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|