学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的音频分类技术研究与应用

作 者: 黄千
导 师: 马华东
学 校: 北京邮电大学
专 业: 计算机科学与技术
关键词: 音频特征 主向量分析 线性判别分析 支持向量机
分类号: TN912.3
类 型: 硕士论文
年 份: 2010年
下 载: 91次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着多媒体技术的发展,多媒体数据已成为信息处理领域中主要的媒体形式。其中,音频信息在多媒体信息中占有非常重要的地位。音频数据是一种非语义符号表示和非结构化的二进制数据流,缺乏对内容语义的描述和结构化的组织,给音频信息的深度处理和分析工作带来了很大的困难。如何提取音频内容的语义信息是音频信息深度处理、基于内容的检索和特定音频类别处理的关键问题。音频分类技术是解决这一问题的有效方法,是音频内容结构化的基础。本文主要研究如何选择与提取能够准确区分各种类别音频的特征参数,并选择一种有效的分类器对各种音频类别进行分类。本文对现有的音频分类技术及其应用进行充分研究,设计与实现了基于支持向量机的音频分类模块,应用于多个多媒体应用系统中。首先,本文对现有的短时音频信号处理方法进行分析;其次,研究了音频特征集构造方法,在已有的音频时域和频域特征的基础上使用PCA-LDA的方法构造音频特征集;然后,采用基于SVM的分类器,设计与实现音频分类模块;最后,将该音频分类模块嵌入到现有的自动字幕生成系统、色情信息过滤系统中。实验表明,引入PCA-LDA特征集构造方法的音频分类模块能够对音频信息进行有效分类。

全文目录


摘要  4-5
Abstract  5-9
第一章 绪论  9-17
  1.1 研究背景  9-10
  1.2 相关研究现状  10-13
    1.2.1 音频分类方法的研究现状  10-11
    1.2.2 典型的音频分类方法  11-13
  1.3 本文研究内容及其意义  13-14
  1.4 论文组织结构  14-17
第二章 音频特征提取与特征集构造方法  17-31
  2.1 音频信号概述  17-21
    2.1.1 音频编码  17-18
    2.1.2 PCM基本工作原理  18
    2.1.3 WAV音频文件  18-21
  2.2 音频特征参数提取  21-25
    2.2.1 音频时域特征提取  21-22
    2.2.2 音频频域特征提取  22-25
  2.3 音频特征集构建  25-31
    2.3.1 主分量分析方法(PCA)  25-26
    2.3.2 线性判别分析(LDA)  26-28
    2.3.3 基于PCA-LDA的音频特征集构造  28-31
第三章 基于SVM的音频分类方法  31-41
  3.1 音频分类流程  31
  3.2 支持向量机理论  31-37
    3.2.1 统计学习理论  31-33
    3.2.2 支持向量机原理  33-37
  3.3 基于SVM的音频分类  37-41
    3.3.1 支持向量机模型的训练  37-38
    3.3.2 惩罚系数的选择  38-39
    3.3.3 用支持向量机进行音频分类  39-41
第四章 原型系统设计与实现  41-49
  4.1 音频分类模块概述  41
  4.2 音频分类模块设计  41-44
    4.2.1 系统功能模块设计  41-42
    4.2.2 系统详细流程设计  42-44
  4.3 音频分类系统实现  44-49
    4.3.1 音频分类模块类结构设计  44
    4.3.2 训练音频库的准备  44-45
    4.3.3 音频特征提取  45-46
    4.3.4 PCA-LDA特征集构造方法中降维矩阵的计算求取方法  46-47
    4.3.5 基于SVM的音频分类与分类模型训练模块的实现  47-48
    4.3.6 音频分类模块实现  48-49
第五章 音频分类模块应用及性能分析  49-57
  5.1 音频分类模块在自动唱词系统中的应用  49-52
    5.1.1 自动唱词系统简介  49
    5.1.2 音频分类模块在自动唱词系统中的应用方法  49-51
    5.1.3 性能分析  51-52
  5.2 音频分类模块在色情信息过滤系统中的应用  52-57
    5.2.1 色情信息过滤系统的简介  52-53
    5.2.2 音频分类模块在色情信息过滤系统中的应用  53-55
    5.2.3 性能分析  55-57
第六章 总结与展望  57-59
  6.1 本文总结  57
  6.2 展望  57-59
参考文献  59-63
攻读硕士学位期间发表的论文  63-65
致谢  65

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com