学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的蒙古语语音端点检测方法研究

作 者: 朝木日乐格
导 师: 张泽
学 校: 内蒙古大学
专 业: 控制工程
关键词: 蒙古语语音信号 端点检测 支持向量机 特征参数 Mel频率倒谱系数
分类号: TN912.3
类 型: 硕士论文
年 份: 2011年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络技术和多媒体技术的发展,语音技术成为了应用的需要,从内容到深度都得到了空前的发展。语音识别在工业、商业、银行、服务、军事、医疗、日常生活等很多领域有着广泛的应用前景。端点检测是语音识别系统预处理阶段遇到的第一个关键技术,端点检测的目的就是把复杂的应用环境下的信号中分辨出语音信号和非语音信号以及确定语音信号的开始与结束。支持向量机(Support Vector Machine, SVM)作为数据挖掘中的一项新技术,本文将支持向量机应用于语音端点检测之中,解决了传统端点检测方法中的需要人为设置阈值等繁琐和不准确性。蒙古语是内蒙古自治区的官方语言,在全国范围内众多的蒙古族在日常生活和文化交流中使用着蒙古语。所以,研究和实现蒙古语语音识别技术对蒙古语信息化处理具有非常大的意义。在本论文中,我们参考和借鉴汉语、藏语等的语音端点检测技术的基础上,通过MATLAB软件的仿真功能,结合蒙古语语音特点,采用了支持向量机进行语音段与非语音段的分类,实现了蒙古语的语音端点检测,取得了良好的效果。并研究了短时能量、短时平均过零率及Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficient, MFCC)等不同特征参数下对与语音有声段和无声段的分类能力,为日后的研究工作奠定了基础。

全文目录


摘要  4-5
ABSTRACT  5-9
引言  9-14
  1 课题研究的背景和意义  9-11
  2 课题研究的现状分析与发展趋势  11-13
  3 本文的主要研究内容  13-14
端点检测方法理论  14-19
  1.1 端点检测方法基本原理  14-15
  1.2 常用的几种端点检测方法  15-19
支持向量机的理论  19-27
  2.1 支持向量机的简介  19
  2.2 支持向量机的基本思想  19-22
  2.3 对于非线性可分的问题  22-23
  2.4 多类分类支持向量机  23-25
  2.5 支持向量机的应用  25-27
三 蒙古语语音学及其特点  27-32
  3.1 蒙古语语音学  27-28
  3.2 汉语与蒙古语语音比较  28-32
    3.2.1 汉语和蒙古语在声母上的比较  29
    3.2.2 汉语和蒙古语在韵母上的比较  29-31
    3.2.3 汉语和蒙古语在语音波形上的比较  31-32
四 基于支持向量机的蒙古语语音端点检测方法  32-49
  4.1 语音信号的特征参数  32-37
  4.2 方法实现  37-38
  4.3 仿真实验及结果分析  38-49
    4.3.1 语音库的建立  38-39
    4.3.2 特征参数向量的提取和SVM的训练  39-41
    4.3.3 支持向最机的测试(决策部分)  41-47
    4.3.4 MATLAB7.1中调取的函数  47
    4.3.5 实验总结  47-49
结论  49-50
参考文献  50-53
致谢  53
攻读学位期间发表的学术论文  53

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com