学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的民族语语种识别研究

作 者: 殷凤玲
导 师: 杨鉴
学 校: 云南大学
专 业: 通信与信息系统
关键词: 语音识别 语种识别 语音特征 支持向量机
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 35次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音识别作为语音信号处理的一个研究方向,不断得到发展。由于语音识别的飞速发展,语种识别作为语音识别的一个方面越来越受到人们的关注。语种识别是在与说话人、文本无关的基础上进行,对于语音信号中个体发音的差异需要尽量消除,才能有效提取不同语种的各种的语音特征参数,从而提高语种的识别率。本文使用支持向量机作为分类器,分别设计并实现了单特征单分类器和多特征单分类器语种识别系统,对来自“中国少数民族语电话语音”数据库的汉语、纳西语、白语、苗语和藏语等5种语言进行语种识别实验研究。从民族语语音特征方面进行分析,找出不同语种之间的差异,提取语种语音声学特征参数,选择不同的特征参数集作为SVM分类器的输入,再对得到的语音样本特征参数集分别进行循环训练和测试,最终得到识别结果。分别按男声、女声给出3种单特征参数、1种特征参数组合进行实验,并对实验结果进行了分析。实验结果表明:对于采用不同的声学特征集中,对于单个特征来说,基音频率的识别率最好,这是因为基音频率反映了激励源的信息;而对不同的语种来说,在语种识别中声调、语调起重要作用,因此识别率是最高的。实验中,使用多种特征的融合比任意单个特征识别率都高,这是因为语种识别中,语言有许多不确定的因素,目前还没有哪种语音特征能完全区别一种语言,因此多特征的融合使得分类中存在的差异信息更多,更容易达到识别的效果。

全文目录


摘要  3-4
Abstract  4-8
第一章 绪论  8-18
  1.1 语音识别的发展历史  8-9
  1.2 语音识别系统  9-10
  1.3 语音识别技术  10-13
  1.4 语种识别  13-15
    1.4.1 语种识别的涵义  13
    1.4.2 语种识别的意义  13-14
    1.4.3 语种识别的方法  14-15
  1.5 研究目的、研究方法及研究内容  15-18
    1.5.1 研究目的  15-16
    1.5.2 研究方法和技术路线  16-17
    1.5.3 研究内容  17-18
第二章 不同语种的语音特征  18-26
  2.1 语音的声学特征信息  18-20
    2.1.1 音位信息  19
    2.1.2 韵律信息  19-20
  2.2 语音样本的选择  20-21
    2.2.1 少数民族语电话语音数据库  20-21
    2.2.2 语音样本集的构成  21
  2.3 语音预处理  21-22
  2.4 语音的特征参数  22-25
    2.4.1 基音频率参数FO  22-23
    2.4.2 短时能量参数En  23
    2.4.3 MFCC参数  23-25
    2.4.4 第一共振峰参数F1  25
    2.4.5 韵律节奏参数Rhy  25
  2.5 语音声学特征参数的提取  25-26
第三章 基于支持向量机的民族语语种识别  26-33
  3.1 支持向量机  26-31
    3.1.1 最优分类超平面  26-28
    3.1.2 线性支持向量机  28-29
    3.1.3 非线性支持向量机  29-31
    3.1.4 几种常用的核函数  31
  3.2 基于支持向量机的民族语语种识别  31-32
  3.3 支持向量机在多类模式下的分类  32-33
第四章 实验及数据分析  33-40
  4.1 实验方案  33
  4.2 实验样本的选择  33-34
  4.3 实验过程  34-35
  4.4 实验结果及分析  35-40
    4.4.1 实验结果  35-38
    4.4.2 实验结果分析  38-40
第五章 总结  40-42
参考文献  42-44
致谢  44

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  5. 基于DSP的机器人语音命令识别系统研制,TN912.34
  6. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  7. 音乐结构自动分析研究,TN912.3
  8. 基于三维重建的焊点质量分类方法研究,TP391.41
  9. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  10. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 基于支持向量机的故障诊断方法研究,TP18
  14. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  15. 在智能手机环境下健康管理功能设计与研究,TN929.53
  16. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  17. 基于车载3D加速传感器的路况监测研究,TP274
  18. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  19. 基于机器学习的入侵检测系统研究,TP393.08
  20. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  21. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com