学位论文 > 优秀研究生学位论文题录展示
基于支持向量机的民族语语种识别研究
作 者: 殷凤玲
导 师: 杨鉴
学 校: 云南大学
专 业: 通信与信息系统
关键词: 语音识别 语种识别 语音特征 支持向量机
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 35次
引 用: 0次
阅 读: 论文下载
内容摘要
语音识别作为语音信号处理的一个研究方向,不断得到发展。由于语音识别的飞速发展,语种识别作为语音识别的一个方面越来越受到人们的关注。语种识别是在与说话人、文本无关的基础上进行,对于语音信号中个体发音的差异需要尽量消除,才能有效提取不同语种的各种的语音特征参数,从而提高语种的识别率。本文使用支持向量机作为分类器,分别设计并实现了单特征单分类器和多特征单分类器语种识别系统,对来自“中国少数民族语电话语音”数据库的汉语、纳西语、白语、苗语和藏语等5种语言进行语种识别实验研究。从民族语语音特征方面进行分析,找出不同语种之间的差异,提取语种语音声学特征参数,选择不同的特征参数集作为SVM分类器的输入,再对得到的语音样本特征参数集分别进行循环训练和测试,最终得到识别结果。分别按男声、女声给出3种单特征参数、1种特征参数组合进行实验,并对实验结果进行了分析。实验结果表明:对于采用不同的声学特征集中,对于单个特征来说,基音频率的识别率最好,这是因为基音频率反映了激励源的信息;而对不同的语种来说,在语种识别中声调、语调起重要作用,因此识别率是最高的。实验中,使用多种特征的融合比任意单个特征识别率都高,这是因为语种识别中,语言有许多不确定的因素,目前还没有哪种语音特征能完全区别一种语言,因此多特征的融合使得分类中存在的差异信息更多,更容易达到识别的效果。
|
全文目录
摘要 3-4 Abstract 4-8 第一章 绪论 8-18 1.1 语音识别的发展历史 8-9 1.2 语音识别系统 9-10 1.3 语音识别技术 10-13 1.4 语种识别 13-15 1.4.1 语种识别的涵义 13 1.4.2 语种识别的意义 13-14 1.4.3 语种识别的方法 14-15 1.5 研究目的、研究方法及研究内容 15-18 1.5.1 研究目的 15-16 1.5.2 研究方法和技术路线 16-17 1.5.3 研究内容 17-18 第二章 不同语种的语音特征 18-26 2.1 语音的声学特征信息 18-20 2.1.1 音位信息 19 2.1.2 韵律信息 19-20 2.2 语音样本的选择 20-21 2.2.1 少数民族语电话语音数据库 20-21 2.2.2 语音样本集的构成 21 2.3 语音预处理 21-22 2.4 语音的特征参数 22-25 2.4.1 基音频率参数FO 22-23 2.4.2 短时能量参数En 23 2.4.3 MFCC参数 23-25 2.4.4 第一共振峰参数F1 25 2.4.5 韵律节奏参数Rhy 25 2.5 语音声学特征参数的提取 25-26 第三章 基于支持向量机的民族语语种识别 26-33 3.1 支持向量机 26-31 3.1.1 最优分类超平面 26-28 3.1.2 线性支持向量机 28-29 3.1.3 非线性支持向量机 29-31 3.1.4 几种常用的核函数 31 3.2 基于支持向量机的民族语语种识别 31-32 3.3 支持向量机在多类模式下的分类 32-33 第四章 实验及数据分析 33-40 4.1 实验方案 33 4.2 实验样本的选择 33-34 4.3 实验过程 34-35 4.4 实验结果及分析 35-40 4.4.1 实验结果 35-38 4.4.2 实验结果分析 38-40 第五章 总结 40-42 参考文献 42-44 致谢 44
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|