学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的语种识别

作 者: 陈瑶玲
导 师: 杨鉴
学 校: 云南大学
专 业: 通信与信息系统
关键词: 语种识别 特征提取 支持向量机 特征融合 分类器融合
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 60次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语言是人类获得信息的主要来源,也是人与人交流的最自然、最方便、最有效的工具。如今人们进入到一个信息社会,随着计算机科学技术的发展和全球合作的增加,语种识别技术成为了语音识别领域的一个新的研究热点并广泛应用于多语种信息服务和军事安全领域等方面。从上个世纪七十年代到现在,语种识别虽然只经历了几十年的发展,但识别方法己有很多种。虽然这些方法各有特点,但离实际应用要求还有一段距离。本文主要研究与文本无关和与说话人无关的语种识别方法,采用支持向量机作为分类器,探索提高识别率的方法。论文的主要工作有:(1)语种识别需要尽量消除同一语种内语音信号中个体发音人的差异,并且尽量找到语种间的声学特征的差异,才能达到好的识别效果。本文提取MFCC、LPCC、第一共振峰频率、基音频率、短时能量、韵律节奏等6种声学特征参数及其派生参数,用于语种识别,旨在找出最有效的语种识别特征参数集。(2)使用支持向量机作为分类器,分别设计并实现了单一特征单分类器和多特征单分类器语种识别系统,对来自两个不同语种识别数据库的汉、英、日、白和纳西语等5种语言进行语种识别实验,分别按男声、女声和混合声给出5种单一特征参数、4种特征组合的实验结果,并对实验结果进行详细分析。(3)在上述工作的基础上,采用多特征多分类器融合的思想,设计并实现新的语种识别系统。利用4种特征参数和两种支持向量机,构造8个分类器,然后分别采用多数投票法、加权平均法和决策模板法进行分类器融合,给出基于上述语音数据集的实验结果,以及完整的实验结果分析。实验结果表明,在本文所讨论的6种特征参数中,基音频率具有最好的识别性能;对于混合声,单一特征单分类器的最好识别率为60.20%;多特征单分类器的最好识别率为80.73%;而多特征多分类器融合的最好识别可达90.27%。

全文目录


摘要  3-4
Abstract  4-8
第1章 绪论  8-14
  1.1 研究的背景和意义  8-9
  1.2 语种识别的研究进展  9-12
  1.3 论文的研究思路和作者的工作  12-13
  1.4 论文结构  13-14
第2章 语种识别特征提取  14-25
  2.1 引言  14
  2.2 语音信号预处理  14-15
  2.3 语音信号的声学特征  15-17
    2.3.1 音位信息  16
    2.3.2 韵律信息  16-17
    2.3.3 语音信号的其它特征信息  17
  2.4 特征提取  17-23
    2.4.1 MFCC 参数集  18-20
    2.4.2 LPCC 参数集  20-21
    2.4.3 第一共振峰参数集  21
    2.4.4 基音频率参数集  21-22
    2.4.5 短时能量参数集  22-23
    2.4.6 韵律节奏参数集  23
  2.5 最优特征参数的选择  23-24
  2.6 本章小结  24-25
第3章 基于支持向量机的语种识别  25-34
  3.1 引言  25
  3.2 支持向量机  25-31
    3.2.1 支持向量机理论  25-28
    3.2.2 线性可分情况下的支持向量机  28
    3.2.3 非线性可分情况的支持向量机  28-30
    3.2.4 核函数  30-31
  3.3 基于 SVM 的语种识别系统  31-33
  3.4 本章小结  33-34
第4章 基于多特征多分类器融合的语种识别  34-44
  4.1 引言  34
  4.2 分类器融合技术  34-40
    4.2.1 多数投票法  36
    4.2.2 加权平均法  36-38
    4.2.3 决策模板融合技术  38-40
  4.3 特征融合技术  40-41
  4.4 多特征多分类器融合  41-43
  4.5 本章小结  43-44
第5章 实验结果与分析  44-55
  5.1 引言  44
  5.2 实验数据库  44-46
    5.2.1 少数民族语电话语音数据库  44
    5.2.2 CSLU 数据库  44-45
    5.2.3 语音样本选择  45-46
  5.3 基于单分类器 SVM 的语种识别  46-49
    5.3.1 实验方案  46-47
    5.3.2 实验结果与分析  47-49
  5.4 基于多特征多分类器融合的语种识别  49-54
    5.4.1 实验方案  49-51
    5.4.2 实验结果与分析  51-54
  5.5 本章小结  54-55
第6章 总结与展望  55-58
  6.1 总结  55-56
  6.2 展望  56-58
参考文献  58-62
致谢  62-63
在读期间参与的科研项目和发表的学术论文  63

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. Q学习在基于内容图像检索技术中的应用,TP391.41
  9. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  10. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  11. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  12. 空间交会接近视觉测量方法研究,TP391.41
  13. 图像实时采集、存储与处理方法研究,TP391.41
  14. 唇读中的特征提取、选择与融合,TP391.41
  15. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  16. 多币种纸币处理技术的研究与实现,TP391.41
  17. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  18. 基于图像的路面破损识别,TP391.41
  19. 移动机器人视觉检测和跟踪研究,TP242.62
  20. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  21. 基于支持向量机的故障诊断方法研究,TP18

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com