学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的说话人识别系统的开发

作 者: 李辉
导 师: 刘祥楼
学 校: 东北石油大学
专 业: 精密仪器及机械
关键词: 支持向量机 说话人识别 语音库 核函数
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 67次
引 用: 1次
阅 读: 论文下载
 

内容摘要


说话人识别技术目前己经成为身份认证及人工智能领域研究的一个热点,并且已经在现实生活中得到广泛的应用。支持向量机是在统计学习理论基础上开发出来的一种新的、非常有效的机器学习新方法。它较好地解决了以往困扰很多学习方法的小样本、非线性、过学习、高维数、局部极小点等实际问题,具有很强的推广能力。本文是以支持向量机的理论和方法为背景,研究如何构建说话人识别系统。在构建基于支持向量机说话人识别系统的过程中,分别研究了说话人语音库的建立,语音信号的预处理,语音的端点检测,不同参数特征向量的对比分析,支持向量机参数确定及系统构建等方面的问题。建立了一个基于SQLite标准化的小型语音库,组织和完成了语音样本的采集工作,为算法测试奠定了数据基础。分析比较Mel倒谱参数(MFCC)与线性预测系数(LPCC)的优缺点,并将反映语音信号的静态特征MFCC参数作为语音信号的特征参数。建立说话人识别系统过程中遇到的难点,如特征向量的帧数、帧长选取和核函数及其参数的选取等对识别率、识别时间有影响的问题进行了选取实验与分析。通过实际语音的训练和识别验证识别效果,优选参数后可以实现识别率98%以上。本系统以计算机为硬件基础,在LabVIEW和MATLAB平台下根据基本语音信号的基本处理方法和说话人识别的原理构建了说话人识别系统。

全文目录


摘要  4-5
ABSTRACT  5-6
创新点摘要  6-9
第一章 绪论  9-13
  1.1 说话人识别技术研究现状及发展趋势  9
  1.2 说话人识别技术面临的难题  9-11
  1.3 课题的提出及研究内容  11-12
  1.4 本章小结  12-13
第二章 基于支持向量机说话人识别系统研究  13-25
  2.1 说话人识别的基本原理  13
  2.2 说话人识别系统语音信号的预处理技术研究  13-18
    2.2.1 语音信号的数字化  13
    2.2.2 语音信号的预加重  13-14
    2.2.3 语音信号的分帧加窗  14-15
    2.2.4 语音信号的端点检测  15-18
  2.3 说话人识别系统语音特征参数提取技术研究  18-20
    2.3.1 线性预测系数(LPCC)  18
    2.3.2 MFCC 特征参数  18-19
    2.3.3 MFCC 系数与LPCC 系数比较  19-20
  2.4 基于支持向量机的说话人识别技术研究  20-24
    2.4.1 支持向量机的理论基础  20-21
    2.4.2 支持向量机的基本方法  21-24
    2.4.3 基于支持向量机的说话人识别模型  24
  2.5 小结  24-25
第三章 说话人识别系统的具体构建过程  25-39
  3.1 基于SQLite 语音库的构建  25-31
    3.1.1 说话人识别语音库构建方法  25-26
    3.1.2 SQLite 数据库技术研究与虚拟仪器LabVIEW 特性分析  26-28
    3.1.3 基于SQLite 数据库技术的语音库构建  28-31
  3.2 建立不同核函数参数选定系统  31-36
    3.2.1 参数选定系统的设计思想  31-33
    3.2.2 参数选定系统的构建  33-36
  3.3 说话人语音识别系统的构建  36-38
  3.4 小结  38-39
第四章 实验与分析  39-48
  4.1 语音样本采集  39
  4.2 实验方案设计  39-40
  4.3 实验过程及结果分析  40-47
    4.3.1 核函数选择及参数选定实验  40-45
    4.3.2 语音库性能实验及分析  45-47
  4.4 小结  47-48
结论  48-49
参考文献  49-52
发表文章目录  52-53
致谢  53-54
附录  54-55
论文摘要  55-65

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 地波辐射源的调制类型识别与参数估计,TN957.51
  5. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  6. 音乐结构自动分析研究,TN912.3
  7. 基于三维重建的焊点质量分类方法研究,TP391.41
  8. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  9. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  10. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  11. 基于图像的路面破损识别,TP391.41
  12. 基于支持向量机的故障诊断方法研究,TP18
  13. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  14. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  15. 基于车载3D加速传感器的路况监测研究,TP274
  16. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  17. 基于机器学习的入侵检测系统研究,TP393.08
  18. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  19. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  20. 基于AdaBoost算法的人脸识别研究,TP391.41
  21. 声道频响合成方法在军队姓名语音库的应用,TN912.3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com