学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的说话人识别系统的开发

作　者: 李辉
导　师: 刘祥楼
学　校: 东北石油大学
专　业: 精密仪器及机械
关键词: 支持向量机说话人识别语音库核函数
分类号: TN912.34
类　型: 硕士论文
年　份: 2011年
下　载: 67次
引　用: 1次
阅　读: 论文下载

内容摘要

说话人识别技术目前己经成为身份认证及人工智能领域研究的一个热点,并且已经在现实生活中得到广泛的应用。支持向量机是在统计学习理论基础上开发出来的一种新的、非常有效的机器学习新方法。它较好地解决了以往困扰很多学习方法的小样本、非线性、过学习、高维数、局部极小点等实际问题,具有很强的推广能力。本文是以支持向量机的理论和方法为背景,研究如何构建说话人识别系统。在构建基于支持向量机说话人识别系统的过程中,分别研究了说话人语音库的建立,语音信号的预处理,语音的端点检测,不同参数特征向量的对比分析,支持向量机参数确定及系统构建等方面的问题。建立了一个基于SQLite标准化的小型语音库,组织和完成了语音样本的采集工作,为算法测试奠定了数据基础。分析比较Mel倒谱参数(MFCC)与线性预测系数(LPCC)的优缺点,并将反映语音信号的静态特征MFCC参数作为语音信号的特征参数。建立说话人识别系统过程中遇到的难点,如特征向量的帧数、帧长选取和核函数及其参数的选取等对识别率、识别时间有影响的问题进行了选取实验与分析。通过实际语音的训练和识别验证识别效果,优选参数后可以实现识别率98%以上。本系统以计算机为硬件基础,在LabVIEW和MATLAB平台下根据基本语音信号的基本处理方法和说话人识别的原理构建了说话人识别系统。

全文目录

摘要  4-5
ABSTRACT  5-6
创新点摘要  6-9
第一章绪论  9-13
  1.1 说话人识别技术研究现状及发展趋势  9
  1.2 说话人识别技术面临的难题  9-11
  1.3 课题的提出及研究内容  11-12
  1.4 本章小结  12-13
第二章基于支持向量机说话人识别系统研究  13-25
  2.1 说话人识别的基本原理  13
  2.2 说话人识别系统语音信号的预处理技术研究  13-18
    2.2.1 语音信号的数字化  13
    2.2.2 语音信号的预加重  13-14
    2.2.3 语音信号的分帧加窗  14-15
    2.2.4 语音信号的端点检测  15-18
  2.3 说话人识别系统语音特征参数提取技术研究  18-20
    2.3.1 线性预测系数(LPCC)  18
    2.3.2 MFCC 特征参数  18-19
    2.3.3 MFCC 系数与LPCC 系数比较  19-20
  2.4 基于支持向量机的说话人识别技术研究  20-24
    2.4.1 支持向量机的理论基础  20-21
    2.4.2 支持向量机的基本方法  21-24
    2.4.3 基于支持向量机的说话人识别模型  24
  2.5 小结  24-25
第三章说话人识别系统的具体构建过程  25-39
  3.1 基于SQLite 语音库的构建  25-31
    3.1.1 说话人识别语音库构建方法  25-26
    3.1.2 SQLite 数据库技术研究与虚拟仪器LabVIEW 特性分析  26-28
    3.1.3 基于SQLite 数据库技术的语音库构建  28-31
  3.2 建立不同核函数参数选定系统  31-36
    3.2.1 参数选定系统的设计思想  31-33
    3.2.2 参数选定系统的构建  33-36
  3.3 说话人语音识别系统的构建  36-38
  3.4 小结  38-39
第四章实验与分析  39-48
  4.1 语音样本采集  39
  4.2 实验方案设计  39-40
  4.3 实验过程及结果分析  40-47
    4.3.1 核函数选择及参数选定实验  40-45
    4.3.2 语音库性能实验及分析  45-47
  4.4 小结  47-48
结论  48-49
参考文献  49-52
发表文章目录  52-53
致谢  53-54
附录  54-55
论文摘要  55-65

基于支持向量机的说话人识别系统的开发

内容摘要

全文目录

相似论文