学位论文 > 优秀研究生学位论文题录展示

基于HMM的情感语音识别

作　者: 康燕
导　师: 张雪英
学　校: 太原理工大学
专　业: 信号与信息处理
关键词: 语音信号处理情感语音库情感特征提取隐马尔可夫模型
分类号: TN912.34
类　型: 硕士论文
年　份: 2011年
下　载: 170次
引　用: 2次
阅　读: 论文下载

内容摘要

随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,在人类进行思想、观点和情感交流等信息的相互传递中发挥着重要的作用,语音信号中的情感信息研究正越来越受人们的重视。情感语音识别作为情感语音信号处理研究的一个重要分支,在实现人机自然交互方面有重要的作用。本文首先介绍了情感语音识别的研究背景与研究意义、研究现状以及应用前景,接下来介绍了目前国内外对情感的分类和一些常用的识别方法。在对国内外情感语音库了解的基础上,从确定情感类别、选择录音脚本、实验环境及设备的要求等方面综合考虑,录制了包含高兴、中性、生气三种情感的情感语音库,并经过了主观辨听实验,选取了其中情感识别度较高的语句进行情感语音识别的实验。在对语音信号的情感特征进行分析之后,对本文实验所用的各种特征参数的提取方法进行了详细的介绍,提取了基音频率及其一阶、二阶导数,短时能量的一阶、二阶、三阶导数,第一共振峰及传统特征参数MFCC特征、抗噪特征参数ZCPA特征等特征参数。然后重点介绍了本文中情感语音识别模型的建模思想和建模方法。使用从左到右的有跳转的连续隐马尔可夫模型(CHMM)进行情感语音识别,从模型的初始化、参数训练和情感识别几个方面概括了研究的整个工作过程。在情感的训练识别中,分别使用了单个MFCC特征参数,单个ZCPA特征参数和九维的情感特征参数矢量在平静、有噪声情况下进行训练和识别。实验结果表明,三种情感的总体识别效果都比较理想,在各组的识别结果中相同条件下对比,三种情感中的中性的识别率更好一些。在噪声环境下,单个ZCPA特征参数和综合的情感特征参数矢量的识别效果要明显好于传统的MFCC特征参数。最后讨论了该领域存在的一些问题,本次研究中的不足和今后需要进一步研究的课题。

全文目录

摘要  3-5
ABSTRACT  5-11
第一章绪论  11-17
  1.1 研究背景与研究意义  11-12
  1.2 语音情感识别的研究现状  12-13
  1.3 语音情感识别的应用前景  13-15
  1.4 本文的研究内容与章节安排  15-17
第二章情感语音识别的概述  17-31
  2.1 情感的定义  17-18
  2.2 情感的分类  18-21
    2.2.1 主要情感和次要情感  18-19
    2.2.2 Fox的三级情感模型  19-20
    2.2.3 情感空间  20-21
    2.2.4 情感轮  21
  2.3 情感语音数据库  21-25
    2.3.1 建立情感语音数据库时需要考虑的问题  22-23
    2.3.2 具有代表性的情感语音数据库  23-25
  2.4 本文所用情感语音数据库  25-27
    2.4.1 情感类型的确定  25
    2.4.2 录音脚本的选择  25-26
    2.4.3 情感语音录制  26-27
  2.5 情感语音的识别方法  27-30
  2.6 小结  30-31
第三章语音信号情感特征分析与参数提取  31-47
  3.1 语音信号的产生过程  31-33
    3.1.1 语音信号的产生  31-32
    3.1.2 语音信号产生的模型  32-33
  3.2 语音信号的预处理  33-38
    3.2.1 抗混叠滤波与预加重  34-35
    3.2.2 加窗分帧  35
    3.2.3 端点检测  35-38
  3.3 语音信号情感特征分析  38-40
  3.4 情感语音信号特征参数的提取  40-44
    3.4.1 线性预测倒谱系数(LPCC)  40-42
    3.4.2 Mel频率倒谱系数(MFCC)  42-44
    3.4.3 过零峰值幅度(ZCPA)  44
  3.5 小结  44-47
第四章 HMM的基本原理  47-59
  4.1 概述  47
  4.2 HMM的定义  47-49
    4.2.1 信号模型  47-48
    4.2.2 HMM的数学描述  48-49
  4.3 HMM的各种结构类型  49-52
    4.3.1 按照A参数分类  49-51
    4.3.2 按照B参数分类  51-52
  4.4 HMM基本算法  52-58
    4.4.1 前向后向算法(Forward-Backward,F-B算法)  53-55
    4.4.2 维特比(Viterbi)算法  55-56
    4.4.3 Baum-Welch算法  56-57
    4.4.4 分段K均值算法  57-58
  4.5 小结  58-59
第五章基于CHMM情感语音识别系统的建立与实现  59-75
  5.1 情感语音识别系统的整体模型  59-60
  5.2 基于CHMM情感语音识别系统的设计与实现  60-71
    5.2.1 情感语音特征参数的提取  60-66
    5.2.2 CHMM模型情感语音识别系统的建立与实现  66-71
  5.3 实验结果与分析  71-73
  5.4 小结  73-75
第六章总结与展望  75-77
  6.1 工作总结  75-76
  6.2 进一步工作展望  76-77
参考文献  77-81
致谢  81-83
攻读学位期间发表的学术论文目录  83

基于HMM的情感语音识别

内容摘要

全文目录

相似论文