学位论文 > 优秀研究生学位论文题录展示

基于HMM的情感语音识别

作 者: 康燕
导 师: 张雪英
学 校: 太原理工大学
专 业: 信号与信息处理
关键词: 语音信号处理 情感语音库 情感特征提取 隐马尔可夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 170次
引 用: 2次
阅 读: 论文下载
 

内容摘要


随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,在人类进行思想、观点和情感交流等信息的相互传递中发挥着重要的作用,语音信号中的情感信息研究正越来越受人们的重视。情感语音识别作为情感语音信号处理研究的一个重要分支,在实现人机自然交互方面有重要的作用。本文首先介绍了情感语音识别的研究背景与研究意义、研究现状以及应用前景,接下来介绍了目前国内外对情感的分类和一些常用的识别方法。在对国内外情感语音库了解的基础上,从确定情感类别、选择录音脚本、实验环境及设备的要求等方面综合考虑,录制了包含高兴、中性、生气三种情感的情感语音库,并经过了主观辨听实验,选取了其中情感识别度较高的语句进行情感语音识别的实验。在对语音信号的情感特征进行分析之后,对本文实验所用的各种特征参数的提取方法进行了详细的介绍,提取了基音频率及其一阶、二阶导数,短时能量的一阶、二阶、三阶导数,第一共振峰及传统特征参数MFCC特征、抗噪特征参数ZCPA特征等特征参数。然后重点介绍了本文中情感语音识别模型的建模思想和建模方法。使用从左到右的有跳转的连续隐马尔可夫模型(CHMM)进行情感语音识别,从模型的初始化、参数训练和情感识别几个方面概括了研究的整个工作过程。在情感的训练识别中,分别使用了单个MFCC特征参数,单个ZCPA特征参数和九维的情感特征参数矢量在平静、有噪声情况下进行训练和识别。实验结果表明,三种情感的总体识别效果都比较理想,在各组的识别结果中相同条件下对比,三种情感中的中性的识别率更好一些。在噪声环境下,单个ZCPA特征参数和综合的情感特征参数矢量的识别效果要明显好于传统的MFCC特征参数。最后讨论了该领域存在的一些问题,本次研究中的不足和今后需要进一步研究的课题。

全文目录


摘要  3-5
ABSTRACT  5-11
第一章 绪论  11-17
  1.1 研究背景与研究意义  11-12
  1.2 语音情感识别的研究现状  12-13
  1.3 语音情感识别的应用前景  13-15
  1.4 本文的研究内容与章节安排  15-17
第二章 情感语音识别的概述  17-31
  2.1 情感的定义  17-18
  2.2 情感的分类  18-21
    2.2.1 主要情感和次要情感  18-19
    2.2.2 Fox的三级情感模型  19-20
    2.2.3 情感空间  20-21
    2.2.4 情感轮  21
  2.3 情感语音数据库  21-25
    2.3.1 建立情感语音数据库时需要考虑的问题  22-23
    2.3.2 具有代表性的情感语音数据库  23-25
  2.4 本文所用情感语音数据库  25-27
    2.4.1 情感类型的确定  25
    2.4.2 录音脚本的选择  25-26
    2.4.3 情感语音录制  26-27
  2.5 情感语音的识别方法  27-30
  2.6 小结  30-31
第三章 语音信号情感特征分析与参数提取  31-47
  3.1 语音信号的产生过程  31-33
    3.1.1 语音信号的产生  31-32
    3.1.2 语音信号产生的模型  32-33
  3.2 语音信号的预处理  33-38
    3.2.1 抗混叠滤波与预加重  34-35
    3.2.2 加窗分帧  35
    3.2.3 端点检测  35-38
  3.3 语音信号情感特征分析  38-40
  3.4 情感语音信号特征参数的提取  40-44
    3.4.1 线性预测倒谱系数(LPCC)  40-42
    3.4.2 Mel频率倒谱系数(MFCC)  42-44
    3.4.3 过零峰值幅度(ZCPA)  44
  3.5 小结  44-47
第四章 HMM的基本原理  47-59
  4.1 概述  47
  4.2 HMM的定义  47-49
    4.2.1 信号模型  47-48
    4.2.2 HMM的数学描述  48-49
  4.3 HMM的各种结构类型  49-52
    4.3.1 按照A参数分类  49-51
    4.3.2 按照B参数分类  51-52
  4.4 HMM基本算法  52-58
    4.4.1 前向后向算法(Forward-Backward,F-B算法)  53-55
    4.4.2 维特比(Viterbi)算法  55-56
    4.4.3 Baum-Welch算法  56-57
    4.4.4 分段K均值算法  57-58
  4.5 小结  58-59
第五章 基于CHMM情感语音识别系统的建立与实现  59-75
  5.1 情感语音识别系统的整体模型  59-60
  5.2 基于CHMM情感语音识别系统的设计与实现  60-71
    5.2.1 情感语音特征参数的提取  60-66
    5.2.2 CHMM模型情感语音识别系统的建立与实现  66-71
  5.3 实验结果与分析  71-73
  5.4 小结  73-75
第六章 总结与展望  75-77
  6.1 工作总结  75-76
  6.2 进一步工作展望  76-77
参考文献  77-81
致谢  81-83
攻读学位期间发表的学术论文目录  83

相似论文

  1. G.729语音编解码算法的研究及其DSP实现,TN919.81
  2. 一种用于语音信号处理的12位Sigma-Delta调制器的设计,TN761
  3. 说话人识别技术的研究,TN912.34
  4. 基于特征参数的语音情感识别,TN912.34
  5. 面向聋儿言语康复的发音检测技术的研究与应用,TN912.3
  6. 基于高斯混合模型的语音情感识别研究与实现,TP391.42
  7. 基于听觉神经原理的语音信号处理,TN912.3
  8. 新型压电式人工中耳中的语音信号处理研究,TH785.1
  9. 语音信号情感识别,TP391.42
  10. 钢琴调音软件的设计,TN912.3
  11. 语言学习系统中发音质量的计算机辅助分析与评价,TN912.3
  12. 基于DSP的语音编码算法及其实现,TN912.3
  13. 短波通信中信号检测算法研究,TN925
  14. 基于语音信号DCT系数的小波变换编码研究,TN912.3
  15. 基于独立分量分析和基音提取技术的盲源分离,TN912.3
  16. 基于语音信号处理的失语症康复治疗仪研究,R496
  17. 语音信号处理中的数学形态学方法研究,TN912.3
  18. 基于多小波的基音检测法及歌声的客观评价研究,TN912.3
  19. 语音去混响研究,TN912.3
  20. 人工电子耳蜗中语音处理器的研究,R318.1

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com