学位论文 > 优秀研究生学位论文题录展示
基于HMM的情感语音识别
作 者: 康燕
导 师: 张雪英
学 校: 太原理工大学
专 业: 信号与信息处理
关键词: 语音信号处理 情感语音库 情感特征提取 隐马尔可夫模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 170次
引 用: 2次
阅 读: 论文下载
内容摘要
随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,在人类进行思想、观点和情感交流等信息的相互传递中发挥着重要的作用,语音信号中的情感信息研究正越来越受人们的重视。情感语音识别作为情感语音信号处理研究的一个重要分支,在实现人机自然交互方面有重要的作用。本文首先介绍了情感语音识别的研究背景与研究意义、研究现状以及应用前景,接下来介绍了目前国内外对情感的分类和一些常用的识别方法。在对国内外情感语音库了解的基础上,从确定情感类别、选择录音脚本、实验环境及设备的要求等方面综合考虑,录制了包含高兴、中性、生气三种情感的情感语音库,并经过了主观辨听实验,选取了其中情感识别度较高的语句进行情感语音识别的实验。在对语音信号的情感特征进行分析之后,对本文实验所用的各种特征参数的提取方法进行了详细的介绍,提取了基音频率及其一阶、二阶导数,短时能量的一阶、二阶、三阶导数,第一共振峰及传统特征参数MFCC特征、抗噪特征参数ZCPA特征等特征参数。然后重点介绍了本文中情感语音识别模型的建模思想和建模方法。使用从左到右的有跳转的连续隐马尔可夫模型(CHMM)进行情感语音识别,从模型的初始化、参数训练和情感识别几个方面概括了研究的整个工作过程。在情感的训练识别中,分别使用了单个MFCC特征参数,单个ZCPA特征参数和九维的情感特征参数矢量在平静、有噪声情况下进行训练和识别。实验结果表明,三种情感的总体识别效果都比较理想,在各组的识别结果中相同条件下对比,三种情感中的中性的识别率更好一些。在噪声环境下,单个ZCPA特征参数和综合的情感特征参数矢量的识别效果要明显好于传统的MFCC特征参数。最后讨论了该领域存在的一些问题,本次研究中的不足和今后需要进一步研究的课题。
|
全文目录
摘要 3-5 ABSTRACT 5-11 第一章 绪论 11-17 1.1 研究背景与研究意义 11-12 1.2 语音情感识别的研究现状 12-13 1.3 语音情感识别的应用前景 13-15 1.4 本文的研究内容与章节安排 15-17 第二章 情感语音识别的概述 17-31 2.1 情感的定义 17-18 2.2 情感的分类 18-21 2.2.1 主要情感和次要情感 18-19 2.2.2 Fox的三级情感模型 19-20 2.2.3 情感空间 20-21 2.2.4 情感轮 21 2.3 情感语音数据库 21-25 2.3.1 建立情感语音数据库时需要考虑的问题 22-23 2.3.2 具有代表性的情感语音数据库 23-25 2.4 本文所用情感语音数据库 25-27 2.4.1 情感类型的确定 25 2.4.2 录音脚本的选择 25-26 2.4.3 情感语音录制 26-27 2.5 情感语音的识别方法 27-30 2.6 小结 30-31 第三章 语音信号情感特征分析与参数提取 31-47 3.1 语音信号的产生过程 31-33 3.1.1 语音信号的产生 31-32 3.1.2 语音信号产生的模型 32-33 3.2 语音信号的预处理 33-38 3.2.1 抗混叠滤波与预加重 34-35 3.2.2 加窗分帧 35 3.2.3 端点检测 35-38 3.3 语音信号情感特征分析 38-40 3.4 情感语音信号特征参数的提取 40-44 3.4.1 线性预测倒谱系数(LPCC) 40-42 3.4.2 Mel频率倒谱系数(MFCC) 42-44 3.4.3 过零峰值幅度(ZCPA) 44 3.5 小结 44-47 第四章 HMM的基本原理 47-59 4.1 概述 47 4.2 HMM的定义 47-49 4.2.1 信号模型 47-48 4.2.2 HMM的数学描述 48-49 4.3 HMM的各种结构类型 49-52 4.3.1 按照A参数分类 49-51 4.3.2 按照B参数分类 51-52 4.4 HMM基本算法 52-58 4.4.1 前向后向算法(Forward-Backward,F-B算法) 53-55 4.4.2 维特比(Viterbi)算法 55-56 4.4.3 Baum-Welch算法 56-57 4.4.4 分段K均值算法 57-58 4.5 小结 58-59 第五章 基于CHMM情感语音识别系统的建立与实现 59-75 5.1 情感语音识别系统的整体模型 59-60 5.2 基于CHMM情感语音识别系统的设计与实现 60-71 5.2.1 情感语音特征参数的提取 60-66 5.2.2 CHMM模型情感语音识别系统的建立与实现 66-71 5.3 实验结果与分析 71-73 5.4 小结 73-75 第六章 总结与展望 75-77 6.1 工作总结 75-76 6.2 进一步工作展望 76-77 参考文献 77-81 致谢 81-83 攻读学位期间发表的学术论文目录 83
|
相似论文
- G.729语音编解码算法的研究及其DSP实现,TN919.81
- 一种用于语音信号处理的12位Sigma-Delta调制器的设计,TN761
- 说话人识别技术的研究,TN912.34
- 基于特征参数的语音情感识别,TN912.34
- 面向聋儿言语康复的发音检测技术的研究与应用,TN912.3
- 基于高斯混合模型的语音情感识别研究与实现,TP391.42
- 基于听觉神经原理的语音信号处理,TN912.3
- 新型压电式人工中耳中的语音信号处理研究,TH785.1
- 语音信号情感识别,TP391.42
- 钢琴调音软件的设计,TN912.3
- 语言学习系统中发音质量的计算机辅助分析与评价,TN912.3
- 基于DSP的语音编码算法及其实现,TN912.3
- 短波通信中信号检测算法研究,TN925
- 基于语音信号DCT系数的小波变换编码研究,TN912.3
- 基于独立分量分析和基音提取技术的盲源分离,TN912.3
- 基于语音信号处理的失语症康复治疗仪研究,R496
- 语音信号处理中的数学形态学方法研究,TN912.3
- 基于多小波的基音检测法及歌声的客观评价研究,TN912.3
- 语音去混响研究,TN912.3
- 人工电子耳蜗中语音处理器的研究,R318.1
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|