学位论文 > 优秀研究生学位论文题录展示

基于特征选择及其融合方法的说话人识别

作　者: 孙彦群
导　师: 俞一彪
学　校: 苏州大学
专　业: 信号与信息处理
关键词: 有效特征集算法融合说话人识别 GMM MMI
分类号: TN912.34
类　型: 硕士论文
年　份: 2011年
下　载: 59次
引　用: 0次
阅　读: 论文下载

内容摘要

说话人识别就是通过对话者的语音进行处理来实现对说话人的身份的判别。语音易获取,不像钥匙和卡一样需要随身携带,不会对人体舒适度产生影响,语音不会丢失,在日常生活中的使用十分方便。由此可见,相关说话人识别产品的开发必定会给人们的日常生活带来极大的便利。然而,说话人识别在经历了一段时间的快速发展之后,在比较长的一段时间里都没有跨越性的发展。但是一些学者和机构有的提出了自己的方法,有的在原有算法的基础上提出了一些改进的和融合的方法。例如一些学者在对语音学深入研究的基础上,提出了一些对说话人的个性特征具有较强表征能力的有效特征集的选择方法,并取得了比较好的实验结果。但是迄今为止,人们并没有深入到语音的本质,并没有将说话人的个性信息和语义信息提取并表征出来。因此,对语音深层次的研究有待深入。本文首先对说话人识别的基本理论和一些基本方法进行了介绍。并建立了基于高斯混合模型(GMM)的说话人识别系统,提取表征说话人身份的有效语音数据并进行建模和评估。在对说话人识别相关的理论分析和大量的针对性实验的基础上提出了一种基于有效特征集选择的说话人识别方法。对表征说话人特性的特征数据进行了个性和共性的有效划分,实验证明提出的方法是合理的、有效的。并在此基础上,结合一些好的方法,提出了基于有效融合方法的说话人识别方法,经实验验证,提出的方法有效地提高了说话人识别系统的识别性能。高斯混合模型和最大互信息的结合提高了说话人识别系统的综合性能。在此基础上,进一步融入了有效特征选择的方法,使得说话人识别系统性能得以进一步提高,使系统更加完善。另外,对基于浊音语音的说话人识别方法进行了分析,实验证明浊音语音对说话人身份的表征是比较有效的。课题研究中还建立了基于matlab的实时说话人识别系统,在普通的学生宿舍环境下进行测试,取得了比较理想的判别效果。

全文目录

摘要  4-5
Abstract  5-9
第一章引言  9-14
  1.1 说话人识别的基本原理  9
  1.2 说话人识别的分类和特点  9-10
  1.3 说话人识别的研究现状和难点  10-11
  1.4 说话人识别的应用前景  11-12
  1.5 本文的主要研究工作  12-14
第二章说话人识别常用特征  14-20
  2.1 基音周期  14-15
  2.2 线性预测系数  15-16
  2.3 线性预测倒谱系数  16-17
  2.4 Mel 频率倒谱系数  17-18
  2.5 Mel 倒谱系数MCC  18-20
第三章说话人识别相关方法  20-43
  3.1 矢量量化的方法  21-24
    3.1.1 LBG 聚类算法  23-24
  3.2 隐马尔可夫模型方法  24-28
    3.2.1 HMM 模型  24-25
    3.2.2 HMM 模型的实现  25-28
  3.3 高斯混合模型GMM 的方法  28-43
    3.3.1 高斯混合模型的实现及应用  30-34
    3.3.2 高斯混合模型和MMI 的融合  34-37
    3.3.3 基于浊音语音的说话人识别  37-41
    3.3.4 基于matlab 的实时说话人识别  41-43
第四章基于有效特征集选择的说话人识别  43-48
  4.1 基于GMM 的有效特征集选择方法  43-45
    4.1.1 特征选择算法介绍  44-45
  4.2 基于有效特征集选择的说话人识别方法  45-46
  4.3 实验与分析  46-48
    4.3.1 实验环境和实验条件  46-47
    4.3.2 实验结果和分析  47-48
第五章基于有效融合方法的说话人识别  48-53
  5.1 基于有效融合方法的说话人识别  48-50
    5.1.1 融合方法  49-50
  5.2 对比实验设置及分析  50-52
    5.2.1 对比实验一  51
    5.2.2 对比实验二  51-52
    5.2.3 对比实验三  52
  5.3 小结  52-53
第六章总结及展望  53-55
参考文献  55-59
攻读学位期间公开发表的论文  59-60
致谢  60-61

基于特征选择及其融合方法的说话人识别

内容摘要

全文目录

相似论文