学位论文 > 优秀研究生学位论文题录展示

基于特征选择及其融合方法的说话人识别

作 者: 孙彦群
导 师: 俞一彪
学 校: 苏州大学
专 业: 信号与信息处理
关键词: 有效特征集 算法融合 说话人识别 GMM MMI
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 59次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别就是通过对话者的语音进行处理来实现对说话人的身份的判别。语音易获取,不像钥匙和卡一样需要随身携带,不会对人体舒适度产生影响,语音不会丢失,在日常生活中的使用十分方便。由此可见,相关说话人识别产品的开发必定会给人们的日常生活带来极大的便利。然而,说话人识别在经历了一段时间的快速发展之后,在比较长的一段时间里都没有跨越性的发展。但是一些学者和机构有的提出了自己的方法,有的在原有算法的基础上提出了一些改进的和融合的方法。例如一些学者在对语音学深入研究的基础上,提出了一些对说话人的个性特征具有较强表征能力的有效特征集的选择方法,并取得了比较好的实验结果。但是迄今为止,人们并没有深入到语音的本质,并没有将说话人的个性信息和语义信息提取并表征出来。因此,对语音深层次的研究有待深入。本文首先对说话人识别的基本理论和一些基本方法进行了介绍。并建立了基于高斯混合模型(GMM)的说话人识别系统,提取表征说话人身份的有效语音数据并进行建模和评估。在对说话人识别相关的理论分析和大量的针对性实验的基础上提出了一种基于有效特征集选择的说话人识别方法。对表征说话人特性的特征数据进行了个性和共性的有效划分,实验证明提出的方法是合理的、有效的。并在此基础上,结合一些好的方法,提出了基于有效融合方法的说话人识别方法,经实验验证,提出的方法有效地提高了说话人识别系统的识别性能。高斯混合模型和最大互信息的结合提高了说话人识别系统的综合性能。在此基础上,进一步融入了有效特征选择的方法,使得说话人识别系统性能得以进一步提高,使系统更加完善。另外,对基于浊音语音的说话人识别方法进行了分析,实验证明浊音语音对说话人身份的表征是比较有效的。课题研究中还建立了基于matlab的实时说话人识别系统,在普通的学生宿舍环境下进行测试,取得了比较理想的判别效果。

全文目录


摘要  4-5
Abstract  5-9
第一章 引言  9-14
  1.1 说话人识别的基本原理  9
  1.2 说话人识别的分类和特点  9-10
  1.3 说话人识别的研究现状和难点  10-11
  1.4 说话人识别的应用前景  11-12
  1.5 本文的主要研究工作  12-14
第二章 说话人识别常用特征  14-20
  2.1 基音周期  14-15
  2.2 线性预测系数  15-16
  2.3 线性预测倒谱系数  16-17
  2.4 Mel 频率倒谱系数  17-18
  2.5 Mel 倒谱系数MCC  18-20
第三章 说话人识别相关方法  20-43
  3.1 矢量量化的方法  21-24
    3.1.1 LBG 聚类算法  23-24
  3.2 隐马尔可夫模型方法  24-28
    3.2.1 HMM 模型  24-25
    3.2.2 HMM 模型的实现  25-28
  3.3 高斯混合模型GMM 的方法  28-43
    3.3.1 高斯混合模型的实现及应用  30-34
    3.3.2 高斯混合模型和MMI 的融合  34-37
    3.3.3 基于浊音语音的说话人识别  37-41
    3.3.4 基于matlab 的实时说话人识别  41-43
第四章 基于有效特征集选择的说话人识别  43-48
  4.1 基于GMM 的有效特征集选择方法  43-45
    4.1.1 特征选择算法介绍  44-45
  4.2 基于有效特征集选择的说话人识别方法  45-46
  4.3 实验与分析  46-48
    4.3.1 实验环境和实验条件  46-47
    4.3.2 实验结果和分析  47-48
第五章 基于有效融合方法的说话人识别  48-53
  5.1 基于有效融合方法的说话人识别  48-50
    5.1.1 融合方法  49-50
  5.2 对比实验设置及分析  50-52
    5.2.1 对比实验一  51
    5.2.2 对比实验二  51-52
    5.2.3 对比实验三  52
  5.3 小结  52-53
第六章 总结及展望  53-55
参考文献  55-59
攻读学位期间公开发表的论文  59-60
致谢  60-61

相似论文

  1. 关于GMM模型常规渐近性的一种新的检验统计量的讨论,O212.1
  2. 基于SOPC的说话人识别控制器,TN912.34
  3. 手机触摸屏驱动与MMI的耦合设计,TN929.53
  4. 听觉系统中语音信号处理相关性质研究,TN912.3
  5. 基于电话信道的声纹识别算法研究,TN912.34
  6. 复杂信道下的说话人识别技术,TN912.34
  7. 基于VC++6.0的说话人识别系统的研究,TN912.34
  8. 移动终端MMI软件的设计与实现,TN929.5
  9. 基于混合特征和高斯混合模型的说话人识别研究,TN912.34
  10. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  11. 说话人识别中特征参数的提取及优化研究,TN912.34
  12. 音频结构化技术研究,TN912.3
  13. 基于文本无关的说话人识别研究,TN912.34
  14. 国有银行发展与经济增长的实证研究,F124;F224
  15. 利率规则在我国的实证研究,F822.0
  16. 面向智能视频监控的事件检测建模及优化,TP391.41
  17. 多路并行实时说话人识别算法研究与实现,TN912.34
  18. 广播新闻音频结构化技术研究,TN912.3
  19. 基于GMM转换器的两级电液伺服阀的机理研究,TH137.522
  20. 基于支持向量机的说话人识别系统的开发,TN912.34
  21. 基于电话语音的少数民族语种识别研究,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com