学位论文 > 优秀研究生学位论文题录展示

基于MFCC和矢量量化的说话人识别算法研究

作 者: 尹许梅
导 师: 何选森
学 校: 湖南大学
专 业: 信息与通信工程
关键词: MFCC Bark子波变换 蚁群算法 矢量量化 说话人识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 76次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别技术是根据语音波形中反映说话人生理特征差异和行为习惯差异的语音参数能够自动鉴别说话人是谁的一项技术,其广泛的应用前景正受到越来越多人的重视。本文主要是基于美尔频率倒谱系数(Mel Frequency CepstralCoefficients,MFCC)和矢量量化的与文本无关说话人识别技术的研究,采用矢量量化和自适应蚁群算法混合的方法,参数利用改进窗函数的Bark子波的美尔频率倒谱系数。首先,在MFCC特征提取的预处理阶段对窗函数进行改进,用改进的Lanczos窗代替汉明窗,在确定主瓣的宽度基本一致的情况下,使旁瓣能更好的得到抑制,并引入与人耳听觉系统更为适应的Bark子波变换,其基函数满足时间-感知频率上的最佳不确定性,分析尺度的伸缩则按照“临界带(Critical Band)”的中心频率来变化,将其应用于MFCC特征提取过程中,能提高语音在噪声环境下的鲁棒性。然后,对矢量量化模式识别方法进行改进,针对LBG算法极易陷入局部最优解的可能性和依赖初始码本的选择问题,利用蚁群算法的分布式并行机制,将蚁群算法与LBG算法进行混合交替,在提高其全局搜索能力的同时,通过LBG算法加快收敛速度。为了防止蚁群算法也陷入局部最优解的可能,采取了确定性选择和随机性选择相结合的选择策略,在搜索过程中动态调整状态转移概率的方法,从一定程度上防止了所得的结果是局部最优解。最后,一种基于标准差描述的加权欧式距离测度用于匹配判决。通过实验可以验证,改进后的特征提取算法以及混合蚁群算法的矢量量化识别方法,与传统的基准算法相比较,识别率和鲁棒性均得到提高,且随着训练语音长度的增加,识别效果更好。因此在实际应用中,需要根据具体的环境进行调整。

全文目录


摘要  5-6
Abstract  6-10
插图索引  10-11
附表索引  11-12
第1章 绪论  12-16
  1.1 说话人识别研究目的与意义  12-13
  1.2 国内外研究现状  13-14
  1.3 说话人识别的技术难点  14-15
  1.4 论文的主要内容和结构安排  15-16
    1.4.1 论文的主要内容  15
    1.4.2 论文的结构安排  15-16
第2章 说话人识别概述  16-25
  2.1 语音的特点和发声原理  16-18
    2.1.1 语音的特点  16-17
    2.1.2 语音的发声原理  17-18
  2.2 说话人识别的基本理论  18-23
    2.2.1 语音信号的数字化和预处理  18-20
    2.2.2 说话人识别特征参数的选取  20-22
    2.2.3 说话人识别方法  22-23
  2.3 说话人识别的性能评价  23-24
  2.4 小结  24-25
第3章 基于MFCC特征提取的改进算法  25-37
  3.1 Mel频率尺度倒谱系数MFCC  25-28
    3.1.1 Mel频率  25-26
    3.1.2 MFCC特征提取流程  26-28
  3.2 各种窗函数性能的研究  28-32
    3.2.1 各种基本窗函数的性能比较  29-30
    3.2.2 窗函数的改进  30-32
  3.3 Bark子波的研究  32-35
    3.3.1 掩蔽效应  32-33
    3.3.2 Bark子波及其变换  33-35
  3.4 基于改进窗的Bark子波的MFCC特征提取方法  35-36
  3.5 小结  36-37
第4章 基于自适应蚁群算法的VQ识别方法  37-49
  4.1 矢量量化技术介绍  37-39
    4.1.1 矢量量化的基本原理  37-38
    4.1.2 矢量量化的失真测度  38-39
  4.2 矢量量化器的码本设计  39-43
    4.2.1 LBG算法  40-41
    4.2.2 初始码本的生成  41-42
    4.2.3 LBG算法的改进  42-43
  4.3 蚁群算法介绍  43-46
    4.3.1 蚁群算法的产生  44
    4.3.2 基本蚁群算法  44-46
    4.3.3 自适应蚁群算法  46
  4.4 混合自适应蚁群算法的VQ码本设计算法  46-48
    4.4.1 基本蚁群算法的码本设计算法实现  46-47
    4.4.2 混合蚁群算法的VQ码本设计算法  47-48
  4.5 小结  48-49
第5章 算法实现和实验结果  49-59
  5.1 语音数据的采集和预处理  49-52
    5.1.1 语音数据的采集  49
    5.1.2 语音数据的预处理  49-52
  5.2 实验及结果分析  52-58
    5.2.1 实验一码本尺寸对识别结果的影响  52-53
    5.2.2 实验二测试长度对识别结果的影响  53
    5.2.3 实验三改进特征参数对识别结果的影响  53-56
    5.2.4 实验四不同识别方法对识别结果的影响  56-58
  5.3 小结  58-59
结论  59-61
参考文献  61-65
致谢  65-66
附录A 攻读学位期间所发表的学术论文及参加的科研项目  66

相似论文

  1. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  2. 基于蚁群算法的电梯群优化控制研究,TU857
  3. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  4. 动态环境下移动对象导航系统相关技术的研究,TP301.6
  5. 基于改进蚁群算法的机器人路径规划研究,TP242
  6. 改进的蚁群算法及其在TSP上的应用研究,TP301.6
  7. 基于免疫机制蚁群算法的电力系统无功优化研究,TP18
  8. 基于ARM9的孤立词语音识别系统设计,TN912.34
  9. 基于蚁群和人工鱼群混合群智能算法在物流配送路径优化问题中的应用研究,F253.9
  10. 基于特征选择及其融合方法的说话人识别,TN912.34
  11. 数字波导网格模型及语音网格参数估计,TN912.3
  12. 基于保局部核多元RVM的说话人识别方法研究,TN912.34
  13. 手背静脉图像的分类和匹配技术研究,TP391.41
  14. 基于条件矢量及内插量化的抗分组丢失方法,TN912.3
  15. 基于SOPC的说话人识别控制器,TN912.34
  16. 语音识别在访问控制的应用,TN912.34
  17. 智能光网络中路由选择算法的研究,TN929.1
  18. 电力系统机组组合问题的研究,TM732
  19. 听觉系统中语音信号处理相关性质研究,TN912.3
  20. “超值天下”系统中订票记录的聚类分析,F274;F224
  21. 基于蚁群算法的装配线平衡问题研究,TH186

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com