学位论文 > 优秀研究生学位论文题录展示

与文本无关的说话人识别关键技术研究及系统设计

作　者: 陈彪
导　师: 徐捷
学　校: 国防科学技术大学
专　业: 信息与通信工程
关键词: 说话人辨认 PCA VQ CHMM 遗传算子粒子群
分类号: TN912.34
类　型: 硕士论文
年　份: 2009年
下　载: 25次
引　用: 0次
阅　读: 论文下载

内容摘要

本文针对与文本无关的说话人识别中的关键技术即说话人特征参数、矢量量化(VQ)和连续隐马尔可夫模型(CHMM)识别方法进行重点研究。在特征参数方面：研究了梅尔频率倒谱系数(MFCC)与其一阶差分系数的不同组合对基于VQ和CHMM识别方法的影响,利用主元分析(PCA)对特征参数处理后降低了特征的维数并提高了识别率；在识别方法方面：一方面针对VQ中码本生成算法LBG的不足进行深入研究,对已提出的用遗传算法和粒子群优化算法对码本优化的方法进行研究,根据遗传算法和粒子群优化算法的不同进化机制,提出了遗传算子和粒子群混合的K均值聚类的码本生成方法,该方法有效抑制了遗传算法和粒子群优化算法易早熟和陷入局部最优解的缺点,使生成的码本质量得到了进一步提高；另一方面重点研究了CHMM中状态数和高斯密度函数混合数的取值对识别率的影响,针对CHMM中Baum-Welch算法训练的模型参数为局部最优,模型训练量大等问题,采用CHMM中解码算法-Viterbi算法的特性,提出了遗传算法和粒子群优化算法分别与Viterbi算法相结合的方法对模型参数进行训练,使模型在参数的优化和训练时间上得到了一定的改进。最后,本文根据已掌握的语音样本在通过技术手段得到的大量音频数据库中进行搜索和匹配,找出相关人员的语音记录信息为应用背景,设计了一个基于文本无关的说话人辨认系统,在系统中采用MFCC作为基本说话人特征,VQ和CHMM作为系统的说话人辨认方法。

全文目录

摘要  10-11
ABSTRACT  11-12
第一章绪论  12-17
  1.1 课题研究背景  12-13
  1.2 说话人识别原理及难点  13
  1.3 说话人识别技术的国内外发展与现状  13-15
  1.4 研究的内容和主要工作  15
  1.5 章节安排  15-16
  1.6 本章小结  16-17
第二章特征参数提取  17-29
  2.1 特征参数  17-21
    2.1.1 语音信号产生的数学模型  17-18
    2.1.2 卷积同态信号处理  18-19
    2.1.3 Mel频率倒谱系数(MFCC)  19-21
  2.2 在特征提取过程中的关键问题  21-25
    2.2.1 预加重  21-22
    2.2.2 加窗分帧  22-23
    2.2.3 特征参数的冗余性  23-25
  2.3 实验设计及结果分析  25-28
    2.3.1 特征参数的不同选取对VQ识别方法的影响  26-27
    2.3.2 特征参数的不同选取对CHMM识别方法的影响  27
    2.3.3 PCA对特征参数的降维处理对VQ和CHMM识别方法的影响  27-28
  2.4 本章小结  28-29
第三章基于VQ识别方法的研究及改进  29-43
  3.1 VQ在说话人识别中的应用  29-33
    3.1.1 矢量量化的基本原理  29-30
    3.1.2 最佳矢量量化器  30-31
    3.1.3 失真测度  31-32
    3.1.4 VQ在说话人识别中的问题  32-33
  3.2 现有的码本设计算法研究  33-37
    3.2.1 LBG算法的码本设计  33
    3.2.2 对初始码本的改进  33-34
    3.2.3 基于遗传算法优化的码本  34-36
    3.2.4 基于粒子群优化算法优化的码本  36-37
  3.3 基于遗传算子和粒子群混合的K均值聚类码本设计改进算法  37-40
    3.3.1 K均值聚类  37-38
    3.3.2 参数的选取  38-39
    3.3.3 码本的设计过程  39-40
  3.4 实验设计及结果分析  40-42
    3.4.1 码本大小及各种码本生成方法对VQ识别方法的影响  40-42
  3.5 本章小结  42-43
第四章基于CHMM识别方法的研究及改进  43-57
  4.1 CHMM在说话人识别中的应用  43-51
    4.1.1 HMM的基本思想  43-45
    4.1.2 HMM的基本算法  45-50
    4.1.3 CHMM在说话人识别中的问题  50-51
  4.2 现有的模型训练算法研究  51-53
    4.2.1 Baum-Welch训练算法  51
    4.2.2 分段K均值模型训练  51-53
    4.2.3 基于最大互信息的模型训练  53
  4.3 进化算法与Viterbi算法结合的模型训练改进方法  53-54
    4.3.1 基于遗传算法与Viterbi结合的参数训练方法  54
    4.3.2 基于粒子群优化算法与Viterbi结合的参数训练方法  54
  4.4 实验设计及结果分析  54-56
    4.4.1 在CHMM中状态数和高斯函数混合数对识别率的影响  54-56
    4.4.2 改进后的参数训练方法对CHMM识别方法的影响  56
  4.5 本章小结  56-57
第五章与文本无关的说话人辨认系统设计  57-62
  5.1 系统的应用及原理  57-59
  5.2 系统设计  59-61
    5.2.1 说话人模型和特征参数的选取  59
    5.2.2 系统设计原理及关键问题  59-61
  5.3 本章小结  61-62
第六章结束语  62-63
  6.1 全文总结  62
  6.2 下一步工作与展望  62-63
致谢  63-64
参考文献  64-67
在校期间取得的学术成果  67

与文本无关的说话人识别关键技术研究及系统设计

内容摘要

全文目录

相似论文