学位论文 > 优秀研究生学位论文题录展示

与文本无关的说话人识别关键技术研究及系统设计

作 者: 陈彪
导 师: 徐捷
学 校: 国防科学技术大学
专 业: 信息与通信工程
关键词: 说话人辨认 PCA VQ CHMM 遗传算子 粒子群
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 25次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文针对与文本无关的说话人识别中的关键技术即说话人特征参数、矢量量化(VQ)和连续隐马尔可夫模型(CHMM)识别方法进行重点研究。在特征参数方面:研究了梅尔频率倒谱系数(MFCC)与其一阶差分系数的不同组合对基于VQ和CHMM识别方法的影响,利用主元分析(PCA)对特征参数处理后降低了特征的维数并提高了识别率;在识别方法方面:一方面针对VQ中码本生成算法LBG的不足进行深入研究,对已提出的用遗传算法和粒子群优化算法对码本优化的方法进行研究,根据遗传算法和粒子群优化算法的不同进化机制,提出了遗传算子和粒子群混合的K均值聚类的码本生成方法,该方法有效抑制了遗传算法和粒子群优化算法易早熟和陷入局部最优解的缺点,使生成的码本质量得到了进一步提高;另一方面重点研究了CHMM中状态数和高斯密度函数混合数的取值对识别率的影响,针对CHMM中Baum-Welch算法训练的模型参数为局部最优,模型训练量大等问题,采用CHMM中解码算法-Viterbi算法的特性,提出了遗传算法和粒子群优化算法分别与Viterbi算法相结合的方法对模型参数进行训练,使模型在参数的优化和训练时间上得到了一定的改进。最后,本文根据已掌握的语音样本在通过技术手段得到的大量音频数据库中进行搜索和匹配,找出相关人员的语音记录信息为应用背景,设计了一个基于文本无关的说话人辨认系统,在系统中采用MFCC作为基本说话人特征,VQ和CHMM作为系统的说话人辨认方法。

全文目录


摘要  10-11
ABSTRACT  11-12
第一章 绪论  12-17
  1.1 课题研究背景  12-13
  1.2 说话人识别原理及难点  13
  1.3 说话人识别技术的国内外发展与现状  13-15
  1.4 研究的内容和主要工作  15
  1.5 章节安排  15-16
  1.6 本章小结  16-17
第二章 特征参数提取  17-29
  2.1 特征参数  17-21
    2.1.1 语音信号产生的数学模型  17-18
    2.1.2 卷积同态信号处理  18-19
    2.1.3 Mel频率倒谱系数(MFCC)  19-21
  2.2 在特征提取过程中的关键问题  21-25
    2.2.1 预加重  21-22
    2.2.2 加窗分帧  22-23
    2.2.3 特征参数的冗余性  23-25
  2.3 实验设计及结果分析  25-28
    2.3.1 特征参数的不同选取对VQ识别方法的影响  26-27
    2.3.2 特征参数的不同选取对CHMM识别方法的影响  27
    2.3.3 PCA对特征参数的降维处理对VQ和CHMM识别方法的影响  27-28
  2.4 本章小结  28-29
第三章 基于VQ识别方法的研究及改进  29-43
  3.1 VQ在说话人识别中的应用  29-33
    3.1.1 矢量量化的基本原理  29-30
    3.1.2 最佳矢量量化器  30-31
    3.1.3 失真测度  31-32
    3.1.4 VQ在说话人识别中的问题  32-33
  3.2 现有的码本设计算法研究  33-37
    3.2.1 LBG算法的码本设计  33
    3.2.2 对初始码本的改进  33-34
    3.2.3 基于遗传算法优化的码本  34-36
    3.2.4 基于粒子群优化算法优化的码本  36-37
  3.3 基于遗传算子和粒子群混合的K均值聚类码本设计改进算法  37-40
    3.3.1 K均值聚类  37-38
    3.3.2 参数的选取  38-39
    3.3.3 码本的设计过程  39-40
  3.4 实验设计及结果分析  40-42
    3.4.1 码本大小及各种码本生成方法对VQ识别方法的影响  40-42
  3.5 本章小结  42-43
第四章 基于CHMM识别方法的研究及改进  43-57
  4.1 CHMM在说话人识别中的应用  43-51
    4.1.1 HMM的基本思想  43-45
    4.1.2 HMM的基本算法  45-50
    4.1.3 CHMM在说话人识别中的问题  50-51
  4.2 现有的模型训练算法研究  51-53
    4.2.1 Baum-Welch训练算法  51
    4.2.2 分段K均值模型训练  51-53
    4.2.3 基于最大互信息的模型训练  53
  4.3 进化算法与Viterbi算法结合的模型训练改进方法  53-54
    4.3.1 基于遗传算法与Viterbi结合的参数训练方法  54
    4.3.2 基于粒子群优化算法与Viterbi结合的参数训练方法  54
  4.4 实验设计及结果分析  54-56
    4.4.1 在CHMM中状态数和高斯函数混合数对识别率的影响  54-56
    4.4.2 改进后的参数训练方法对CHMM识别方法的影响  56
  4.5 本章小结  56-57
第五章 与文本无关的说话人辨认系统设计  57-62
  5.1 系统的应用及原理  57-59
  5.2 系统设计  59-61
    5.2.1 说话人模型和特征参数的选取  59
    5.2.2 系统设计原理及关键问题  59-61
  5.3 本章小结  61-62
第六章 结束语  62-63
  6.1 全文总结  62
  6.2 下一步工作与展望  62-63
致谢  63-64
参考文献  64-67
在校期间取得的学术成果  67

相似论文

  1. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  2. 基于粒子群算法求曲线/曲面间最小距离方法,O182
  3. 有源电力滤波器及其在配电网中的应用,TN713.8
  4. 基于空间—频率域的织物组织识别新技术研究,TS101.923
  5. 基于变异粒子群的聚类算法研究,TP18
  6. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  7. 基于粒子群的分子对接算法,R91
  8. 基于样图的纹理合成算法研究,TP391.41
  9. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  10. 功能磁共振成像技术在前列腺癌诊断中的应用研究,R737.25
  11. 基于概率PCA的图像复原方法研究及其应用,TP391.41
  12. 基于控制方法的粒子群算法改进及应用研究,TP301.6
  13. 基于粒子群算法的露天矿道路路径优化研究,TP301.6
  14. 基于RFID监狱智能管理系统研究与实现,TP315
  15. 复杂动态环境下的小型足球机器人路径规划研究,TP242
  16. 注塑成型过程监测与故障诊断平台的设计与实现,TQ320.5
  17. 基于无线传感器网络的目标定位跟踪研究,TN929.5
  18. 移动机器人路径规划研究及仿真实现,TP242
  19. 基于粒子群算法的无线传感器网络路由技术研究,TP212.9
  20. 利用非局部相似性的图像超分辨率重建研究,TP391.41
  21. 变邻域搜索算法研究及在组合优化中的应用,TP301.6

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com