学位论文 > 优秀研究生学位论文题录展示

基于JFA的汉语耳语音说话人识别

作 者: 王琰蕾
导 师: 赵鹤鸣
学 校: 苏州大学
专 业: 通信与信息系统
关键词: 耳语音 说话人识别 联合因子分析 说话人因子 信道因子
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 45次
引 用: 1次
阅 读: 论文下载
 

内容摘要


耳语音说话人识别在公共场合下的通讯、安全场所的身份鉴定、罪犯识别、电话网络查询与电话银行等领域都有着一定的实用价值。它是一个较新的研究课题,有许多问题尚待解决。由于耳语发音方式的特殊性加上耳语通话常常在手机方式下进行,耳语音说话人识别受说话人发音状态、健康状况、心理因素及信道环境因素的影响变得更为突出。因此,用正常音建立的说话人识别系统对耳语音说话人识别基本不适用,识别性能将大为下降。目前已有的自适应补偿方法都将说话人变化和信道环境变化这两种因素混在一起,不加区分,这样的处理方式必然会影响耳语音说话人识别的识别效果。为此,有必要针对耳语音的特点,建立合适的识别模型来实现文本无关的耳语音说话人识别。本文提出采用联合因子分析(JFA)的方法来解决耳语发音时受多种因素影响说话人语音特征变异大的问题,该方法针对耳语音的特点引入了两类变化因子:说话人自身变化因子和通话信道环境变化因子。鉴于联合因子分析的难点,本文提出了一种适用于耳语音说话人识别的简化的联合因子分析方法,其最主要的特点是分开估计说话人空间和信道空间,因此在算法的复杂度和语音数据的需求量上都有很大的下降,从而大大降低了运算量和运算时间。本文建立了一种基于简化的JFA方法的识别模型,并且给出了相应的算法,在此基础上实现了耳语发音方式下与文本无关的说话人辨认。对本文提出的简化的JFA识别模型在8种不同的信道环境情况下分别进行测试,实验证明,该模型在信道失配的情况下也能有效地辨认耳语音说话人,并与已有的采用MAP、特征映射(Feature Mapping)和说话人模型合成(SMS)方法的GMM模型进行比较,识别正确率有了明显的提高。此外,还研究了说话人因子数和信道因子数对该识别模型性能的影响,实验发现,适当地增加说话人因子数和信道因子数有助于提高识别的正确率,但是两者均存在着一定的饱和问题,即继续增加说话人因子数和信道因子数对识别模型的性能几乎没有任何提高。

全文目录


摘要  4-6
Abstract  6-11
第一章 绪论  11-23
  1.1 研究的意义  11-13
  1.2 研究的背景和现状  13-16
  1.3 说话人识别的关键问题  16-20
    1.3.1 数据库  16-17
    1.3.2 特征参数  17-18
    1.3.3 模式识别模型  18-20
  1.4 本文的主要工作  20-21
  1.5 论文结构安排  21-23
第二章 耳语音的特征参数  23-40
  2.1 语音的发音系统  23-24
  2.2 语音特征参数的分析  24-33
    2.2.1 语音信号产生的数学模型  25-26
    2.2.2 基音频率  26-27
    2.2.3 共振峰  27-28
    2.2.4 线性预测倒谱系数(LPCC)  28-30
    2.2.5 美尔频率倒谱系数(MFCC)  30-33
  2.3 特征参数优化的方法  33-35
    2.3.1 高阶差分参数  34
    2.3.2 倒谱均值减(CMS)  34-35
  2.4 耳语音的特点  35-37
    2.4.1 生理特点  35-36
    2.4.2 声学特性  36-37
  2.5 耳语音特征参数的分析  37-39
    2.5.1 耳语音产生的数学模型  37-38
    2.5.2 MFCC 修正参数  38-39
  2.6 本文采用的特征参数  39-40
第三章 基于GMM 模型的说话人识别  40-52
  3.1 说话人识别的分类  40
  3.2 GMM 模型的基本概念  40-42
  3.3 主成分分析(PCA)  42-43
  3.4 通用背景模型(UBM)  43-48
    3.4.1 分裂法  44
    3.4.2 K-means 算法  44-46
    3.4.3 EM 算法  46
    3.4.4 UBM 训练中需要注意的问题  46-48
  3.5 说话人模型的自适应  48-49
  3.6 基于对数似然度的辨认算法  49-50
  3.7 实验结果及分析  50-52
第四章 信道失配下的说话人识别  52-61
  4.1 GMM 均值超矢量  52-53
  4.2 说话人超矢量的PCA 映射  53-54
  4.3 信道问题典型的两种解决方法  54-56
    4.3.1 特征映射(Feature Mapping)  54-55
    4.3.2 说话人模型合成(SMS)  55-56
  4.4 因子分析  56-61
    4.4.1 因子分析的基本概念  57-58
    4.4.2 联合因子分析(JFA)  58-59
    4.4.3 本征信道  59-61
第五章 简化的联合因子分析  61-74
  5.1 联合因子分析的难点  61
  5.2 简化的联合因子分析方法  61-62
  5.3 基于简化的JFA 方法的说话人辨认模型  62-66
    5.3.1 UBM 的训练  62
    5.3.2 Baum-Welch 统计量的计算  62-63
    5.3.3 说话人空间和信道空间的分开估计  63-65
    5.3.4 说话人模型的训练  65-66
    5.3.5 基于线性得分的辨认算法  66
  5.4 实验结果及分析  66-74
第六章 总结与展望  74-75
  6.1 论文工作总结  74
  6.2 今后研究展望  74-75
参考文献  75-81
攻读硕士学位期间公开发表的论文  81-82
致谢  82-83

相似论文

  1. 复杂信道下的说话人识别技术,TN912.34
  2. 基于VC++6.0的说话人识别系统的研究,TN912.34
  3. 基于混合特征和高斯混合模型的说话人识别研究,TN912.34
  4. 基于Windows CE的说话人识别系统的设计与实现,TN912.34
  5. 说话人识别中特征参数的提取及优化研究,TN912.34
  6. 基于文本无关的说话人识别研究,TN912.34
  7. 多路并行实时说话人识别算法研究与实现,TN912.34
  8. 基于支持向量机的说话人识别系统的开发,TN912.34
  9. 与文本无关的开集说话人识别技术研究,TN912.34
  10. 噪声环境下的说话人识别研究,TN912.34
  11. 基于EMD的说话人识别研究,TN912.34
  12. 基于GMM-UBM的快速说话人识别方法,TN912.34
  13. 网络环境下实时音频解码与鲁棒说话人识别系统研究,TN912.34
  14. 文本相关说话人识别嵌入式系统及其关键技术研究,TN912.34
  15. 基于语音信号时变特性的说话人识别,TN912.34
  16. 基于韵律特征的SVM说话人识别,TN912.34
  17. 基于混合高斯模型的说话人识别,TN912.34
  18. 说话人识别中集外话者的拒识方法研究,TN912.34
  19. 噪声环境下说话人特征参数提取研究,TN912.3
  20. 说话人识别系统的研究及DSP实现,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com