学位论文 > 优秀研究生学位论文题录展示

基于矢量量化和高斯混合模型的说话人识别技术研究

作 者: 陈妮
导 师: 盛利元
学 校: 中南大学
专 业: 电路与系统
关键词: 说话人识别 分形维 粗糙集 矢量量化 高斯混合模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 235次
引 用: 2次
阅 读: 论文下载
 

内容摘要


说话人识别是生物识别的一个分支,正以其独特的方便性、经济性和准确性等优势受到世人瞩目,是当前安全认证系统研究和发展的必然趋势。本文就小规模文本无关说话人识别的理论和技术进行了系统的研究。分别在语音库建立、语音去噪、端点检测、特征提取及识别方法等5个方面取得了较有成效的进展。建立了一个基于说话人识别的小型语音库,完成了20个人的语音样本采集工作,为算法测试奠定了物质基础。针对基于软阈值的多尺度小波去噪方法对清音的功率谱破坏较大,不利于保持语音完整性的缺点,提出了分段小波去噪方法,较完整的保留了清音的功率谱,同时充分利用了基于软阈值的多尺度小波去噪方法的去噪能力。对分形维数在端点检测中的应用进行了研究,研究表明和短时能量、短时过零率相比,分形维数具有更好的鲁棒性,适用于低信噪比环境。比较和分析了现有说话人识别特征,表明梅尔倒谱系数在单独使用时优势明显,梅尔倒谱系数及其二阶差分系数的组合具有更好的区分能力。提出了一种基于语音频谱的准基音频率,该特征依赖于浊音的谱特性,和基音频率相比具有较好的抗噪声、抗长时变动的能力。在不改变空间复杂度,不明显增加时间复杂度的前提下,利用语音无精确类别的特性,将粗糙集引入矢量量化中,降低了噪声的干扰能力。利用各语音段被噪声干扰的程度不同,提出了一种自适应补偿的高斯混合模型法,在一定信噪比范围内提高了系统的识别性能。本文用MATLAB建立了文本无关说话人识别的实验平台,实验结果表明改进算法的整体性能要优于传统算法,其中采用分形端点检测,小波去噪,MFCC特征和基于粗糙集的矢量量化方法的性能较好,在20dB信噪比下,识别率可达到98.03%。

全文目录


摘要  3-4
ABSTRACT  4-6
目录  6-8
第一章 绪论  8-14
  1.1 研究背景及意义  8
  1.2 研究现状  8-13
    1.2.1 说话人识别实用化进程  8-9
    1.2.2 说话人识别关键技术  9-12
    1.2.3 重点及难点  12-13
  1.3 论文工作及组织结构  13-14
第二章 说话人识别原理  14-28
  2.1 语音物理基础  14-15
  2.2 说话人识别结构  15-16
  2.3 说话人识别理论基础  16-28
    2.3.1 特征提取  16-22
    2.3.2 模式识别  22-28
第三章 预处理与特征提取  28-40
  3.1 预处理  28-32
    3.1.1 语音去噪  28-30
    3.1.2 端点检测  30-32
  3.2 特征参数提取  32-40
    3.2.1 特征评价方法  32
    3.2.2 常用特征性能分析  32-36
    3.2.3 准基音频率  36-40
第四章 模式库建立与模式识别  40-46
  4.1 基于粗糙集矢量量化  40-43
    4.1.1 粗糙集理论  40-41
    4.1.2 基于粗糙集的聚类算法  41-43
  4.2 基于自适应补偿的高斯混合模型  43-46
    4.2.1 自适应补偿基础  43
    4.2.2 自适应补偿算法原理  43-44
    4.2.3 自适应补偿法性能分析  44-46
第五章 算法实现与实验结果  46-59
  5.1 语音库建立及信号预处理  46-55
    5.1.1 语音库建立  46-47
    5.1.2 预加重  47-48
    5.1.3 信号加窗  48-49
    5.1.4 语音去噪  49-52
    5.1.5 端点检测  52-55
  5.2 综合性能测试  55-59
    5.2.1 基于粗糙集的矢量量化  56-57
    5.2.2 基于自适应补偿的高斯混合模型  57-59
第六章 结论  59-60
参考文献  60-66
致谢  66-67
攻读学位期间主要的研究成果  67

相似论文

  1. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  2. 基于支持向量机的故障诊断方法研究,TP18
  3. 基于连锁图的QTL综合分析方法研究,S562
  4. 基于遗传算法和粗糙集的聚类算法研究,TP18
  5. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  6. 粗糙集的增量式属性约简研究,TP18
  7. 知识粒度的计算及其在属性约简中的应用研究,TP18
  8. 纤维布与混凝土正拉粘结性能的试验研究,TU528.572
  9. 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
  10. 高质量语音转换系统中关键技术的研究,TN912.3
  11. 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
  12. 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
  13. 粗糙集理论和Flex技术在中长期径流预报中的应用,P338
  14. 压缩感知算法及其在矢量量化中的应用,TN911.7
  15. 服装质量预测系统的软件设计与实现,TP311.52
  16. 多特征融合的视觉跟踪算法研究,TP391.41
  17. 水质时序数据处理及预警系统数据库构建技术研究,TP274
  18. 基于粗糙集理论的决策树分类算法与应用研究,TP18
  19. 基于综合效应的粗糙规划模型,O221
  20. 基于核心示例集的属性约简方法研究,O159
  21. 高速卡口车辆牌照检测与相关信息识别,TP391.41

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com