学位论文 > 优秀研究生学位论文题录展示

与文本无关的说话人识别系统研究

作 者: 高会贤
导 师: 郑晓势
学 校: 山东轻工业学院
专 业: 计算机应用技术
关键词: 说话人识别 特征提取 模式匹配 矢量量化 高斯混合模型
分类号: TP391.41
类 型: 硕士论文
年 份: 2008年
下 载: 181次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别就是利用人的语音自动对其身份进行鉴别与认证的技术。说话人识别具有广阔的应用前景,已经成为身份认证及人工智能领域研究的一个热点。从20世纪30年代发展至今已经有许多比较成熟的说话人识别理论模型。为了提高说话人识别系统的性能,主要是识别率和稳定性,本课题针对说话人识别的两个关键环节,特征提取模式匹配展开研究,对原有的一些特征和匹配方法进行了改进,寻找出了更加简单有效的算法。主要内容如下:特征提取:研究了目前现有的几种用于说话人识别的主要特征参数,其中包括线性预测倒谱系数(LPCC)、美尔倒谱系数(MFCC)以及动态特征参数。模式匹配方法:对当今应用在与无本无关的说话人识别中效果较好的基于矢量量化(VQ)和高斯混合模型(GMM)的模式匹配方法做了深入的研究和改进。经过对上述两个问题的重点研究,本文提出了三种不同的说话人识别算法:(1)基于MFCC+质心和VQ的说话人识别算法经过对矢量量化方法的研究,通过对特征参数、码本大小和失真测度等的选取做的比较实验,提出了基于MFCC+质心和VQ的说话人识别算法。该算法提取不包括C0在内的前12个MFCC分量和质心构成的13维的组合参数来表征语音的个性特征。此算法的优点是计算简单,识别速度快。但也存在着在语音较短条件下识别率较低的缺点。(2)基于MFCC+ΔMFCC和GMM的说话人识别算法考虑到(1)中所述的基于MFCC+质心和VQ的说话人识别算法用在语音较短条件下识别率较低的缺点,又对高斯混合模型进行了研究,提出了基于MFCC+ΔMFCC和GMM的说话人识别算法。该算法提取MFCC分量的C2-C13以及它们的一阶差分系数ΔMFCC组成的24维的特征向量来表征语音。经实验表明,即使在语音较短的条件下,此方法也能得到比较高的识别率,但存在着识别速度较慢和识别结果不稳定的问题。(3)基于VQ-GMM的稳定高效的说话人识别算法为解决(2)中基于MFCC+ΔMFCC和GMM的说话人识别算法用于说话人辨认实验出现的识别结果不稳定的问题,将矢量量化和高斯混合模型成功进行了结合,提出了基于VQ-GMM的说话人识别算法。在这一算法中高斯混合模型的初始化参数来自于矢量量化的结果。提取的语音特征参数仍然是MFCC+ΔMFCC组成的24维的向量。与传统的初始化方法相比,将此算法用于语音较短的说话人辨认实验,识别率更高,更稳定。以上三种算法用于我们自己录制的50人的语音库进行说话人辨认实验中都取得了比较好的结果,可以根据需要应用在不同的场合。目前针对说话人识别的应用普遍性比较强,而针对性不够。因此,未来的工作主要是从语音信号中寻找具有较好鲁棒性和实时性的说话人语音特征,以及具有更好实效性的识别方法。另外还要考虑到现在说话人识别技术市场性不够的问题,在以后的研究中多针对实用中的某一方面进行深入的探讨。

全文目录


相似论文

  1. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  2. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  3. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  4. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  5. Q学习在基于内容图像检索技术中的应用,TP391.41
  6. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  7. 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
  8. 空间交会接近视觉测量方法研究,TP391.41
  9. 图像实时采集、存储与处理方法研究,TP391.41
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 多币种纸币处理技术的研究与实现,TP391.41
  12. 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
  13. 基于图像的路面破损识别,TP391.41
  14. 移动机器人视觉检测和跟踪研究,TP242.62
  15. 高光谱与高空间分辨率遥感图像融合算法研究,TP751
  16. 基于随机森林的植物抗性基因识别方法研究,Q943
  17. 基于图像处理技术的烟叶病害自动识别研究,S435.72
  18. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  19. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  20. 红外图像目标识别及跟踪技术研究,TP391.41
  21. 水下目标特征的压缩与融合技术研究,TN911.7

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com