学位论文 > 优秀研究生学位论文题录展示

远程语音通话实时说话人确认系统研究与实现

作　者: 陈晓阳
导　师: 洪青阳
学　校: 厦门大学
专　业: 计算机应用技术
关键词: 实时说话人确认系统 GMM-UBM 实时端点检测
分类号: TN912.34
类　型: 硕士论文
年　份: 2009年
下　载: 90次
引　用: 0次
阅　读: 论文下载

内容摘要

说话人识别技术是一种生物认证技术,其可按不同的标准分成说话人辨认和说话人确认、文本相关和文本无关说话人识别等。在实用环境下,电话网络、通信网络的文本无关说话人确认系统已成为当前说话人识别研究的重点,在现阶段已开始出现基于这两个网络的实用实时说话人确认系统。本文的工作是围绕构建一个基于网络语音通话的实时说话人确认系统展开的,主要研究了实时语音端点检测、UBM背景模型训练、说话人模型的建立以及最终的说话人确认的判决等。本文分析了实时说话人确认系统在现阶段的发展和应用,提出了本文系统开发的背景和意义。本文改进传统的双门限语音端点检测算法,在求短时平均能量和短时平均过零率的阈值时,是对整个语音信号分别求能量值、过零率,再对帧能量值、过零率进行排序再求解阈值,改变了传统的基于经验值或者语音的前几秒来计算阈值的方法。经实验验证,该方法应用在实时的说话人确认系统中取得了很好的效果。按照GMM-UBM模型的说话人确认系统的流程,本文设计开发了基于网络远程语音通话的实时说话人确认系统,且在端点检测算法的作用下系统能达到较高的实时性。整个系统包括UBM训练子系统、说话人模型训练子系统、说话人确认子系统。最终针对20个人的测试语音数据,设计了一个实验方案使实验测试的结果更加可信。实验结果也显示了本系统可以达到了良好的效果。

全文目录

摘要  4-5
Abstract  5-10
第一章绪论  10-16
  1.1 说话人识别技术概述  10-13
  1.2 说话人识别技术研究进展  13-15
  1.3 论文的主要工作及组织结构  15-16
第二章说话人识别中的基本技术  16-36
  2.1 声音采集  16-17
  2.2 特征提取  17-21
    2.2.1 MFCC特征参数的计算过程  18-21
    2.2.2 MFCC特征参数各分量的相对重要性  21
  2.3 VAD语音端点检测  21-25
    2.3.1 端点检测的作用和过程  21-22
    2.3.2 常用端点检测方法的特征参数  22-25
  2.4 特征规整技术  25-26
  2.5 GMM-UBM模型  26-29
    2.5.1 GMM说话人模型  26-27
    2.5.2 通用背景模型UBM  27-29
  2.6 评分规整技术  29-31
  2.7 判决策略及性能评价标准  31-36
    2.7.1 判决策略  31
    2.7.2 性能评价标准  31-36
第三章基于双门限的实时语音端点检测方法研究  36-50
  3.1 说话人语音端点检测目标  36-37
  3.2 端点检测算法  37-46
    3.2.1 双门限端点检测方法的基本思想  37-38
    3.2.2 直流偏移消除  38-40
    3.2.3 确定短时平均能量和短时平均过零率阈值  40-44
    3.2.4 分词检测  44-45
    3.2.5 分词端点调整  45-46
    3.2.6 分词端点的最终确定  46
    3.2.7 产生新的语音数据  46
  3.3 实验结果  46-50
第四章远程语音通话实时说话人确认系统的实现  50-62
  4.1 实时说话人识别系统的应用分析  50-51
  4.2 multiASV 设计开发背景  51
  4.3 multiASV 系统组成  51-60
    4.3.1 UBM背景模型训练  52-53
    4.3.2 说话人模型的建立  53-55
    4.3.3 实时说话人确认子系统  55-60
  4.4 系统实验结果  60-62
    4.4.1 语音数据采集  60
    4.4.2 实验设计思路  60-61
    4.4.3 实验结果  61-62
第五章总结与展望  62-64
  5.1 论文工作总结  62
  5.2 未来展望  62-64
参考文献  64-66
发表论文  66-68
致谢  68

相似论文

基于电话信道的声纹识别算法研究,TN912.34
基于电话语音的少数民族语种识别研究,TN912.34
支持向量机在说话人识别系统中的应用,TP391.42
基于自适应高斯混合模型说话人识别的研究,TP391.42
面向手持应用的说话人识别算法研究,TN912.34
嵌入式声纹识别系统的研究与实现,TP391.42
基于GMM-UBM/SVM的维吾尔语电话信道说话人识别系统的研究,TN912.34
基于GMM-UBM的快速说话人识别方法,TN912.34
多重ANN/HMM混合模型在语音识别中的应用,TN912.34
基于DSP的机器人语音命令识别系统研制,TN912.34
基于多重分形的语音情感识别研究,TN912.34
基于电话信道的声纹识别算法研究,TN912.34
基于MIDI的乐器控制系统和音符的自动识别方法研究,TN912.34
基于水平阵的浅海时反匹配多目标定位研究,TN912.34
基于VC++6.0的说话人识别系统的研究,TN912.34
基于嵌入式系统的说话人识别,TN912.34
说话人识别中特征参数的提取及优化研究,TN912.34
基于支持向量机的民族语语种识别研究,TN912.34
语音关键词检出技术及置信度问题研究,TN912.34
语音识别中的语音前端噪声处理,TN912.34
高噪声背景下声纹识别系统的研究,TN912.34