学位论文 > 优秀研究生学位论文题录展示

说话人识别技术的研究与实现

作 者: 周翠梅
导 师: 殷福亮;陈喆
学 校: 大连理工大学
专 业: 电路与系统
关键词: 说话人辨认 美尔倒谱系数 话音激活检测 高斯混合模型 实时说话人识别系统
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 177次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别,也称为声纹识别,是一种利用测试语音对说话人进行身份识别的认证技术。作为语音信号处理的一个分支,说话人识别技术在网络安全、身份鉴别、电话会议、司法查证等领域已经得到广泛应用。随着信息技术的发展,这种生物认证技术逐步走出实验阶段向商用化方向发展。说话人识别技术从识别任务上分为说话人辨认和说话人确认,从识别内容上又分为文本无关和文本有关两方面。本文研究的内容主要是从应用角度出发,实现一个与文本无关的说话人辨认系统。本文的主要工作包括以下几方面:(1)概述了说话人识别技术的发展状况,并从两方面进行分析:表征说话人语音的特征参数选取和说话人辨认系统训练模型的建立。(2)选用了美尔倒谱系数(MFCC)作为语音特征参数,在具体实现时,使用了基于短时能量和短时过零率的话音激活检测(VAD)算法。为了进一步提高识别率,系统中加入了差分美尔倒谱系数(AMFCC).(3)主要采用高斯混合模型(GMM)进行系统建模识别,并对EM算法的初始分类分别采用了K均值和一般分类两种方法进行比较。(4)基于Windows音频采集系统,用MFC搭建界面,实现了实时说话人识别系统。该系统具有实时录音、实时识别等功能,实验数据给出了50人样本库的识别结果。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-13
  1.1 研究的应用背景和技术优势  8-9
    1.1.1 说话人识别的应用背景  8-9
    1.1.2 说话人识别的技术优势  9
  1.2 研究的历史过程和发展趋势  9-10
  1.3 说话人识别技术研究重点及难点  10-11
  1.4 本文主要工作  11-12
  1.5 本文内容安排  12-13
2 说话人识别的基本介绍  13-19
  2.1 说话人识别任务分类  13-14
  2.2 说话人识别的基本原理  14-15
  2.3 说话人识别的常用特征  15-16
  2.4 说话人识别的主要模型  16-19
3 特征参数的提取  19-32
  3.1 二元激励模型  19-20
  3.2 听觉特性  20-22
  3.3 美尔倒谱系数  22-27
  3.4 差分美尔倒谱系数  27-28
  3.5 端点检测实现  28-32
4 高斯混合模型  32-42
  4.1 高斯混合模型的概念  32-34
  4.2 EM算法的分析  34-35
  4.3 高斯混合模型的训练  35-40
    4.3.1 GMM的参数估计  35-37
    4.3.2 GMM的参数的初始化  37-39
    4.3.3 GMM的训练流程  39-40
  4.4 高斯混合模型的识别  40-42
5 说话人识别系统的搭建  42-54
  5.1 系统开发环境  42
  5.2 语音采集模块  42-47
    5.2.1 Windows下音频处理  42-43
    5.2.2 相关Windows消息  43
    5.2.3 相关消息响应函数  43-44
    5.2.4 音频采集的流程  44-47
  5.3 系统界面的实现  47-49
    5.3.1 界面总体架构  47
    5.3.2 具体步骤实现  47-49
    5.3.3 其他类的添加  49
  5.4 实验结果分析  49-54
结论  54-56
参考文献  56-59
攻读硕士学位期间发表学术论文情况  59-60
致谢  60-62

相似论文

  1. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  2. 面向智能交通的视频车辆检测、跟踪和识别算法研究,TP391.41
  3. 语音识别在访问控制的应用,TN912.34
  4. 基于GMM的说话人识别系统研究与实现,TN912.34
  5. 基于HMM的嵌入式非特定人连续英语语音识别的研究与实现,TN912.34
  6. 与文本无关的说话人识别关键技术研究及系统设计,TN912.34
  7. 视频对象分割与跟踪方法研究,TP391.41
  8. 基于矢量量化的音频信号辨析系统的研究,TN912.3
  9. 说话人身份识别系统的设计及DSP实现,TN912.34
  10. 基于动物叫声的物种识别技术的研究,TP391.42
  11. 基于特征的光学遥感图像舰船目标检测技术研究,TP751
  12. 基于图割理论的图像分割方法研究,TP391.41
  13. 低分辨率视频图像的人体检测与姿态识别,TP391.41
  14. 人脸表情识别的研究与分析,TP391.41
  15. 基于HMM的语音识别系统研究,TN912.34
  16. 基于人体运动特征的异常行为检测和姿态识别,TP391.41
  17. 基于MFCC与IMFCC的说话人识别研究,TN912.34
  18. 基于马尔科夫随机场理论的脑部磁共振图像分割算法研究,TP391.41
  19. 噪声环境下说话人识别研究,TN912.34
  20. 多信道条件下的说话人认证,TN912.34

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com