学位论文 > 优秀研究生学位论文题录展示
基于改进的特征参数的说话人识别研究
作 者: 刘明娟
导 师: 张薇
学 校: 东北大学
专 业: 基础数学
关键词: 说话人识别 特征提取 主成分分析 基音周期 高斯混合模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 46次
引 用: 0次
阅 读: 论文下载
内容摘要
本文对与文本无关的说话人识别进行研究,研究内容主要有以下几个方面:在预处理阶段,采用语音信号的短时能量与短时过零率想结合的方法对其进行端点检测,提高了端点检测的准确率.在特征提取阶段,首先用主成分分析的方法对梅尔倒谱系数(MFCC)进行改进,然后再与反映说话人声道特征的基音周期相结合构成新的语音特征参数.此外,对新的特征参数进行了性能分析,分析结果表明了新的特征参数表征说话人的能力比MFCC稍强.在识别阶段,通过个人建立语音库将改进的特征参数用于高斯混合模型,并基于最大后验概率的方法对说话人进行判决,最后进行仿真实验,实验结果表明新的特征参数用于说话人识别比MFCC的识别率稍高.本文所有算法都能够编程实现.仿真实验结果表明,算法效果良好.
|
全文目录
摘要 5-6 Abstract 6-9 第1章 绪论 9-13 1.1 引言 9 1.2 研究背景和意义 9-10 1.3 研究现状和发展趋势 10-11 1.4 本文工作 11-13 第2章 说话人识别简介 13-17 2.1 说话人识别概述 13 2.2 说话人识别的基本原理 13-14 2.3 说话人识别系统 14-17 2.3.1 说话人识别结构 14-15 2.3.2 语音特征参数 15-16 2.3.3 说话人识别方法 16-17 第3章 语音信号的预处理与特征提取 17-35 3.1 语音信号预处理 17-19 3.1.1 语音信号的端点检测 17-18 3.1.2 语音信号的预加重 18 3.1.3 语音信号的分帧与加窗 18-19 3.2 语音信号特征参数及提取 19-35 3.2.1 经典特征参数及提取 19-25 3.2.2 改进的混合特征参数及提取 25-30 3.2.3 特征参数的性能分析 30-31 3.2.4 仿真 31-35 第4章 基于高斯混合模型的说话人识别方法 35-43 4.1 高斯混合模型GMM 35-41 4.1.1 GMM描述及在说话人识别中的应用 35-37 4.1.2 GMM的阶数 37 4.1.3 高斯混合模型的参数初始化 37-38 4.1.4 高斯混合模型的参数估计 38-40 4.1.5 基于最大后验概率的说话人判别方法 40-41 4.2 说话人识别算法的仿真 41-43 第5章 总结 43-45 参考文献 45-47 致谢 47
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 基于质谱的雷公藤甲素肝脏毒性代谢组学研究,R285
- 改进的主成分分析方法在学科建设中的应用,G642.4
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 红外图像目标识别及跟踪技术研究,TP391.41
- 高分辨率SAR影像裸土信息提取及土壤含水量反演初探,S152.7
- 太行山猕猴掌面花纹嵴数的形态学研究,Q954
- 赵官煤矿下组煤底板突水预测及防治技术研究,TD745
- 重庆市汽车产业有效竞争研究,F426.471
- 基于模糊聚类的图像检索方法研究及其系统实现,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|