学位论文 > 优秀研究生学位论文题录展示
基于矢量量化和高斯混合模型的说话人识别技术研究
作 者: 陈妮
导 师: 盛利元
学 校: 中南大学
专 业: 电路与系统
关键词: 说话人识别 分形维 粗糙集 矢量量化 高斯混合模型
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 235次
引 用: 2次
阅 读: 论文下载
内容摘要
说话人识别是生物识别的一个分支,正以其独特的方便性、经济性和准确性等优势受到世人瞩目,是当前安全认证系统研究和发展的必然趋势。本文就小规模文本无关说话人识别的理论和技术进行了系统的研究。分别在语音库建立、语音去噪、端点检测、特征提取及识别方法等5个方面取得了较有成效的进展。建立了一个基于说话人识别的小型语音库,完成了20个人的语音样本采集工作,为算法测试奠定了物质基础。针对基于软阈值的多尺度小波去噪方法对清音的功率谱破坏较大,不利于保持语音完整性的缺点,提出了分段小波去噪方法,较完整的保留了清音的功率谱,同时充分利用了基于软阈值的多尺度小波去噪方法的去噪能力。对分形维数在端点检测中的应用进行了研究,研究表明和短时能量、短时过零率相比,分形维数具有更好的鲁棒性,适用于低信噪比环境。比较和分析了现有说话人识别特征,表明梅尔倒谱系数在单独使用时优势明显,梅尔倒谱系数及其二阶差分系数的组合具有更好的区分能力。提出了一种基于语音频谱的准基音频率,该特征依赖于浊音的谱特性,和基音频率相比具有较好的抗噪声、抗长时变动的能力。在不改变空间复杂度,不明显增加时间复杂度的前提下,利用语音无精确类别的特性,将粗糙集引入矢量量化中,降低了噪声的干扰能力。利用各语音段被噪声干扰的程度不同,提出了一种自适应补偿的高斯混合模型法,在一定信噪比范围内提高了系统的识别性能。本文用MATLAB建立了文本无关说话人识别的实验平台,实验结果表明改进算法的整体性能要优于传统算法,其中采用分形端点检测,小波去噪,MFCC特征和基于粗糙集的矢量量化方法的性能较好,在20dB信噪比下,识别率可达到98.03%。
|
全文目录
摘要 3-4 ABSTRACT 4-6 目录 6-8 第一章 绪论 8-14 1.1 研究背景及意义 8 1.2 研究现状 8-13 1.2.1 说话人识别实用化进程 8-9 1.2.2 说话人识别关键技术 9-12 1.2.3 重点及难点 12-13 1.3 论文工作及组织结构 13-14 第二章 说话人识别原理 14-28 2.1 语音物理基础 14-15 2.2 说话人识别结构 15-16 2.3 说话人识别理论基础 16-28 2.3.1 特征提取 16-22 2.3.2 模式识别 22-28 第三章 预处理与特征提取 28-40 3.1 预处理 28-32 3.1.1 语音去噪 28-30 3.1.2 端点检测 30-32 3.2 特征参数提取 32-40 3.2.1 特征评价方法 32 3.2.2 常用特征性能分析 32-36 3.2.3 准基音频率 36-40 第四章 模式库建立与模式识别 40-46 4.1 基于粗糙集的矢量量化 40-43 4.1.1 粗糙集理论 40-41 4.1.2 基于粗糙集的聚类算法 41-43 4.2 基于自适应补偿的高斯混合模型 43-46 4.2.1 自适应补偿基础 43 4.2.2 自适应补偿算法原理 43-44 4.2.3 自适应补偿法性能分析 44-46 第五章 算法实现与实验结果 46-59 5.1 语音库建立及信号预处理 46-55 5.1.1 语音库建立 46-47 5.1.2 预加重 47-48 5.1.3 信号加窗 48-49 5.1.4 语音去噪 49-52 5.1.5 端点检测 52-55 5.2 综合性能测试 55-59 5.2.1 基于粗糙集的矢量量化 56-57 5.2.2 基于自适应补偿的高斯混合模型 57-59 第六章 结论 59-60 参考文献 60-66 致谢 66-67 攻读学位期间主要的研究成果 67
|
相似论文
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 基于支持向量机的故障诊断方法研究,TP18
- 基于连锁图的QTL综合分析方法研究,S562
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 纤维布与混凝土正拉粘结性能的试验研究,TU528.572
- 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
- 高质量语音转换系统中关键技术的研究,TN912.3
- 量子粒子群算法研究及其在图像矢量量化码书设计中的应用,TP301.6
- 基于组合及统计的图像型垃圾邮件检测研究,TP391.41
- 粗糙集理论和Flex技术在中长期径流预报中的应用,P338
- 压缩感知算法及其在矢量量化中的应用,TN911.7
- 服装质量预测系统的软件设计与实现,TP311.52
- 多特征融合的视觉跟踪算法研究,TP391.41
- 水质时序数据处理及预警系统数据库构建技术研究,TP274
- 基于粗糙集理论的决策树分类算法与应用研究,TP18
- 基于综合效应的粗糙规划模型,O221
- 基于核心示例集的属性约简方法研究,O159
- 高速卡口车辆牌照检测与相关信息识别,TP391.41
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|