学位论文 > 优秀研究生学位论文题录展示
基于虚拟仪器技术的说话人识别研究
作 者: 吴香艳
导 师: 刘祥楼
学 校: 东北石油大学
专 业: 精密仪器及机械
关键词: 说话人识别 矢量量化 支持向量机 并行识别
分类号: TN912.34
类 型: 硕士论文
年 份: 2012年
下 载: 55次
引 用: 0次
阅 读: 论文下载
内容摘要
说话人识别就是通过分析说话人的语音特征来自动识别说话人的身份,它是生物认证技术的一种,在很多领域有广泛的应用前景。本课题旨在设计基于虚拟仪器技术的说话人识别系统,主要就是利用了虚拟仪器技术的多线程工作方式,将SVM和VQ两种方法结合在一起进行说话人识别,通过实验发现这两种方法具有互补性,从而提高了系统的性能。论文中详细地阐述了说话人识别原理以及系统实现过程。根据现有的特征参数选择方法的优缺点,文中选取了模拟人耳听觉特性的Mel倒谱参数(MFCC)及其反应动态特征的一阶差分参数合并作为语音信号的特征参数。在模式识别算法上,本文选用基于不同理论的矢量量化(VQ)方法和支持向量机(SVM)方法进行说话人识别。VQ技术是一种数据压缩和编码技术;SVM是基于统计理论的机器学习方法。将VQ和SVM两种方法集中在同一个平台上实现并行识别处理,从而在提高整个系统的识别效果的前提下节省识别时间。本系统以计算机软硬件为基础,利用LabVIEW与MATLAB之间的功能互补性构建一个简单的基于虚拟仪器技术的说话人识别系统,并进行了相关的实验与分析,结果表明将VQ和SVM两种方法结合起来进行说话人识别,可以使系统的识别率达到98%以上。
|
全文目录
摘要 4-5 ABSTRACT 5-6 创新点摘要 6-9 第一章 绪论 9-11 1.1 课题研究的背景及意义 9 1.2 说话人识别技术的研究现状 9-10 1.3 课题的研究内容和研究方法 10-11 第二章 说话人识别相关技术研究 11-17 2.1 语音信号的预处理技术研究 11-14 2.1.1 采样与量化 11 2.1.2 预加重、加窗分帧技术 11-12 2.1.3 端点检测技术 12-14 2.2 语音信号的特征参数提取技术研究 14-17 2.2.1 美尔频率倒谱参数及提取方法 15 2.2.2 差分倒谱系数提取方法 15-17 第三章 说话人识别方法研究 17-27 3.1 矢量量化(VQ)方法研究 17-21 3.1.1 矢量量化原理研究 17-19 3.1.2 矢量量化的最佳码本设计 19-21 3.2 支持向量机(SVM)方法研究 21-27 3.2.1 支持向量机的相关理论基础 21-24 3.2.2 核函数的选择及其参数优化 24-26 3.2.3 支持向量机模型的建立 26-27 第四章 说话人识别虚拟仪器系统的构建 27-36 4.1 虚拟仪器技术的应用 27 4.2 系统结构总体设计 27-28 4.3 语音信号的预处理及特征参数提取 28-29 4.4 说话人识别系统的实现 29-35 4.4.1 基于矢量量化的说话人识别 29-31 4.4.2 基于支持向量机的说话人识别 31-34 4.4.3 基于虚拟仪器技术的说话人识别系统实现 34-35 4.5 说话人识别系统的用户界面设计 35-36 第五章 实验结果分析 36-44 5.1 录音样本的采集 36 5.2 实验方案 36-37 5.3 实验过程及结果分析 37-44 5.3.1 VQ 算法中码本尺寸选择 37 5.3.2 核函数的选择 37-40 5.3.3 核函数参数的优化 40-41 5.3.4 SVM 模型中训练语料的选择 41-42 5.3.5 说话人识别系统测试 42-44 结论 44-45 参考文献 45-48 发表文章目录 48-49 致谢 49-50 附录 50-51 详细摘要 51-55
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 不匹配信道下耳语音说话人识别研究,TN912.34
- 基于文本挖掘的学者简历自动生成,TP391.1
- 基于特征选择的入侵检测研究,TP393.08
- 基于支持向量机的故障诊断研究,TH165.3
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|