学位论文 > 优秀研究生学位论文题录展示
基于DIVA模型语音生成与获取的扰动研究
作 者: 高丽琴
导 师: 张少白
学 校: 南京邮电大学
专 业: 计算机应用技术
关键词: DIVA模型 神经传输延迟 前馈控制 反馈控制 扰动 鲁棒性
分类号: TN912.3
类 型: 硕士论文
年 份: 2012年
下 载: 23次
引 用: 0次
阅 读: 论文下载
内容摘要
语音生成与获取是动力学、声学、数学等诸多基础学科的一个比较前沿的重要交叉点,它也是机器人研究领域中的一个重要分支,对它的理论研究不仅可以使我们更好地分析语音的各个方面,更可以将其应用到现实中非常广阔的实践中去。DIVA(DirectionsInto VelocitiesofArticulators)模型是一种普遍用于语音生成与获取后描述相关处理过程的数学模型,因此基于DIVA模型语音生成与获取的扰动研究,又将为这些领域的研究提供一些可行的依据,并促进这些领域的交叉发展。本文首先介绍了DIVA模型国内外的研究现状和发展动态;然后详细介绍了DIVA模型中前馈控制子系统(预测系统)和反馈控制子系统的相关理论;但是目前这个模型并不完全具备神经学意义上的控制功能,针对这些不足,本文对语音运动控制方面的延迟问题进行了研究,并且针对模型神经网络学习过程中延迟参数变化引起的网络状态扰动问题进行了扰动补偿仿真实验。实验结果表明,本文给出的方法行之有效且鲁棒性良好。接着在理论上对DIVA模型的鲁棒性进行论述,分别对理想状况下的模型和较为复杂环境下的模型的鲁棒性做出概念论述,并进行仿真实验,实验结果表明在一些随机选定的情况下,DIVA模型的鲁棒性都能趋于平衡。最后,对研究内容进行了总结,并指出了后续的研究方向,为进一步的研究开拓了思路。
|
全文目录
摘要 4-5 ABSTRACT 5-6 目录 6-8 第一章 绪论 8-11 1.1 课题意义 8 1.2 国内外研究现状 8-9 1.3 本文研究内容及论文结构 9-11 1.3.1 本文研究内容 9-10 1.3.2 论文结构 10-11 第二章 DIVA 模型的介绍 11-21 2.1 DIVA 模型的组成 11-16 2.1.1 语音识别系统(Speech Recognition System) 12-13 2.1.2 语音映射(Speech Sound Map) 13 2.1.3 体觉方向向量(Orosensory Direction Vector) 13-14 2.1.4 发音速度向量(Articulator Velocity Vector) 14-15 2.1.5 GO 信号(Go Singal) 15 2.1.6 语音获取技术 15-16 2.2 DIVA 模型的发展 16-19 2.2.1 运动前区皮层语音映射 17-18 2.2.2 运动皮层的速度和位置映射 18-19 2.3 DIVA 模型存在的问题 19-21 第三章 基于扰动前馈补偿与反馈技术相结合的控制方法 21-32 3.1 引言 21 3.2 语音延迟 21-22 3.3 反馈控制子系统 22-28 3.3.1 听觉状态映射 23-24 3.3.2 体觉状态映射 24 3.3.3 语音目标的编码 24-26 3.3.4 听觉和体觉误差映射 26-27 3.3.5 纠正误差 27-28 3.4 前馈控制子系统 28-29 3.5 前馈控制子系统与反馈控制子系统结合 29 3.6 仿真实验 29-32 第四章 扰动作用下DIVA 模型鲁棒性研究 32-45 4.1 引言 32 4.2 鲁棒性 32-33 4.2.1 鲁棒性的研究意义与价值 32-33 4.2.2 鲁棒性的定义 33 4.3 声道模型的鲁棒性 33-38 4.3.1 声道模型鲁棒性的数学分析 33-38 4.4 神经网络的鲁棒性 38-43 4.4.1 引言 38 4.4.2 参数扰动对DIVA 模型稳定性的影响 38 4.4.3 神经网络的鲁棒性的数学分析 38-43 4.5 仿真实验 43-45 第五章 总结与展望 45-47 5.1 总结 45 5.2 展望 45-47 致谢 47-48 参考文献 48-52 攻读硕士学位期间发表学术论文情况 52
|
相似论文
- 漂移量靶标反馈激光自准直系统关键技术,TH741.14
- 天波超视距雷达目标仿真与信号处理算法研究,TN958.93
- 自适应模糊控制算法研究及其实现,TP273.4
- 关于混沌系统同步控制方面的研究,O415.5
- 基于甘油跨膜运输混杂动力系统的鲁棒性与辨识,TQ223.162
- Banach空间上基和框架扰动的研究,O177.2
- 非线性演化方程的Frobenius可积分解与可积系统的扩展,O175.5
- 一类带有凹凸顶的半线性椭圆边值问题的多解性研究,O175.8
- 基于COCM的除草机视觉定位研究,TP391.41
- 宁夏恒力含酸废水综合处理系统pH值控制技术研究,TP273
- 基于语音生成和获取中声音分类学习的神经模型研究,TN912.3
- 大震下防倒塌性能好的结构体系及结构布置研究,TU352.11
- 改进蚁群算法在盲均衡中的应用,TN911.5
- 托卡马克J-TEXT装置中电子密度反馈控制系统的研究,TL631.24
- 某工程隔离桩施工对土体扰动研究,TU473.1
- 基于三单相H桥的动态电压调节器的研究,TM464
- 大容量数字指纹系统的嵌入算法研究,TP309.7
- 扰动对铜绿微囊藻生长的影响,X173
- 不确定系统的鲁棒故障估计与主动容错控制研究,TP13
- 模型预测控制的抗扰性能分析与改进方法研究,TP273
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|