学位论文 > 优秀研究生学位论文题录展示
非线性系统的自适应学习控制及其应用
作 者: 唐丽
导 师: 刘艳军
学 校: 辽宁工业大学
专 业: 应用数学
关键词: 自适应控制 强化学习 神经网络 非线性系统 死区输入
分类号: O231
类 型: 硕士论文
年 份: 2014年
下 载: 31次
引 用: 0次
阅 读: 论文下载
内容摘要
自适应与学习控制对于处理不确定性是非常有效的方法,能在线估计未知信息,以改进系统的控制性能。本论文基于自适应强化学习方法,研究不确定系统的优化控制方法及应用,主要做了以下两方面的工作:(1)首先,针对一类机器臂系统,设计一种自适应神经网络控制算法。神经网络用于逼近系统的不确定性。基于强化学习理论,通过引入性能指标函数,利用梯度下降法,设计的控制器使得性能指标函数达到最小值,实现优化控制的目的。然而,当死区输入存在时,这个方法不能保证闭环系统的稳定性。因此,本文同时研究了带有死区的机器臂系统的优化控制问题。这里,假设死区参数未知但有界。同样运用强化学习理论,设计了一个最优控制器。最后,根据李雅普诺夫稳定性定理分析,证明了闭环系统的所有信号都有界。仿真结果证明了设计算法的有效性。(2)针对一类具有输出约束条件的混沌系统,设计了一种自适应控制算法。运用Barrier李雅普诺夫稳定性函数方法避免了系统输出违背约束条件。随后,研究了一类离散混沌系统的自适应神经网络优化控制问题,运用强化学习理论,使性能指标函数达到最小值。与离散混沌系统的控制方法相比较,提出的方法解决了最优控制问题,减少了控制器的设计成本。基于李雅普诺夫理论,证明了闭环系统的稳定性。仿真结果进一步说明了提出方法的有效性。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-15 1.1 自适应控制定义、特征及分类 8-10 1.1.1 自适应控制的定义与特征 8 1.1.2 自适应控制系统的分类 8-10 1.2 加强学习定义及结构 10 1.3 李亚普诺夫稳定性理论 10-13 1.3.1 稳定性分类 10-11 1.3.2 李雅普诺夫第一方法 11-12 1.3.3 李雅普诺夫第二方法 12-13 1.4 神经网络逼近性能 13-15 2 一类机器臂的自适应神经网络控制 15-27 2.1 引言 15 2.2 系统描述 15-16 2.3 控制器设计 16-19 2.3.1 执行网络 16-18 2.3.2 评判网络 18-19 2.4 稳定性分析 19-24 2.5 仿真研究 24-26 2.6 本章小结 26-27 3 带有死区的机器臂自适应神经网络控制 27-36 3.1 引言 27 3.2 系统描述 27-29 3.3 控制器设计 29-30 3.3.1 执行网络 29 3.3.2 评判网络 29-30 3.4 稳定性分析 30-32 3.5 仿真研究 32-35 3.6 本章小结 35-36 4 带有状态约束的 Arneodo 混沌系统的自适应控制 36-44 4.1 引言 36 4.2 系统描述 36-37 4.3 控制器设计 37-40 4.4 稳定性分析 40 4.5 仿真研究 40-43 4.6 本章小结 43-44 5 一类离散混沌系统的自适应神经网络控制 44-53 5.1 引言 44 5.2 系统描述 44-45 5.3 控制器设计 45-46 5.4 稳定性分析 46-50 5.5 仿真研究 50-52 5.6 本章小结 52-53 6 结论 53-54 参考文献 54-58 攻读硕士期间发表学术论文情况 58-59 致谢 59
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
- 陀螺稳定吊舱控制系统稳定回路设计与研究,V241.5
- 航天器姿态动力学系统鲁棒自适应控制方法研究,V448.22
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 视觉伺服四自由度机械臂的研究,TP242.6
- 机械臂视觉伺服系统的研究,TP242.6
- 非线性变结构导引规律的研究,TJ765
- 压电驱动微工作台的控制与校正技术研究,TP273
- 一类欠驱动Lagrangian系统的最优同步控制,TP13
- 某武器检测装置的控制系统设计,TP183
- 自适应模糊控制算法研究及其实现,TP273.4
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
中图分类: > 数理科学和化学 > 数学 > 控制论、信息论(数学理论) > 控制论(控制论的数学理论)
© 2012 www.xueweilunwen.com
|