学位论文 > 优秀研究生学位论文题录展示
多智能体系统协作模型及其在足球机器人仿真系统中的应用
作 者: 彭军
导 师: 吴敏
学 校: 中南大学
专 业: 控制理论与控制工程
关键词: 多智能体系统 机器人足球世界杯 协作模型 学习 规划
分类号: TP242
类 型: 博士论文
年 份: 2005年
下 载: 893次
引 用: 4次
阅 读: 论文下载
内容摘要
多智能体系统(MAS)的协作是近年来分布式人工智能领域的研究热点。机器人足球世界杯(RoboCup)仿真比赛是检验各种MAS理论的标准平台,在这个极为复杂的多智能体环境中,多智能体必须通过协作才能完成它们的共同目标:多进球赢得比赛。本文在RoboCup仿真球队的设计中,应用规划、学习和预测技术建立了MAS的协作策略和模型,主要研究工作有: 针对RoboCup足球机器人仿真系统面临的主要协作问题,提出一种双层的MAS协作模型框架,它包含协作策略和动作决策两层,这种结构不仅可以增强整个系统的智能度,而且还有利于多智能体间的动态实时协作。 采用基于状态的规划协作模型,实现了协作智能体对系统的快速实时反应,不仅提高了单个智能体的反应速度,而且还提高了整个MAS协作的效率。从RoboCup仿真比赛进攻的角度提出了一种基于合作意愿矩阵的传球规划协作策略,实现了一种不依赖于通信的显式多智能体协作。 用阵形将多个智能体联接成一个拥有共同目标的团队,并引入角色实现事先给定的任务分配和站位配合,从防守的角度出发,实现了基于阵形变换的多智能体动态防守协作,将案例学习应用到阵形设计中,突破了单凭直接经验设置阵形的局限。可实现积极防守阵形和消极防守阵形两个阵形之间动态变换,满足了不同阶段的防守协作要求,显著提高了球队的整体防守性能。 提出了一种基于亲密度模型进行动态防守协作的方法。在采用人盯人战术时,智能体通过亲密度的计算确定是否需要协助队友完成人盯人任务;在采用区域防守战术时,由阵形确定每个区域的主要责任人,由亲密度确定每个区域的次要责任人,来共同完成区域的防守任务。通过亲密度模型的应用,实现了智能体间更好的协作,解决了盯人失败导致漏人的问题和区域防守中边界无人盯防的问题,达到了分工和协作的统一。 从提高仿真球队的整体协作能力出发,提出了一种基于行为的预测方法,使RoboCup的协作模型设计简单、反应速度快、适应性好和智能度较高。采用基于行为预测的协作模型在CSU_YunLu队中实现了球队的协作决策,如传球和下底传中等小局部配合。
|
全文目录
第一章 绪论 11-23 1.1 研究背景及目的意义 11-17 1.1.1 多智能体系统的协作 11-15 1.1.2 足球机器人仿真系统 15-16 1.1.3 研究的目的及意义 16-17 1.2 国内外研究现状 17-20 1.2.1 理性智能体的BDI模型 17-18 1.2.2 规划协作模型 18 1.2.3 基于学习的自协调模型 18-20 1.3 主要研究内容与基本思想 20-21 1.4 论文构成 21-23 第二章 多智能体系统协作模型的总体框架 23-37 2.1 RoboCup仿真系统 23-28 2.1.1 仿真环境 23-24 2.1.2 设计难点 24-25 2.1.3 仿真球队的设计 25-28 2.2 RoboCup仿真系统的主要协作问题 28-29 2.3 实现多智能体协作的关键技术 29-31 2.4 多智能体系统协作模型的总体框架 31-36 2.5 小结 36-37 第三章 基于状态和合作意愿的规划协作 37-52 3.1 基于状态的规划协作模型 37-40 3.1.1 状态规划 38 3.1.2 协作模型 38-39 3.1.3 SBPC的三要素 39-40 3.2 SBPC模型在Robocup中的应用 40-43 3.3 基于合作意愿矩阵的规划协作策略 43-49 3.3.1 几种传球方法的比较 44-46 3.3.2 基于合作意愿矩阵的规划协作策略 46-49 3.4 规划协作策略在RoboCup中的应用 49-51 3.5 小结 51-52 第四章 基于阵形变换和亲密度的动态协作 52-70 4.1 角色和阵形 52-56 4.1.1 角色 52-53 4.1.2 阵形 53-56 4.2 基于阵形变换的动态防守协作模型 56-61 4.2.1 模型的结构 56-59 4.2.2 阵形变换模块 59-60 4.2.3 动态防守协作模型在RoboCup中的应用 60-61 4.3 亲密度模型的建立 61-64 4.3.1 足球比赛中防守战术分析 61-63 4.3.2 亲密度模型 63-64 4.4 亲密度模型在RoboCup动态防守协作中的应用 64-68 4.4.1 基于亲密度模型的人盯人动态防守协作策略 64-65 4.4.2 基于亲密度模型的区域动态防守协作策略 65-68 4.5 小结 68-70 第五章 多智能体协作策略的统计Q学习 70-87 5.1 多智能体增强学习 70-72 5.1.1 增强学习 70-71 5.1.2 多智能体增强学习 71-72 5.2 多智能体O学习 72-74 5.2.1 增强Q学习 72-73 5.2.2 多智能体Q学习模型 73-74 5.3 基于统计的多智能体Q学习 74-82 5.3.1 统计多智能体Q学习 74-76 5.3.2 统计多智能体Q学习算法 76-77 5.3.3 算法收敛性证明 77-81 5.3.4 算法有效性分析 81-82 5.4 RoboCup中协作策略的学习 82-86 5.4.1 防守协作策略的离线学习 83-84 5.4.2 算法性能分析 84-86 5.5 小结 86-87 第六章 基于预测的多智能体协作模型 87-101 6.1 基于行为预测的多智能体协作模型 87-92 6.1.1 智能体行为预测的方法 87-89 6.1.2 基于行为预测的协作模型 89-90 6.1.3 预测协作模型在RoboCup中的应用 90-92 6.2 基于预测的多智能体Q学习 92-98 6.2.1 预测Q学习的引入 93-94 6.2.2 多智能体预测Q学习模型 94-97 6.2.3 学习性能分析 97-98 6.3 高层协作策略的预测Q学习 98-100 6.3.1 前场对抗与协作策略的学习 98-99 6.3.2 算法性能分析 99-100 6.4 小结 100-101 第七章 结论与展望 101-104 7.1 结论 101-103 7.2 展望 103-104 参考文献 104-113 图索引 113-114 表索引 114-115 致谢 115-116 攻读学位期间主要的研究成果目录 116
|
相似论文
- 基于多Agent理论的卫星协同定轨技术研究,V474
- 基于流形学习的高维流场数据分类研究,V231.3
- 我国当代总体城市设计实证研究,TU984
- 英语课堂形成性评估与学生学习态度研究,H319.3
- 非智力因素对小凉山地区中学生化学学习的影响,H319
- 任务型教学在农村初中英语教学中的应用研究,H319
- 中职学生数学学习中的非智力因素研究,G633.6
- 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 动态环境下移动对象导航系统相关技术的研究,TP301.6
- 面向火箭发动机的数字化装配工艺系统研究与开发,TP391.7
- 多样性密度学习算法的研究与应用,TP181
- 基于改进蚁群算法的机器人路径规划研究,TP242
- 基于全局视觉的仿人机器人足球比赛系统,TP242.6
- 晶圆传输机器人关键控制技术研究,TP242.2
- 再入弹头的移动质心控制方法研究,TJ765.23
- 广东省土地利用总体规划问题与对策研究,F301
- 基于过程的协作学习环境设计研究,G434
- 美国“写作教室”理论与实践初探,G633.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 机器人技术 > 机器人
© 2012 www.xueweilunwen.com
|