学位论文 > 优秀研究生学位论文题录展示
多智能体救援仿真系统研究
作 者: 洪长昊
导 师: 叶秀芬
学 校: 哈尔滨工程大学
专 业: 控制理论与控制工程
关键词: 多智能体系统 机器人救援仿真系统 路径规划 任务分配 任务协作
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 21次
引 用: 0次
阅 读: 论文下载
内容摘要
多智能体系统是近年来分布式人工智能领域的一个重要研究方向。本文以对机器人救援仿真系统(RoboCupRescue Simulation System, RCRSS)的研究作为基础,针对动态复杂的救援环境,研究了多智能体在动态环境下的路径规划、同构多智能体的任务分配、异构多智能体的任务协作等关键问题。主要研究内容如下:机器人救援仿真系统(RoboCupRescue Simulation System, RCRSS)是一个典型的异构多智能体系统,也是一个实时的分布式仿真系统,它为多智能体系统、异构智能体、机器人救援的技术和相关理论研究提供试验平台。为了更好的应用机器人救援仿真系统这个平台,论文首先系统的总结了机器人救援仿真系统中的基本要素、仿真过程以及多智能体的控制方法,为平台的应用打下坚实的基础。为了解决救援智能体在路况动态变化的震后城市中快速的找到救援目标的问题,论文提出了一种基于改进蚁群算法的动态路径搜索算法。该算法通过引入基于改进启发函数的状态转移规则对蚁群的搜索过程进行引导,加大搜索范围,避免陷入局部最优。通过引入基于调节信息素挥发度的自适应蚁群算法来加快蚁群的收敛速度,提高搜索质量。针对同构多智能体间的任务分配问题,采用了一种基于拍卖的任务分配算法,此算法主要包括了基于拍卖方式的任务分配方案和基于贪心策略的动态调整两个过程,采用基于拍卖方式的任务分配方案综合考虑拍卖信息的效益、花费比,选取接近最优的分配方案;在分配方案确定后,利用贪心策略对智能体的任务情况进行实时动态调整,达到当前最优状态。针对智能体间任务协作的问题,引入了Q学习算法的思想,强化多智能体救援过程产生积极效果的动作,以此来解决多智能体之间任务相互依赖,相互约束的关系。论文提出的算法已经应用到哈尔滨工程大学机器人救援仿真队伍中,并在2010年中国机器人公开赛中获得第三名,验证了算法的有效性。
|
全文目录
摘要 5-6 ABSTRACT 6-9 第1章 绪论 9-15 1.1 研究背景及研究意义 9-10 1.2 国内外研究现状 10-13 1.2.1 可移动智能体的路径规划方法 10-11 1.2.2 多智能体系统协作机制的研究 11-13 1.3 主要研究内容 13 1.4 论文的组织结构 13-15 第2章 机器人救援仿真系统概述 15-24 2.1 多智能体救援仿真系统构成 15-17 2.2 多智能体救援仿真过程 17-18 2.3 多智能体救援仿真系统中的智能体 18-19 2.4 多智能体救援仿真系统的仿真场景 19-20 2.5 多智能体通信原理及控制的常用方法 20-21 2.6 RoboCup救援仿真系统中的任务指标 21-23 2.7 本章小结 23-24 第3章 基于改进蚁群算法的多智能体路径规划 24-39 3.1 基本蚁群算法的原理 24-27 3.1.1 蚁群行为描述 24-25 3.1.2 基本蚁群算法的数学模型 25-26 3.1.3 基本蚁群算法的实现步骤 26-27 3.1.4 基本蚁群算法的程序流程图 27 3.2 基于改进蚁群算法路径规划算法 27-30 3.2.1 基于改进启发函数的状态转移规则的蚁群算法 28-29 3.2.2 基于调节信息素挥发度的自适应蚁群算法 29-30 3.3 基于改进蚁群算法在机器人救援仿真系统中的应用 30-34 3.3.1 机器人救援仿真系统中的路径模型 30-32 3.3.2 在机器人救援仿真系统中改进蚁群算法的应用 32-34 3.4 仿真结果与数据分析 34-38 3.4.1 仿真比赛得分的比较 34-35 3.4.2 市民获救比例比较 35-36 3.4.3 建筑物保护情况比较 36-38 3.5 本章小结 38-39 第4章 基于竞拍方式的多智能体任务分配算法 39-49 4.1 多智能体的任务分配 39-40 4.2 基于拍卖的任务分配算法 40-43 4.2.1 竞拍规则 40 4.2.2 ABGC拍卖数学模型 40-42 4.2.3 ABGC拍卖算法 42-43 4.3 贪心策略的动态任务调整 43-44 4.3.1 贪心策略 44 4.3.2 拍卖算法的贪心动态调整 44 4.4 ABGC算法在RCRSS中的应用 44-48 4.5 本章小结 48-49 第5章 基于Q学习思想的多智能体任务协作方法 49-57 5.1 多智能体的协作 49-50 5.1.1 多智能体的协作目的 49-50 5.1.2 多智能体的任务共享和结果共享 50 5.2 RCRSS系统中的协作问题 50-51 5.3 Agent基于Q学习的协作方法 51-54 5.3.1 强化学习 51-53 5.3.2 Q学习算法在多智能体系统中的应用 53-54 5.4 Q学习思想在RCRSS中的应用及仿真结果说明 54-56 5.4.1 多智能体系统中动作空间的建立 54-55 5.4.2 多智能体系统中值函数的建立 55 5.4.3 多智能体系统中奖赏函数的建立 55-56 5.4.4 仿真结果说明 56 5.5 本章小结 56-57 结论 57-59 参考文献 59-63 攻读硕士学位期间发表的论文和取得的科研成果 63-64 致谢 64
|
相似论文
- 动态环境下移动对象导航系统相关技术的研究,TP301.6
- 基于改进蚁群算法的机器人路径规划研究,TP242
- 移动WSN基于虚拟簇头数据收集策略的研究,TP212.9
- 移动机器人全覆盖路径规划算法的研究,TP242
- 复杂动态环境下的小型足球机器人路径规划研究,TP242
- 面向GPS导航拖拉机的最优全局覆盖路径规划研究,TN967.1
- RoboCup中型组足球机器人的设计和开发,TP242
- 移动机器人路径规划研究及仿真实现,TP242
- 双层车库车辆调度辅助决策支持系统,TP242
- 无线传感器网络节点三维定位算法研究,TN929.5
- 基于数字高程模型栅格地图的移动机器人路径规划研究,TP242
- 车库管理系统线路生成与重复利用方法研究,TP315
- 城市交通智能控制策略与仿真系统研究,U495
- 车辆导航系统路径规划技术的研究,TP301.6
- 轮式仿人机器人导航与路径规划研究,TP242
- 船体分段的机器人焊接路径规划与离线编程,TP242
- 基于多Agent的河北冀通路桥公路施工智能决策支持系统研究,TP311.52
- 城市公交最优化换乘系统研究与实现,U12
- 机器人系统路径规划的研究,TP242
- 超市多任务机器人实用化路径规划方法研究,TP242
- 一类多机器人系统任务分配方法的研究,TP242
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|