学位论文 > 优秀研究生学位论文题录展示

多智能体救援仿真系统研究

作　者: 洪长昊
导　师: 叶秀芬
学　校: 哈尔滨工程大学
专　业: 控制理论与控制工程
关键词: 多智能体系统机器人救援仿真系统路径规划任务分配任务协作
分类号: TP18
类　型: 硕士论文
年　份: 2011年
下　载: 21次
引　用: 0次
阅　读: 论文下载

内容摘要

多智能体系统是近年来分布式人工智能领域的一个重要研究方向。本文以对机器人救援仿真系统(RoboCupRescue Simulation System, RCRSS)的研究作为基础,针对动态复杂的救援环境,研究了多智能体在动态环境下的路径规划、同构多智能体的任务分配、异构多智能体的任务协作等关键问题。主要研究内容如下：机器人救援仿真系统(RoboCupRescue Simulation System, RCRSS)是一个典型的异构多智能体系统,也是一个实时的分布式仿真系统,它为多智能体系统、异构智能体、机器人救援的技术和相关理论研究提供试验平台。为了更好的应用机器人救援仿真系统这个平台,论文首先系统的总结了机器人救援仿真系统中的基本要素、仿真过程以及多智能体的控制方法,为平台的应用打下坚实的基础。为了解决救援智能体在路况动态变化的震后城市中快速的找到救援目标的问题,论文提出了一种基于改进蚁群算法的动态路径搜索算法。该算法通过引入基于改进启发函数的状态转移规则对蚁群的搜索过程进行引导,加大搜索范围,避免陷入局部最优。通过引入基于调节信息素挥发度的自适应蚁群算法来加快蚁群的收敛速度,提高搜索质量。针对同构多智能体间的任务分配问题,采用了一种基于拍卖的任务分配算法,此算法主要包括了基于拍卖方式的任务分配方案和基于贪心策略的动态调整两个过程,采用基于拍卖方式的任务分配方案综合考虑拍卖信息的效益、花费比,选取接近最优的分配方案；在分配方案确定后,利用贪心策略对智能体的任务情况进行实时动态调整,达到当前最优状态。针对智能体间任务协作的问题,引入了Q学习算法的思想,强化多智能体救援过程产生积极效果的动作,以此来解决多智能体之间任务相互依赖,相互约束的关系。论文提出的算法已经应用到哈尔滨工程大学机器人救援仿真队伍中,并在2010年中国机器人公开赛中获得第三名,验证了算法的有效性。

全文目录

摘要  5-6
ABSTRACT  6-9
第1章绪论  9-15
  1.1 研究背景及研究意义  9-10
  1.2 国内外研究现状  10-13
    1.2.1 可移动智能体的路径规划方法  10-11
    1.2.2 多智能体系统协作机制的研究  11-13
  1.3 主要研究内容  13
  1.4 论文的组织结构  13-15
第2章机器人救援仿真系统概述  15-24
  2.1 多智能体救援仿真系统构成  15-17
  2.2 多智能体救援仿真过程  17-18
  2.3 多智能体救援仿真系统中的智能体  18-19
  2.4 多智能体救援仿真系统的仿真场景  19-20
  2.5 多智能体通信原理及控制的常用方法  20-21
  2.6 RoboCup救援仿真系统中的任务指标  21-23
  2.7 本章小结  23-24
第3章基于改进蚁群算法的多智能体路径规划  24-39
  3.1 基本蚁群算法的原理  24-27
    3.1.1 蚁群行为描述  24-25
    3.1.2 基本蚁群算法的数学模型  25-26
    3.1.3 基本蚁群算法的实现步骤  26-27
    3.1.4 基本蚁群算法的程序流程图  27
  3.2 基于改进蚁群算法路径规划算法  27-30
    3.2.1 基于改进启发函数的状态转移规则的蚁群算法  28-29
    3.2.2 基于调节信息素挥发度的自适应蚁群算法  29-30
  3.3 基于改进蚁群算法在机器人救援仿真系统中的应用  30-34
    3.3.1 机器人救援仿真系统中的路径模型  30-32
    3.3.2 在机器人救援仿真系统中改进蚁群算法的应用  32-34
  3.4 仿真结果与数据分析  34-38
    3.4.1 仿真比赛得分的比较  34-35
    3.4.2 市民获救比例比较  35-36
    3.4.3 建筑物保护情况比较  36-38
  3.5 本章小结  38-39
第4章基于竞拍方式的多智能体任务分配算法  39-49
  4.1 多智能体的任务分配  39-40
  4.2 基于拍卖的任务分配算法  40-43
    4.2.1 竞拍规则  40
    4.2.2 ABGC拍卖数学模型  40-42
    4.2.3 ABGC拍卖算法  42-43
  4.3 贪心策略的动态任务调整  43-44
    4.3.1 贪心策略  44
    4.3.2 拍卖算法的贪心动态调整  44
  4.4 ABGC算法在RCRSS中的应用  44-48
  4.5 本章小结  48-49
第5章基于Q学习思想的多智能体任务协作方法  49-57
  5.1 多智能体的协作  49-50
    5.1.1 多智能体的协作目的  49-50
    5.1.2 多智能体的任务共享和结果共享  50
  5.2 RCRSS系统中的协作问题  50-51
  5.3 Agent基于Q学习的协作方法  51-54
    5.3.1 强化学习  51-53
    5.3.2 Q学习算法在多智能体系统中的应用  53-54
  5.4 Q学习思想在RCRSS中的应用及仿真结果说明  54-56
    5.4.1 多智能体系统中动作空间的建立  54-55
    5.4.2 多智能体系统中值函数的建立  55
    5.4.3 多智能体系统中奖赏函数的建立  55-56
    5.4.4 仿真结果说明  56
  5.5 本章小结  56-57
结论  57-59
参考文献  59-63
攻读硕士学位期间发表的论文和取得的科研成果  63-64
致谢  64

多智能体救援仿真系统研究

内容摘要

全文目录

相似论文