学位论文 > 优秀研究生学位论文题录展示

基于贝叶斯网络的动态预测模型研究及其应用

作 者: 马栩
导 师: 吴良杰
学 校: 哈尔滨工程大学
专 业: 计算机软件与理论
关键词: 动态预测 动态贝叶斯网络 感知agent 感知调度
分类号: TP18
类 型: 硕士论文
年 份: 2012年
下 载: 60次
引 用: 0次
阅 读: 论文下载
 

内容摘要


博弈是与现实中的竞争相对应的数学理论,近年来在人工智能方面有广泛的应用,非完全信息博弈是其中不确定性最大的情况,也是最值得研究的内容,像机器人足球赛,和计算机对弈,模拟现实场景等等,在这方面的应用对现实的指导意义是明显重要的。贝叶斯推理是一种以概率分布为基础的推理方法,它结合了贝叶斯理论的图模型,通过进行一些条件独立性假设,将复杂的问题进行简化处理,进而把事件之间的相互影响关系用图的形式表达出来,然后利用概率理论中的先验概率和后验概率进行推理求解。贝叶斯方法的多种特点和优点都使得其不仅为应用其理论解决概率相关问题(如分类聚类),还可以用其图模型解决策略选择的问题(如推理和识别)。然而贝叶斯推理方法应用到博弈中时还存在着一些问题和可扩展之处,为了弥补这些问题、补充可扩展之处,我们将引入一个在模拟现实方面有良好前景的领域,即多智能体系统(MAS,Multi-Agent System)。这样我就可以把动态预测模型与代表具有智能实体的agent相结合,同时把MAS系统中的调度算法与贝叶斯方法相结合,使其预测能力充分发挥。本文就是综合考虑了模拟现实博弈的良好应用前景和贝叶斯推断理论的良好性能,旨在设计一个应用于非完全信息博弈状态下的动态预测模型,并且使其更具普适性,更好的与现实相映射。本文的主要工作:(1)提出了动态预测的模型架构。针对贝叶斯方法缺乏对周围环境中常变因素的考虑,将其应用到非完全信息博弈的MAS中,运用感知agent的构造理论,与agent相结合构成总体框架。(2)运用了改进的学习算法。通过对贝叶斯方法的深入研究,发现由于贝叶斯方法构成的学习网基本是固定的,即使是动态贝叶斯方法也只是在最初建立好学习网后,随时间推移,前一时刻的因素对后一时刻的本学习网中已经形成制约关系的因素的影响,就很难考虑到博弈的对象的变化及其变化给贝叶斯学习网带来的影响,不能及时更新学习网。于是将K2算法和相关性算法相结合,构成一种准确的学习算法。该算法简单可行,而且准确性高。充分考虑了条件独立假设,增强学习准确性的同时也不至于在时间上有很大消耗。(3)提出了对预测准确性的判断方法。在预测过程中没有对预测结果的评价,也就是说没有办法知道预测结果是否准确,并且根据结果是否准确做出调整。贝叶斯方法不管是静态的方法还是动态的方法,都没有一个很好的反馈,使其在动态变化的环境中表现不是很出色,所以在预测的结果后要对结果进行一个判断,引入预测误差的概念来做为判断的依据。(4)在贝叶斯预测的过程中添加了对环境因素的感知等级概念。贝叶斯方法中没能按照急需的主次顺序来进行推理,也就是不能及时找出最需要推理的因素,没有办法使该因素及时地得到预测值,会使推理失去意义,不能实时、有效地抓住影响自身的主要因素,给出的策略会造成避重就轻。在本文中加入感知等级的概念就是用来解决这个问题。引入该概念则可以解决该问题。

全文目录


摘要  5-7
Abstract  7-11
第1章 绪论  11-17
  1.1 研究背景及意义  11-13
  1.2 动态预测模型的发展及现状  13-15
  1.3 论文的主要工作  15-16
  1.4 论文组织结构  16-17
第2章 贝叶斯推测理论  17-30
  2.1 贝叶斯理论基础  17-19
    2.1.1 概率论基础  17-19
    2.1.2 贝叶斯方法一般步骤  19
  2.2 贝叶斯网络理论  19-26
    2.2.1 影响图基础  19-21
    2.2.2 隐马尔可夫模型 HMMs  21-23
    2.2.3 静态贝叶斯网络  23-24
    2.2.4 动态贝叶斯网络  24-26
  2.3 动态贝叶斯网络模型的构造  26-29
    2.3.1 构造思想  26-27
    2.3.2 模型及其学习算法  27-29
    2.3.3 算法性能分析  29
  2.4 本章小结  29-30
第3章 基于 agent 的环境感知  30-46
  3.1 感知 agent 模型构造  30-37
    3.1.1 感知 agent 构造理论  31-35
    3.1.2 感知 agent 模型  35-37
  3.2 感知体系总体框架  37-40
    3.2.1 感知体系框架  37-38
    3.2.2 感知分析  38-40
  3.3 感知调度  40-44
    3.3.1 感知调度基本思想  40
    3.3.2 感知调度方法  40-44
  3.4 本章小结  44-46
第4章 动态预测模型设计及实验验证  46-65
  4.1 总体设计  46-49
    4.1.1 功能分析  46
    4.1.2 总体架构  46-47
    4.1.3 agent 内部结构  47
    4.1.4 原语设计  47-49
  4.2 总体流程及具体实现  49-54
    4.2.1 总体流程  49-50
    4.2.2 感知分析  50-52
    4.2.3 构建学习网并预测  52-54
  4.3 实验验证  54-58
    4.3.1 实验数据集及实验工具  55
    4.3.2 实验结果及分析  55-58
  4.4 动态预测模型在 TAC/AA 中的应用  58-63
    4.4.1 TAC/AA 背景介绍  58-60
    4.4.2 TAC/AA 平台原理概述  60-61
    4.4.3 平台中 agent 的构成  61-62
    4.4.4 动态模型在平台中的应用及效果  62-63
  4.5 本章小结  63-65
结论  65-66
参考文献  66-73
致谢  73

相似论文

  1. 多传感器信息融合及其在可穿戴计算机上的应用,TP202
  2. 多核集群环境下并行地理计算执行时间预测技术研究,TP338.6
  3. 大型公共建筑能耗计量、建模与节能管理系统研究,TU111.195
  4. 认知无线电MAC层关键技术仿真与评估,TN925
  5. 基于动态贝叶斯网络的连续语音识别研究,TN912.34
  6. 动态贝叶斯网络在水文预报中的应用,TV124
  7. 基于Bayesian的基因调控网络的研究,Q78
  8. 基于多源数据融合的变结构DBN模型基因调控网络构建,Q78
  9. 基于基因芯片数据的基因调控网络的重构及其疾病学应用,TP18
  10. 基于动态贝叶斯模型的基因调控网络构建方法研究,Q75
  11. 基于Bootstrap DBN模型的基因调控网络构建,TP18
  12. 基于不同模型的运动目标跟踪算法研究,TP391.41
  13. 面向智能汽车空间的上下文建模与推理研究,TP391.1
  14. 贝叶斯网络在土壤蒸发量计算中的应用,S152.73
  15. 实验时间点的选取对基因调控网络构建的影响,Q78
  16. 动态贝叶斯网络结构学习的研究,TP183
  17. 基于动态贝叶斯网络的评估模型研究及其在人力资源考核中的应用,TP183
  18. 基于序贯贝叶斯方法的视频目标跟踪与行为识别,TP391.41
  19. 动态贝叶斯网络的近似推理算法研究,TP183
  20. 基于因素化表示的强化学习方法研究,TP18
  21. 基于动态贝叶斯网络的目标毁伤等级评估,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com