学位论文 > 优秀研究生学位论文题录展示

四国军棋智能系统定式库及开局匹配研究与实现

作 者: 史敏
导 师: 刘宁钟;夏正友
学 校: 南京航空航天大学
专 业: 计算机应用技术
关键词: 四国军棋 定式库技术 开局匹配 蒙特卡罗算法 NhopeV3
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 39次
引 用: 0次
阅 读: 论文下载
 

内容摘要


人机博弈是人工智能的一个重要研究领域,其中不完全信息的人机博弈能够模拟现实复杂世界中不确定环境下的决策,因此越来越受到关注。四国军棋是一种典型的不完全信息游戏,其特点是不仅需要在对手和同盟棋子信息不确定的情况下做出决策,而且需要考虑与同盟的合作问题。目前四国军棋人机博弈研究存在的两个主要问题是:一、尽管针对四国军棋本身特点进行了搜索算法的研究,但是搜索的深度和结果,都还是难以令人满意;二、由于基础性研究还不够深入,目前没有好的评价函数。这两大瓶颈严重地影响了四国军棋人机博弈系统智能水平的高低。因此,有必要从其它方面入手对四国军棋开展研究。本文围绕四国军棋的人机博弈展开深入的研究与分析,主要工作如下:1)参考围棋的定式库技术、中国象棋和国际象棋的开局库技术和残局库技术,将定式库技术引入四国军棋的人机博弈研究。设计与实现了四国军棋的定式库以及相应的定式库开发系统,并在人机博弈系统中使用定式库技术来进行最优策略的决策。定式库技术在四国军棋博弈系统中的应用,降低了博弈系统对搜索算法的依赖,避免系统单纯依靠搜索算法而犯战略上的低级错误。2)针对棋手所用布局的倾向性和范围性,本文提出了一种基于样本的策略指导方法——开局匹配算法。该算法主要应用于开局阶段,根据开局阶段获得的少量信息,对待选的样本库进行快速地筛选,从而得到当前布局的假想布局,指导最优策略的决策。3)针对四国军棋的不完全信息特征,提出了四国军棋的蒙特卡罗算法。该算法通过单样本条件下的最优策略在整体样本条件下的模拟游戏,选出表现最好的策略作为最优策略。四国军棋的蒙特卡罗算法通过模拟游戏将不确定因素从评价函数中剥离出来,为评价函数的设计提供了新的思路。4)由于原有实验平台Nhope V1&V2版本所采用的系统框架主要侧重于博弈搜索,而且其智能模块的过程化的编程方式也使其可扩展性受到限制。定式库技术、开局匹配技术与原有的系统框架存在冲突,同时,为了增强实验平台的可扩展性,本文设计与实现了Nhope V3。Nhope V3实验平台在设计的过程中采用了面向对象的设计方法,同时注重结构设计的天然性和合理性,使得新的实验平台易于理解和扩展。

全文目录


摘要  4-5
ABSTRACT  5-12
第一章 绪论  12-25
  1.1 人机博弈与四国军棋  12-17
    1.1.1 人机博弈简介  12-13
    1.1.2 四国军棋简介  13-16
    1.1.3 研究的关键点  16-17
  1.2 定式库技术简介  17-21
    1.2.1 定式库技术概要  17-18
    1.2.2 围棋定式库  18-19
    1.2.3 中国象棋的开局库  19-20
    1.2.4 中国象棋的残局库  20-21
  1.3 开局匹配技术简介  21-23
    1.3.1 蒙特卡罗算法  22
    1.3.2 桥牌的蒙特卡罗算法  22-23
    1.3.3 围棋的蒙特卡罗算法  23
  1.4 本文主要工作和结构  23-25
第二章 四国军棋的定式库设计与开发  25-42
  2.1 四国军棋定式库简介  25-26
  2.2 四国军棋人机博弈系统的组织结构  26-27
  2.3 四国军棋定式库设计  27-33
    2.3.1 基本信息  28-29
    2.3.2 特征信息  29-32
    2.3.3 定式描述  32-33
  2.4 四国军棋定式库实现  33-36
  2.5 四国军棋的定式匹配过程  36-38
  2.6 四国军棋定式库的自动扩展  38-41
    2.6.1 基于对称的定式扩展  38-40
    2.6.2 基于空节点的定式扩展  40-41
  2.7 本章小结  41-42
第三章 开局匹配的设计与实现  42-59
  3.1 开局匹配技术的简介  42-43
  3.2 开局匹配技术在系统结构上的位置  43-44
  3.3 概率更新过程  44-47
    3.3.1 先验概率  44-46
    3.3.2 概率更新  46-47
  3.4 差异度  47-50
    3.4.1 差异度介绍  47-48
    3.4.2 四国军棋棋局差异度计算  48-50
  3.5 高差异度样本空间下的快速匹配  50-52
  3.6 实验与分析  52-55
    3.6.1 样本布局库变化  53-55
    3.6.2 实验总结  55
  3.7 低差异度样本空间下的蒙特卡罗算法  55-58
  3.8 本章小结  58-59
第四章 可扩展的四国军棋实验平台(NhopeV3)设计  59-70
  4.1 实验平台Nhope 及存在的问题  59-60
    4.1.1 Nhope 系统  59
    4.1.2 存在的问题  59-60
  4.2 NhopeV3 系统需求设计  60-61
    4.2.1 系统的功能需求  60
    4.2.2 系统的界面需求  60-61
  4.3 NhopeV3 系统总体设计  61-65
    4.3.1 系统框架  61-63
    4.3.2 系统流程  63-65
  4.4 NhopeV3 系统详细设计  65-68
    4.4.1 棋局基本信息  66
    4.4.2 对战平台  66-67
    4.4.3 智能模块  67-68
    4.4.4 人机交互界面  68
  4.5 系统的运行界面  68-69
  4.6 本章小结  69-70
第五章 总结与展望  70-72
参考文献  72-77
致谢  77-78
在学期间的研究成果及发表的学术论文  78

相似论文

  1. 马尔科夫链—蒙特卡罗算法及其在MIMO检测中的应用研究,TN919.3
  2. 基于蒙特卡罗算法的低压低频减载策略研究,TM712
  3. 粒子滤波算法在智能交通系统中的应用研究,TP29-AC
  4. 四国军棋的人机博弈搜索算法研究,TP391.3
  5. 西部地区公路网连通可靠性分析方法研究,U412.1
  6. 基于Monte Carlo的光学分子影像仿真平台并行化设计,TP391.41
  7. 基于随机点过程的图像线特征提取,TP391.41
  8. 在体光学成像平台设计及其平行化研究,TP391.41
  9. 标值点过程在道路提取中的应用,TP79
  10. 细胞内生化反应系统的随机模拟计算,O242.1
  11. 基于资源受限的无线传感器网络关键问题研究,TN929.5
  12. 基于支持向量机的故障诊断方法研究,TP18
  13. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  14. 基于遗传—牛顿算法的公交优化调度,TP18
  15. 基于变异粒子群的聚类算法研究,TP18
  16. 语音情感识别的特征选择与特征产生,TP18
  17. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  18. 基于遗传算法和粗糙集的聚类算法研究,TP18
  19. 基于知识推理的交叉销售系统的设计与实现,TP18
  20. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  21. 基于免疫机制蚁群算法的电力系统无功优化研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com