学位论文 > 优秀研究生学位论文题录展示
基于局势变化的计算机中国象棋研究
作 者: 王友政
导 师: 周玮
学 校: 东北大学
专 业: 控制理论与控制工程
关键词: 离散事件动态系统 人工免疫聚类 稳定局势 变化局势 概率剪枝方法
分类号: TP18
类 型: 硕士论文
年 份: 2008年
下 载: 40次
引 用: 0次
阅 读: 论文下载
内容摘要
中国象棋作为棋类游戏的代表,属于离散事件动态系统。通过计算机中国象棋博弈的研究,可以将其中的分析技术和求解方法应用于离散事件动态系统中。在计算机中国象棋博弈中,一局棋的胜败往往取决于关键的几步,这几步出现在什么情况下,从中有哪些规律,怎样摆脱机器博弈的传统思维定式,走出好的“关键步”,是提高计算机中国象棋博弈等级的问题,也是有待深入研究的博弈理论问题。本文从理论与实践两个方面,对此进行了分析和探索。针对目前在计算机中国象棋博弈中,广泛使用的估值和搜索方法不能客观体现博弈双方各自实力的变化趋势,实现博弈者战略意图的实际情况,提出利用局势变化攫取优势博弈的方法。该方法以数学、人工免疫聚类等方法为工具,在计算机中国象棋博弈中建立稳定局势和变化局势模型,为博弈者将棋局局势了然于胸,驾驭或控制局势的变化和发展,提供理论依据。在稳定局势下可以利用概率剪枝方法,这样能节省大量的时间。但一般概率剪枝方法在计算机中国象棋博弈中,应用条件要求过高,实用性不强的缺点。因此,本文提出了基于博弈局势的概率剪枝方法。该方法融入局势对搜索与估值的影响,提出了稳定局势和变化局势下搜索和估值的时间自适应,掌握了博弈的主动权。计算机中国象棋研究的开展为离散事件动态理论研究创造了有利的条件,对于解决一类离散的动态对策问题,有一定的参考价值。
|
全文目录
摘要 5-6 ABSTRACT 6-11 第一章 绪论 11-19 1.1 离散事件动态系统的发展 11-12 1.2 离散事件动态系统的基本概念 12-13 1.3 DEDS理论研究方法 13-17 1.3.1 DEDS的建模方法 13-15 1.3.2 DEDS的控制理论 15-16 1.3.3 DEDS的性能评价和优化方法 16 1.3.4 DEDS对策问题 16-17 1.4 棋牌游戏分析 17-18 1.5 本文的主要工作 18-19 第二章 计算机中国象棋博弈 19-27 2.1 计算机中国象棋的发展及组成 19-23 2.1.1 计算机中国象棋的发展 19-20 2.1.2 计算机中国象棋的组成 20-23 2.2 计算机中国象棋人工智能算法对弈平台建设 23-25 2.3 计算机中国象棋研究的最新进展 25-27 第三章 人工免疫聚类算法 27-35 3.1 人工免疫系统 27-30 3.1.1 基本概念 27-28 3.1.2 免疫过程 28-29 3.1.3 人工免疫系统的基本原理 29-30 3.2 人工免疫聚类分析算法 30-35 3.2.1 抗原与抗体的确定 31 3.2.2 亲和力与相似度计算 31-32 3.2.3 抗体的克隆与变异 32 3.2.4 抗体的刺激与抑制 32-33 3.2.5 人工免疫聚类算法的步骤 33-35 第四章 计算机中国象棋博弈的估值与搜索 35-43 4.1 静态估值方法 35-39 4.1.1 对子力与攻击性的评估 35 4.1.2 对棋子位置附加值的评估 35-37 4.1.3 对棋子灵活性的评估 37 4.1.4 对棋子协调性与保护性的评估 37-38 4.1.5 对战术的评估 38-39 4.2 基于alpha-beta剪枝的搜索方法 39-43 4.2.1 alpha-beta搜索 39-41 4.2.2 迭代深化搜索 41-42 4.2.3 启发式搜索 42-43 第五章 利用局势变化攫取优势博弈 43-57 5.1 传统计算机博弈方法的分析 43-44 5.2 博弈局势的定义与定量分析 44-50 5.2.1 与"局势"有关的定义 44-45 5.2.2 与"局势"有关度量的证明 45-46 5.2.3 "局势"与估值函数的相互作用 46-47 5.2.4 "局势"与搜索算法的相互作用 47-48 5.2.5 "局势"与博弈过程的相互作用 48-50 5.3 人工免疫聚类方法聚类博弈局势 50-52 5.3.1 人工免疫聚类方法的参数选择 50 5.3.2 博弈局势聚类 50-52 5.4 聚类结果分析与举例 52-55 5.4.1 聚类结果分析 52-54 5.4.2 聚类举例 54-55 5.5 本章小结 55-57 第六章 基于博弈局势的概率剪枝 57-65 6.1 基于概率的剪枝方法 57-59 6.1.1 概率剪枝的基本思想 57-58 6.1.2 概率剪枝的参数选择 58-59 6.2 基于博弈局势的概率剪枝方法 59-64 6.2.1 搜索深度与博弈局势的关系 59-61 6.2.2 用k层估值建立h层估值的预测模型 61-62 6.2.3 基于博弈局势的概率剪枝方法 62 6.2.4 基于博弈局势的概率剪枝方法的应用 62-64 6.3 本章小结 64-65 第七章 结论与展望 65-67 7.1 结论 65 7.2 问题与展望 65-67 参考文献 67-71 致谢 71-73 攻读学位期间发表的论文情况 73
|
相似论文
- 基于应用监控理论的信息系统安全监控和风险评估,TP393.08
- 计算机博弈的估值方法研究,TP18
- 基于Petri网的车站调度模型的研究,U284.59
- 基于模糊控制的规则化描述方法研究,TP13
- 基于Petri网的制造系统建模仿真及调度研究,TP391.9
- 基于模糊神经Petri网的离散事件动态系统建模研究,TP301.1
- 基于模型参考自适应控制的航班进港间隔控制研究,V355
- 汽车后桥作业车间仿真技术研究与应用,TP391.9
- 某机构合件柔性装配系统的Petri网建模及其控制系统设计,TH165
- 离散事件动态系统的状态反馈控制,TP13
- 基于有限自动机模型的混杂电力系统紧急控制问题研究,TM761
- 基于仿真的随机离散制造系统优化调度研究,TP399
- 基于离散事件动态系统的故障诊断理论的研究,TP277
- 电梯交通流多模式预测方法的研究,TU857
- 基于时序Petri网的DEDS控制器综合,TP273
- 基于随机Petri网的集装箱码头通过能力系统仿真,U695.22
- 石化炼油生产原油库存的动态管理,F407.22
- 人工免疫系统在自适应Web中的应用研究,TP393.08
- 基于免疫应答原理的人工免疫算法及其应用,TP18
- 基于离散事件动态系统的多媒体网络传输若干问题研究,TN919.8
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|