学位论文 > 优秀研究生学位论文题录展示
计算机博弈的估值方法研究
作 者: 刘明慧
导 师: 周玮
学 校: 东北大学
专 业: 控制理论与控制工程
关键词: 离散事件动态系统 棋牌游戏 估值方法 矩阵对策 神经元网络
分类号: TP18
类 型: 硕士论文
年 份: 2008年
下 载: 52次
引 用: 0次
阅 读: 论文下载
内容摘要
中国象棋作为棋类游戏的代表,属于离散事件动态系统(DEDS)。通过对计算机中国象棋博弈的研究,可以将其中的分析技术和求解方法应用于离散事件动态系统中。因此,机器博弈研究的开展为离散事件动态系统理论的发展创造了十分有利的条件。本文在中国象棋对弈平台研制的基础上,对原有的静态估值方法和搜索算法作了详细的分析,针对目前在计算机中国象棋博弈中,广泛使用的估值和搜索方法不能客观体现博弈双方各自实力的变化趋势,实现博弈者战略意图的实际情况,提出了基于百分比估值排序搜索并给出了基于博弈局势的优质估值方法,建立相应的博弈模型,完成对计算机博弈估值方法的创新。首先,把中国象棋计算机博弈系统的绝对值估值搜索转化为百分比估值排序搜索,以解决搜索过程中容易产生的丢失最佳路径的问题。然后,结合矩阵对策理论分析描述中国象棋博弈动态系统,提出优质的估值方法。该方法融入局势对象棋对弈发展的影响,给出棋面评估矩阵的概念。同时,根据中国象棋的特点,提出估值函数分段优化的思想,利用人工神经元网络算法建立优质估值模型,得到动态的棋子价值。最后,通过实战证明了该方法有较好的寻优能力,提高了中国象棋计算机博弈系统估值的准确性,实现了计算机棋力的实际增长。该方法对于解决离散的动态对策问题,具有很高的参考价值。因此,对中国象棋计算机博弈的研究具有一定的实际意义。
|
全文目录
摘要 5-6 ABSTRACT 6-9 第一章 绪论 9-17 1.1 离散事件动态系统 9-14 1.1.1 离散事件动态系统的发展 9-10 1.1.2 离散事件动态系统的基本概念 10-11 1.1.3 离散事件动态系统研究方法 11-14 1.2 棋牌游戏分析 14-15 1.3 本文的主要工作 15-17 1.3.1 问题分析与改进方法的提出 15-16 1.3.2 本文的结构安排 16-17 第二章 中国象棋计算机博弈 17-33 2.1 计算机中国象棋研究的进展和方向 17-18 2.2 计算机博弈中的估值与搜索算法分析 18-26 2.2.1 现有的估值方法及其问题 18-22 2.2.2 现有搜索方法及其问题 22-26 2.3 中国象棋计算机对弈平台建设 26-32 2.3.1 对弈平台基本构成 26-29 2.3.2 对弈平台结构性能 29-32 2.4 本章小结 32-33 第三章 优质估值方法的理论基础 33-39 3.1 BP神经元网络 33-35 3.1.1 BP神经网络模型 33 3.1.2 BP网络的建模过程 33-35 3.2 矩阵对策理论 35-38 3.2.1 矩阵对策的基本概念 35-36 3.2.2 矩阵对策的数学模型 36-38 3.3 本章小结 38-39 第四章 百分比估值及其应用 39-51 4.1 问题的引出 39-40 4.2 百分比估值 40-43 4.2.1 象棋对弈的数学描述 40-42 4.2.2 关于百分比估值的定理及其证明 42-43 4.3 百分比估值在搜索中的应用 43-50 4.3.1 百分比估值排序搜索基本思想 43-45 4.3.2 基于百分比估值的排序搜索过程 45-46 4.3.3 百分比估值搜索实例 46-50 4.4 本章小结 50-51 第五章 基于局势的优质估值方法 51-63 5.1 计算机博弈动态系统研究 51-55 5.2 优质估值方法 55-56 5.2.1 优质估值函数 55-56 5.2.2 优质估值方法 56 5.3 棋子价值b~s的寻优方法 56-61 5.3.1 模型学习期望 56-58 5.3.2 棋子价值的训练步骤 58-59 5.3.3 棋子价值b~s学习举例 59-61 5.4 本章小结 61-63 第六章 结论与展望 63-65 6.1 全文工作总结 63 6.2 工作展望 63-65 参考文献 65-69 致谢 69
|
相似论文
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 河南省燃化集团并购仰韶华源燃气公司案例研究,F271
- 六子棋中基于BP-TD学习的局面估值方法研究,TP18
- 基于神经元网络的电阻炉解耦控制系统,TP183
- 基于增强学习的计算机博弈策略的研究与实现,TP18
- 基于应用监控理论的信息系统安全监控和风险评估,TP393.08
- 我国分级基金估值方法评价及其选择研究,F224
- 基于非线性动态PID神经网络的无刷直流电机控制系统设计,TM33
- 海外创业板估值方法在我国的应用研究,F832.51
- 露天矿数字化中地质模型的建立与应用研究,TD164
- 基于人工神经网络的无刷直流电机控制系统研究,TM33
- 基于局势变化的计算机中国象棋研究,TP18
- 基于过程神经元网络的时间序列数据挖掘模型及其应用,TP311.13
- 基于使用信息的数据库模式匹配方法研究,TP311.13
- 间歇反应过程的最优温度控制研究,TP273
- 复杂网络上的自组织临界性,O157.5
- 基于ARM及PID神经元网络的注塑机控制器设计与研究,TP273
- 数字神经元网络的实现与分析研究,TP183
- 大时滞系统的神经网络控制方法研究,TP183
- 基于Petri网的车站调度模型的研究,U284.59
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|