学位论文 > 优秀研究生学位论文题录展示
基于人工神经网络的决策算法研究
作 者: Couraud Benoit
导 师: 刘佩林
学 校: 上海交通大学
专 业: 电路与系统
关键词: 神经网络 增强学习 后向传播 博弈论 重复囚徒困境
分类号: TP183
类 型: 硕士论文
年 份: 2009年
下 载: 151次
引 用: 1次
阅 读: 论文下载
内容摘要
智能包括在特殊情况下为了实现某个特定的目标,作出正确的决策、达到特定目标的能力。迄今为止,大部分的智能系统仅仅能够模拟某一个特定的推理过程,而很少有系统能够根据环境自动地找到找到自己的思维方式。此外,神经网络(Neural Network)也从来没有在这个领域中被采用。本文介绍一个新的智能系统,它能根据自己所在的环境自动地做出决定,以达到某种特定的目标。即在面临需要达到某一个目标的情况下,该智能系统必须进行自我调整,自己找出最佳的策略。在大多数情况下,某种特定环境的情况参数需要以非线性的方式映射到最终的决策。这种映射过程可以通过人工神经网络来完成。在本论文中,我们利用人工神经网络来充当决策者。我们可以证明精心设计的人工神经网络能够在复杂的环境下(例如其他智能系统的比赛中)具有像人一样的行为、做出合理的决策。本文采用了一种新的人工神经网络结构。我们将对这个新的结构进行和介绍和测试,可以证明这个人工神经网络能够像人一样智能地决策。本文除了采用新的类人人工神经网络结构,还引入了一种新的训练方法。这种训练方法能够让我们的类人人工神经网络不断进化,并最终收敛到一个最佳的决策。这种新的训练方法受启发于人类的学习过程,包括一种新的BP(Back-Propagation)随机无监督强化训练方法(Stochastic Unsupervised Reinforcement-learning Rule)。本文中,我们也通过数学方法证明了这种训练方法的有效性。更重要的是,我们采用的这种训练方法和许多其他的强化训练方法不同,它能够使用在非离散输出的应用中,因而拥有更为广阔的实际应用前景。为了验证本文引入的新的类人人工神经网络结构和新的训练方法。我们通过计算机软件实现该类人人工神经网络,并对其进行测试。测试中,我们采用框架(Framework)为真实生活中的数学模型,例如博弈理论中提供的模型,尤其是重复囚徒困境(Iterated Prisoner Dilemma)的模型。因为博弈论建立的模型常常被使用在对新的类人人工智能模型的测试,我们可以通过这些模型验证我们类人人工神经网络与训练方法的设计,并最终证明我们的类人人工神经网络能够用于制作拥有智能行为的机器。通过测试,我们可以得出我们设计的类人人工神经网络能够像人一样做出只能的决策,从而证明了用人工神经网络根据环境进行决策的想法的正确性。
|
全文目录
摘要 2-5 ABSTRACT 5-9 第1章 基本概念 9-19 1.1 人工神经网络 9-12 1.1.1 人工神经元 9-10 1.1.2 神经网络结构 10-12 1.2 训练算法 12-16 1.3 博弈理论 16-19 第2章 背景介绍 19-26 2.1 进化算法 19-20 2.2 自适应人工智能系统 20-21 2.3 有限状态自动机 21-23 2.4 神经网络 23-26 第3章 类人人工神经网络 26-41 3.1 人类如何想与进化 26-27 3.2 一个有简单结构人工神经网络 27-31 3.3 类人人工神经网络(HUMAN-LIKE ARTIFICIAL NEURAL NETWORK: HLANN) 31-41 第4章 类人人工神经网络的进化 41-51 4.1 作出决策神经网络的训练算法 41-47 4.2 希望神经网络进化 47-51 第5章 实验与结果分析 51-60 5.1 重复囚徒困境比赛 51-52 5.2 类人人工神经网络的博弈 52-57 5.3 比赛的结果:类人人工神经网络赢了 57-60 第6章 总结 60-64 参考文献 64-67 作者在攻读硕士学位期间完成的主要工作 67-68 附录 68-69 致谢 69
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 调频式电容位移传感器高速测频与非线性校正技术研究,TH822
- 基于多Agent理论的卫星协同定轨技术研究,V474
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 红外超光谱图像的虚拟探测器研究,TP391.41
- 模糊控制、神经网络在平面二级倒立摆中的应用,TP273.4
- 基于神经网络的水厂投药预测控制研究,TP273.1
- 视觉伺服四自由度机械臂的研究,TP242.6
- 机械臂视觉伺服系统的研究,TP242.6
- 压电驱动微工作台的控制与校正技术研究,TP273
- 某武器检测装置的控制系统设计,TP183
- 市级旅游用地规划环境影响评价研究,X820.3
- 珠三角地区高性能混凝土配合比智能化系统,TU528
- 大学生综合素质测评研究,G645.5
- 不具备全局Lipschitz条件的时滞细胞神经网络的反周期解研究,TP183
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于神经网络辨识的同步发电机励磁控制研究,TM31
- 基于BP神经网络的水稻干燥智能控制研究,S226.6
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 人工神经网络与计算
© 2012 www.xueweilunwen.com
|