学位论文 > 优秀研究生学位论文题录展示
服务Agent学习算法
作 者: 徐文博
导 师: 曹健
学 校: 上海交通大学
专 业: 计算机科学与技术
关键词: Web服务 服务组合 本体 智能Agent 强化学习 团队马尔科夫博弈
分类号: TP393.09
类 型: 硕士论文
年 份: 2013年
下 载: 59次
引 用: 0次
阅 读: 论文下载
内容摘要
面向服务的架构如Web服务技术,以及Agent技术已经被广泛地应用于各个IT领域。基于Web服务和Agent而提出的服务Agent技术,是对二者的有效结合。它既满足了Web服务的可重复性,低耦合性,又包含了Agent的持续性、自治性、交互性等特性。作为智能Agent的一个重要特性,它必须也能具有学习的能力,即通过过去的经验,面对新的任务能够自主而快速地找到一个较为优化的解。本文首先提出了一个服务Agent的模型结构、语义架构以及服务Agent应用于Web服务组合的工作机制,然后给出了一种新的高效的服务Agent学习算法。该算法基于强化学习和团队马尔科夫博弈过程,并做出了相应的优化,使得在复杂环境下,尤其是多Agent环境下,该学习算法能够利用过去所学习到的知识,快速地达到收敛。该算法利用Q学习的理论基础,兼顾了多Agent之间博弈和协商,同时还能支持对知识模型的动态存储和更新,从而实现在多Agent条件下也能快速收敛。
|
全文目录
摘要 5-6 ABSTRACT 6-13 第一章 绪论 13-22 1.1 课题背景 13-14 1.2 研究现状 14-19 1.2.1 Agent 技术和 Web 服务 14-16 1.2.2 多 Agent 学习 16-19 1.3 目前存在的问题 19-20 1.4 本文研究内容 20 1.5 本文组织结构 20-22 第二章 相关技术 22-31 2.1 智能 AGENT 技术 22-25 2.1.1 Agent 的定义 22-23 2.1.2 多 Agent 学习 23-25 2.2 WEB 服务组合 25-27 2.2.1 Web 服务 25 2.2.2 Web 服务组合 25-27 2.3 本体 27-30 2.3.1 计算机学界关于本体的定义 27 2.3.2 本体的组成部分 27-28 2.3.3 本体语言 28-29 2.3.4 本体在本文中的结构形式 29-30 2.4 本章小结 30-31 第三章 服务 AGENT 的框架和模型 31-45 3.1 引言 31 3.2 服务 AGENT 框架 31-42 3.2.1 服务 Agent 模型结构 31-34 3.2.2 服务 Agent 系统的事件语义模型 34-36 3.2.3 服务 Agent 系统的目标语义模型 36-38 3.2.4 服务 Agent 系统的规划语义模型 38-39 3.2.5 服务 Agent 系统的规划语法模型 39-41 3.2.6 服务 Agent 的目标拆分 41 3.2.7 服务 Agent 系统的工作机制 41-42 3.3 本章小结 42-45 第四章 服务 AGENT 学习 45-61 4.1 引言 45 4.2 强化学习 45-49 4.2.1 马尔科夫决策过程 45-46 4.2.2 Q 学习 46-47 4.2.3 博弈论和纳什平衡 47-48 4.2.4 团队马尔科夫博弈 48-49 4.3 服务 AGENT 的学习机制 49-50 4.4 服务 AGENT 学习算法 50-51 4.5 实验结果及分析 51-60 4.5.1 实验环境 51 4.5.2 实验一:可行性实验以及与前向搜索算法的比较 51-55 4.5.3 具体案例 55 4.5.4 实验二:重复进行相同请求 55 4.5.5 实验三:重复进行相似的请求 55-58 4.5.6 实验四:处理不太相近的请求 58-59 4.5.7 实验五:在学习过程采取通信 59-60 4.6 本章小结 60-61 第五章 学习模型的存储 61-65 5.1 基本思路 61-62 5.2 实验结果及分析 62-65 5.2.1 实验一:处理不太相近的请求 62-63 5.2.2 实验二:存储模型数量与收敛时间的关系 63-65 第六章 总结及展望 65-67 6.1 论文主要工作 65-66 6.2 未来研究展望 66-67 致谢 67-68 参考文献 68-73 攻读硕士学位期间已发表或录用的论文及参与的项目 73
|
相似论文
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 哲学思想在指导中学数学教学中的作用,G633.6
- 面向业务过程的服务动态组合方法研究,TP393.09
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 基于面向服务架构的公众信息系统在新农村信息化建设中的应用研究,TP393.09
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于嵌入式Web服务器的监控系统研究,TP393.05
- 基于逻辑Petri网的Web服务组合建模与分析,TP393.09
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 伽达默尔游戏观研究,B83-0
- 基于SOA的MES系统的设计与实现,TP311.52
- 基于BPEL的动态Web服务组合的自适应研究,TP393.09
- 面向Web服务的QoS故障管理技术的研究,TP393.09
- 矿区地表形变野外数据采集系统的研究与实现,P208
- 视觉干预康复训练对脑卒中后平衡控制及步行能力的影响,R743.3
- 基于BMC的Web服务失配检测方法研究,TP311.52
- 基于谓词抽象与精化技术的Web服务验证研究,TP311.52
- 基于SOA与工作流的OA系统的研究与实现,TP311.52
- 基于强化学习的改进遗传算法研究,TP18
- 基于强化学习的蚁群聚类研究及应用,TP18
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|