学位论文 > 优秀研究生学位论文题录展示

基于增强学习的自动协商研究

作 者: 邓俊昆
导 师: 孙天昊
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 自动协商 电子商务 增强学习 Q-学习 Agent技术
分类号: TP18
类 型: 硕士论文
年 份: 2013年
下 载: 4次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着计算机技术的发展,电子商务已经走进人们的生活。传统的电子商务模式比较简单,在进行交易时,只是单方面的同意或者拒绝,没有协商过程,所以只能对简单生活场景进行模拟,而在现实生活中,协商能够增进买卖双方的了解,并且能解决一些分歧和冲突。人工智能技术的发展使得对Agent研究越来越成熟,Agent帮人处理事情的能力越来越强,由Agent技术和电子商务结合起来形成的自动协商能够为上述问题提供一些解决思路。目前主流的研究方向是把机器学习的方法用到自动协商中,本文研究的是增强学习算法在协商中的应用。本文首先对电子商务、自动协商理论进行简单介绍,讲述了常见的机器学习方法在自动协商中的应用,然后对传统的算法进行研究,指出其存在的问题,并提出期望还原率进行改进,最后将改进后的算法应用的双边多议题当中去,通过实验对比验证所提改进算法的效果。具体研究工作如下:①首先对传统增强学习算法的参数(时间贴现率,时间信念等等)进行研究,分析了参数取不同值时对协商的影响,指出了在不同的协商情形中如何选择合适的参数。②通过实验发现传统增强学习算法存在妥协过快的缺点,针对这个缺点,本文提出基于期望还原率的增强学习算法对原算法进行改进,并对期望还原率的取值进行了讨论,当期望还原率为1时,就是传统的增强学习算法。③结合对手分类和增强学习算法进行协商。通过研究对手的协商历史,将对手分为不同的类别,每个类别对应着不同的协商态度,对不同协商态度的对手采用不同的信念函数进行协商。④利用双边多议题协商框架,将基于期望还原率的增强学习协商策略应用到双边多议题当中,通过与基于传统增强学习算法协商策略、基于时间的协商策略进行对比,实验表明在协商次数允许的范围内,改进算法能取得效用更高的协商解。

全文目录


摘要  3-4
ABSTRACT  4-8
1 绪论  8-15
  1.1 研究背景和意义  8-10
  1.2 国内外研究现状  10-13
    1.2.1 基于辩论的协商  10
    1.2.2 基于博弈论的协商  10-11
    1.2.3 基于启发式的协商  11
    1.2.4 基于机器学习的协商  11-13
  1.3 论文研究内容  13
  1.4 论文组织结构  13-15
2 自动协商简介  15-20
  2.1 AGENT 技术  15-16
    2.1.1 agent 的定义  15
    2.1.2 多 agent 系统  15-16
  2.2 电子商务  16-17
    2.2.1 电子商务概述  16
    2.2.2 电子商务的运作流程  16-17
  2.3 电子商务中的自动协商  17-18
  2.4 AGENT 在电子商务中的应用  18-19
  2.5 小结  19-20
3 基于增强学习的双边单议题协商  20-38
  3.1 传统的增强学习协商  20-24
    3.1.1 增强学习简介  20-21
    3.1.2 增强学习在协商中的应用  21-23
    3.1.3 增强学习协商算法  23-24
  3.2 改进参数的增强学习的协商  24-26
  3.3 基于对手分类的增强学习的协商  26-27
    3.3.1 信念调整  27
    3.3.2 协商报价策略  27
  3.4 实验  27-36
    3.4.1 关于协商参数取值研究的实验  27-31
    3.4.2 基于改进增强学习算法的实验  31-35
    3.4.3 基于对手分类的实验  35-36
  3.5 小结  36-38
4 基于增强学习的双边多议题协商  38-50
  4.1 双边多议题协商框架  38-43
    4.1.1 协商议题  38-39
    4.1.2 协商协议  39-40
    4.1.3 协商决策过程  40-43
    4.1.4 协商的假设条件  43
  4.2 基于时间的双边多议题协商  43-44
  4.3 实验  44-49
    4.3.1 议价区间相差较大时的实验  44-45
    4.3.2 议价区间相差较小时的实验  45-47
    4.3.3 不同期望还原率的实验  47
    4.3.4 大量数据对比的实验  47-49
  4.4 小结  49-50
5 总结与展望  50-52
  5.1 总结  50
  5.2 展望  50-52
致谢  52-53
参考文献  53-56
附录  56
  A. 作者在攻读硕士学位期间发表的论文目录  56

相似论文

  1. 基于多Agent理论的卫星协同定轨技术研究,V474
  2. 非智力因素对小凉山地区中学生化学学习的影响,H319
  3. 任务型教学在农村初中英语教学中的应用研究,H319
  4. 中职学生数学学习中的非智力因素研究,G633.6
  5. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  6. Q学习在基于内容图像检索技术中的应用,TP391.41
  7. 基于多示例学习的用户关注概念区域发现,TP391.41
  8. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  9. 唇读中的特征提取、选择与融合,TP391.41
  10. 基于过程的协作学习环境设计研究,G434
  11. 美国“写作教室”理论与实践初探,G633.3
  12. 建构主义学习理论指导下的科教电视节目编导策略研究,G222.3
  13. 广州市南沙区农村初中班主任胜任力研究,G635.1
  14. 高中生物教学中培养学生自主学习能力的尝试,G633.91
  15. 对农村初级中学学生数学学习兴趣的调查与研究,G633.6
  16. 高中男、女生英语词汇学习策略差异及对其英语词汇学习的影响,G633.41
  17. 探析初中语文教学文本自主学习能力的培养,G633.3
  18. 高一学生学习地理困难研究,G633.55
  19. 思维导图在科学教学中的应用,G633.98
  20. 广州市高中生生物实验学习兴趣现状及对策研究,G633.91
  21. 高中数学学困生的有效转化策略探究,G633.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com