学位论文 > 优秀研究生学位论文题录展示

基于最大熵方法面向零售业的数据挖掘

作 者: 周飞
导 师: 孙慰迟
学 校: 复旦大学
专 业: 软件工程
关键词: 最大熵模型 零售业 数据仓库 数据挖掘 特征选取 客户分类
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 91次
引 用: 0次
阅 读: 论文下载
 

内容摘要


零售业从其诞生之日起,就一直伴随着激烈的竞争。尤其是随着中国加入WTO以来,零售业的日益开放已是不可阻挡的即成事实。世界上大型的零售企业如沃尔玛,麦德龙等也已经开展了其在国内的抢滩之路,国内零售企业必须采取有效的应对之策。国内零售企业在日常的业务活动中积累了大量的历史数据,但由于分析手段的缺乏,使得决定企业的决策不是基于数据库中丰富的数据和对市场的广泛调查,而是基于企业管理者的直觉,或想当然。因此提高企业的数据分析能力,同时建立一个基于相关数据的决策支持系统就变的十分重要。而数据挖掘技术作为近几年发展起来的数据组织和分析技术,在这一过程中无疑将发挥重要作用。文章根据帕累托的“20-80”规律,即企业收入的80%通常是来自于20%的顾客。提出了并非所有的客户对企业来说都是有价值的,优质客户给企业带来的利润远远超过一般客户。企业对客户购物行为进行分析,然后区别对待,有助于企业把有限精力集中在最有价值的客户上,提高企业竞争力。本文的目的和意义就是迅速准确地对客户信息进行分析和分类。现在使用的数据挖掘技术对优质客户的过滤还不够深入,准确率不高,无法分辨客户数据变化的意义,本文为此提出了利用最大熵方法来建立模型以过滤优质客户。最大熵模型作为一个比较成熟的统计模型,具有计算模型独立于特定的任务的特点,具有简洁、通用和易于移植等优点。但在最近几年的研究中只是被应用在关于自然语言处理的领域。如何将最大熵模型应用在零售业领域的数据挖掘中正是本文研究的重点问题。本文首先介绍了目前数据挖掘技术的研究背景,重点对OLAP和分类规则进行了介绍。在此基础上,介绍了最大熵模型的理论基础和算法。再通过零售业企业数据仓库的建立过程分析了零售业对数据挖掘的需求。本文的重点工作是将最大熵方法应用于零售业企业优质客户过滤中,提出了基于最大熵的优质客户过滤系统的基本框架;通过客户数据的不同特征相结合的方法,将客户数据表示成特征向量,并对使用不同特征集情况下的过滤性能进行了对比实验;提出了过滤模型的自适应调整和学习算法,以适应客户特征变化,满足用户的个性化过滤要求;将最大熵方法与其它常用的过滤方法(如贝叶斯方法)进行了性能比较,实验结果表明,这种方法在正确率等方面表现出了良好的过滤性能,可以较好的把关键用户的行为剥离出来,解决了依据历史数据对客户予以分类的工作。通过本文的工作,使得采用此系统和算法模型的企业利润有15.7%的提高。

全文目录


相似论文

  1. 领域实体属性及事件抽取技术研究,TP391.1
  2. 人物言论抽取与跟踪技术研究,TP391.1
  3. 基于数据挖掘技术的保健品营销研究,F426.72
  4. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  5. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  6. Bicluster数据分析软件设计与实现,TP311.52
  7. 基于变异粒子群的聚类算法研究,TP18
  8. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  9. 基于遗传算法和粗糙集的聚类算法研究,TP18
  10. 基于数据挖掘的税务稽查选案研究,F812.42
  11. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  12. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  13. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  14. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  15. 教学质量评估数据挖掘系统设计与开发,TP311.13
  16. 汉语框架自动识别中的歧义消解,TP391.1
  17. 我国零售业上市公司的成长性评价研究,F832.51
  18. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  19. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  20. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  21. Web使用挖掘与网页个性化服务推荐研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com