学位论文 > 优秀研究生学位论文题录展示
关联规则挖掘方法的研究及应用
作 者: 刘亚波
导 师: 刘大有
学 校: 吉林大学
专 业: 计算机应用技术
关键词: 数据挖掘 关联规则 关联规则挖掘 支持度 可信度 最小支持度 最小可信度 频繁项目集 最大频繁项目集 序列模式 有序序列 有序模式 数据清洗 推荐系统 评价表 基于内容过滤的推荐 基于CF 的推荐 基于规则的推荐 用户关联 项目关联 概念格 数据表 标准 优先数据表 支配关系 被支配关系 三值数据表 支配项目集 支配关联规则
分类号: TP311.13
类 型: 博士论文
年 份: 2005年
下 载: 1820次
引 用: 34次
阅 读: 论文下载
内容摘要
本文在数据挖掘研究和关联规则挖掘研究背景下,展开了对关联规则挖掘方法的研究及应用工作,重点研究了关联规则最大频繁项目集、有序模式、用户关联和支配关联规则的挖掘方法及应用等问题,具体包括:(1)对数据挖掘技术,特别是关联规则挖掘技术研究进行了全面综述;(2)关联规则最大频繁项目集发现的问题的研究,提出了采用改进集合枚举树描述项目集、结合双向搜索策略、利用非频繁项目集对候选最大频繁项目集进行剪枝的快速发现最大频繁项目集的算法。(3)挖掘和应用有序模式问题的研究,将关联规则频繁模式的概念扩展到有序模式问题,给出了有序模式的挖掘方法,进而提出并实现了应用有序模式进行数据清洗的方法;(4)推荐系统中挖掘用户关联规则问题的研究,提出并实现了基于两阶段计数的用户关联挖掘框架和算法;(5)挖掘和应用支配关联规则问题的研究,将关联规则的一般形式扩展到支配关联规则,给出了挖掘支配关联规则的方法,提出了应用支配关联规则进行未知标准值预测的方法。本文的研究结果在关联规则挖掘方面很有理论意义和应用价值。
|
全文目录
第一章 绪论 9-28 1.1 研究背景 9-25 1.1.1 数据挖掘 9-12 1.1.1.1 数据挖掘的产生与发展 9-11 1.1.1.2 数据挖掘的含义 11-12 1.1.2 数据挖掘的基本过程 12-15 1.1.2.1 数据挖掘的主要步骤 12-13 1.1.2.2 数据清洗 13-15 1.1.3 数据挖掘任务 15-19 1.1.3.1 概念描述 15 1.1.3.2 关联分析 15-16 1.1.3.3 分类和预测 16-17 1.1.3.4 聚类分析 17 1.1.3.5 孤立点分析 17-18 1.1.3.6 Web 挖掘 18-19 1.1.4 关联规则挖掘 19-25 1.1.4.1 关联规则挖掘概念 19-20 1.1.4.2 关联规则挖掘算法 20-21 1.1.4.3 关联规则挖掘工作的其他方向 21-24 1.1.4.4 关联规则的有关专利 24-25 1.2 本文工作 25-28 第二章 关联规则挖掘的相关工作 28-39 2.1 关联规则挖掘的有关概念 28-29 2.2 关联规则的定义及例 29-32 2.3 数据分布 32-33 2.3.1 水平数据分布 32-33 2.3.2 垂直数据分布 33 2.4 APRIORI 算法及其变种 33-38 2.4.1 Apriori 算法 34-36 2.4.1.1 候选项目集的生成 35 2.4.1.2 计算项目集的支持度 35-36 2.4.1.3 Apriori 算法描述 36 2.4.2 AprioriTid 算法 36-37 2.4.3 AprioriHybrid 算法 37-38 2.5 小结 38-39 第三章 发现最大频繁项目集 39-59 3.1 引言 39-40 3.2 发现最大频繁项目集 40-47 3.2.1 最大频繁项目集 40-42 3.2.2 常用频繁项目集发现策略 42-47 3.2.2.1 自底向上的搜索策略 44-45 3.2.2.2 自顶向下的搜索策略 45-46 3.2.2.3 双向搜索策略 46-47 3.3 最大频繁项目集发现算法P&M 47-58 3.3.1 集合枚举树 48-49 3.3.2 集合枚举树的改进 49-50 3.3.3 MFCS_k、搜索策略与剪枝策略 50-53 3.3.3.1 候选最大频繁项目集集合MFCS_k 50-51 3.3.3.2 搜索策略与剪枝策略 51-53 3.3.4 非频繁项目集的生成 53 3.3.5 候选最大频繁项目集的生成 53-54 3.3.6 P&M 算法 54-56 3.3.7 算法分析与比较 56-58 3.4 小结 58-59 第四章 挖掘有序模式并进行数据清洗 59-74 4.1 引言 59-60 4.2 相关工作 60-62 4.2.1 序列模式挖掘 60-61 4.2.2 数据清洗 61-62 4.3 挖掘有序模式并进行数据清洗 62-73 4.3.1 挖掘有序模式 62-64 4.3.2 在数据清洗中发现错误数据 64-67 4.3.3 实验 67-73 4.3.3.1 实验1:计算class1与其他类的不一致程度 68-69 4.3.3.2 实验2:检测class1中的错误记录 69-70 4.3.3.3 实验3:检测Glass Identification Database 中错误记录 70-73 4.4 小结 73-74 第五章 基于两阶段计数的用户关联挖掘 74-92 5.1 引言 74-75 5.2 推荐系统概述 75-81 5.2.1 推荐系统的产生 75-76 5.2.2 推荐系统的工作流程及相关技术 76-81 5.2.2.1 收集访问者对资源的评价 77-78 5.2.2.2 处理评价表 78-79 5.2.2.3 推荐技术 79-81 5.2.3 推荐系统的其他问题 81 5.3 基于两阶段计数的用户关联挖掘 81-91 5.3.1 基本概念 82-83 5.3.2 使用当前用户划分评价表 83-84 5.3.3 基于两阶段计数的用户关联挖掘框架 84-86 5.3.4 基于两阶段计数的用户关联挖掘算法TSCF-CL 86-91 5.3.4.1 概念格基本概念 86-87 5.3.4.2 TSCF-CL 算法描述 87-89 5.3.4.3 不可信结点 89 5.3.4.4 推荐度计算 89 5.3.4.5 TSCF-CL 算法性能测试 89-91 5.4 小结 91-92 第六章 挖掘支配关联规则 92-105 6.1 引言 92-93 6.2 优先数据表 93-95 6.3 挖掘支配关联规则 95-101 6.3.1 三值数据表 95-97 6.3.2 相关定理 97-98 6.3.3 挖掘支配关联规则算法 98-101 6.4 未知标准值预测 101-104 6.4.1 标准相关 101 6.4.2 未知决策标准值预测 101-103 6.4.3 未知标准值预测 103-104 6.5 小结 104-105 参考文献 105-116 作者读博士期间发表的论文和参加的项目 116-118 致谢 118-119 摘要 119-122 ABSTRACT 122-124
|
相似论文
- 溃坝生命损失风险评价的关键技术研究,TV122.4
- AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
- 高保真遥感图象压缩与分辨率增强联合处理研究,TP751
- 中考数学创新性试题分析与命题研究,G633.6
- 新疆油田地面工程造价指标和管理信息系统的研究与应用,F284
- 第三套《全国健美操大众锻炼标准》初级套路对普通女大学生健康体适能影响的实验研究,G831.3
- 基于ZigBee技术的无线传感器网络研究与实现,TN929.5
- 二阶系统解耦的数值算法研究,O175
- 广义系统的结构分析及控制方法研究,N945.1
- 基于先进制造技术的大规模定制家具开发和生产解决方案的研究,TS664
- 纺织品中重金属监控及预警研究,TS107
- 寿光市信息农业发展研究,F320.1
- 基于元数据的农田信息存储、管理和共享研究,S126
- 水氮耦合对日光温室标准切花菊‘神马’外观品质影响的预测模型,S682.11
- CSB Image-Meater猪智能化影像分级仪瘦肉率预测及猪胴体等级评定标准的研究,S828
- 上海市城市居民最低生活保障标准问题研究,D631.2
- 中英“统计与概率”领域初中课程内容标准比较与思考,G633.6
- 试题与课程标准一致性研究,G633.3
- 高校教师数字化生存能力现状分析,G645.1
- 清热头痛软胶囊生产工艺及质量标准的研究,TQ461
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|