学位论文 > 优秀研究生学位论文题录展示
基于模糊聚类的自组织神经网络的用户模式挖掘算法研究
作 者: 张旭
导 师: 段隆振
学 校: 南昌大学
专 业: 计算机应用技术
关键词: 用户模式挖掘 隶属度 自组织神经网络 合并聚类
分类号: TP311.13
类 型: 硕士论文
年 份: 2012年
下 载: 82次
引 用: 0次
阅 读: 论文下载
内容摘要
目前,兴起的个性化信息推荐技术已经成为当前Web使用挖掘的热门领域之一。个性化信息推荐是根据Web用户浏览站点的Web日志以及其他用户的相关信息,推测其喜好和兴趣,并为其提供个性化信息服务。本文主要研究个性化推荐过程中的用户聚类算法,对Web日志进行分析从而获取用户的多种兴趣。本文提出基于聚类中心集的合并聚类算法来确定样本集的聚类数目。采用了自组织神经网络作为实施算法,预设一个较大的聚类数目进行网络学习和训练,得到聚类中心集。利用该算法对聚类中心集进行合并操作,利用夹角余弦公式计算各聚类中心的相似度,构建评价函数来判断聚类中心是否可以满足合并的要求,最后根据样本隶属聚类中心的隶属度的分布是否均匀来合并聚类中心集,从而得到样本集的新的聚类中心集和聚类数目。本文将模糊C均值聚类算法应用于自组织神经网络的拓扑结构,提出一个模糊聚类神经网络。利用自组织神经网络的拓扑结构和强大的训练学习能力,能够有效解决模糊C均值聚类中大数据量运算缓慢和中心权值初始化等一些问题;同时,模糊C均值聚类在处理复杂问题上,为其增加模糊的特性,对聚类效果有明显的改进,并且可以挖掘用户的多兴趣。在模糊聚类神经网络的应用阶段,竞争模糊层的神经元权值设置为之前训练阶段的权值,并保持稳定,不再进行更新调整。根据隶属度函数更新每个输入样本到输出神经元的隶属度。学习率根据隶属度进行自适应的调整,避免对邻域的选择与调整。最后根据隶属度的分布特征,设定输出阈值,若输入样本到某一输出神经元的隶属度大于该阂值,则输出该神经元所对应的类别信息。最后,利用本文设计的挖掘模型对预处理后的数据进行训练,使该模型能够自动聚类。然后随机从输入样本中抽取数据,对模型的性能进行测试和评估,实验证明,改进后的模糊聚类神经网络聚类效果明显,能准确刻画出用户的模糊特性,即用户的多种兴趣和喜好。
|
全文目录
摘要 3-4 ABSTRACT 4-9 第1章 引言 9-14 1.1 论文的研究背景和意义 9-10 1.1.1 研究背景 9-10 1.1.2 选题意义 10 1.2 国内外研究现状 10-12 1.2.1 国外的研究现状 10-11 1.2.2 国内的研究现状 11-12 1.3 论文的主要内容 12-13 1.4 论文的组织结构 13-14 第2章 Web用户模式挖掘理论基础 14-22 2.1 Web挖掘 14-16 2.1.1 Web挖掘定义 14 2.1.2 Web挖掘的复杂性 14 2.1.3 Web挖掘的分类 14-16 2.2 Web使用挖掘 16-18 2.2.1 Web日志挖掘简介 16 2.2.2 Web日志挖掘的预处理流程 16-17 2.2.3 Web日志挖掘中常用技术 17-18 2.3 聚类分析基本理论 18-21 2.3.1 聚类分析基本概念 19 2.3.2 聚类方法介绍 19-20 2.3.3 聚类分析中的相似性度量 20-21 2.3.4 聚类算法面临的主要问题 21 2.4 小结 21-22 第3章 模糊聚类和自组织神经网络 22-27 3.1 模糊聚类 22-24 3.1.1 模糊聚类FCM算法介绍 22-23 3.1.2 模糊聚类FCM算法分析 23-24 3.2 自组织神经网络 24-26 3.2.1 自组织特征映射神经网络(SOM)的介绍 24 3.2.2 自组织特征映射神经网络(SOM)的原理和算法 24-25 3.2.3 自组织特征映射神经网络(SOM)的分析 25-26 3.3 小结 26-27 第4章 基于模糊聚类和自组织神经网络的Web用户模式挖掘设计 27-37 4.1 Web用户聚类 27-30 4.1.1 用户网站访问序列相似度 27-28 4.1.2 用户兴趣主题的特征向量 28-29 4.1.3 用户相似度计算 29 4.1.4 聚类数目确定 29-30 4.2 基于模糊C均值聚类的自组织神经网络 30-34 4.2.1 基于模糊C均值聚类的自组织神经网络结构 30-31 4.2.2 基于模糊C均值聚类的自组织神经网络的原理 31-32 4.2.3 基于模糊C均值聚类的自组织神经网络的算法 32-33 4.2.4 基于模糊C均值聚类的自组织神经网络的算法分析 33-34 4.3 Web用户模式挖掘模型的设计 34-35 4.4 小结 35-37 第5章 基于模糊聚类和自组织神经网络的Web用户模式挖掘实现及分析 37-52 5.0 实验平台搭建 37-38 5.0.1 实验环境 37 5.0.2 实验评估参数 37-38 5.1 数据预处理 38-41 5.1.1 数据集介绍 38-39 5.1.2 数据预处理 39-41 5.2 Web用户模式挖掘模型的实现 41-49 5.2.1 学习训练阶段 41-47 5.2.2 应用阶段 47-49 5.3 基于改进前后的自组织神经网络算法的对比 49-51 5.3.1 训练误差对比 49-50 5.3.2 聚类结果对比 50-51 5.4 小结 51-52 第6章 结论与展望 52-54 6.1 结论 52-53 6.2 展望 53-54 致谢 54-55 参考文献 55-58 攻读学位期间的研究成果 58
|
相似论文
- 高校网络健康度评估系统研究,G647
- 工程模糊集理论在水利工程中的应用研究,TV22
- 三自由度飞行器的控制研究,V249.1
- 基于遗传算法的模糊推理控制系统的参数优化研究,O231
- 江西省水生态承载力分析,TV213.4
- 基于语音生成和获取中声音分类学习的神经模型研究,TN912.3
- 基于中介真值程度度量的图像分割方法研究,TP391.41
- 基于整合—激发神经元的自组织网络研究,TP183
- 林业企业信息系统综合评价模型研究,F326.25
- 基于改进GTD法的冶金煤气流量缺失数据填补,TF055
- 基于GIS的山核桃生长适宜性评价研究,S664.1
- 防火墙与入侵检测联动算法研究,TP393.08
- P2P模糊信任模型中的隶属度预测和权重分配研究,TP393.08
- 一种基于GWRN模型的自组织神经网络算法的研究及应用,TP393.05
- 典型模糊控制器的分析和极限结构,TP273.4
- 基于模糊神经网络构建英语情态动词can的语义推理模型,H313
- 基于日负荷曲线的用电行业构成比例在线修正方法研究,TM714
- 定量分析与定性分析相结合的选股模型,F832.51
- 基于多目标遗传算法的配送路径问题研究,TB114.1
- 中医儿童性早熟智能诊断算法研究,R272
- 基于模糊综合评判入侵检测系统的研究,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|