学位论文 > 优秀研究生学位论文题录展示
面向个性化Web新闻服务的层次型用户兴趣建模研究
作 者: 李世瀛
导 师: 胡学钢; 吴共庆
学 校: 合肥工业大学
专 业: 计算机应用技术
关键词: 用户建模 用户兴趣模型 层次聚类 个性化计算
分类号: TP393.09
类 型: 硕士论文
年 份: 2012年
下 载: 20次
引 用: 0次
阅 读: 论文下载
内容摘要
随着互联网技术的迅速发展,Web信息呈爆炸式增长,在海量的数据中,如何快捷高效的搜索获取需要或者感兴趣的信息逐渐成为人们关注的焦点。Web个性化服务在一定程度上解决了信息高速增长与用户获取信息手段相对简单之间的矛盾。Web信息服务商通过不断提高个性化服务质量来更好地为吸引用户,获取用户的认同感,提高用户的满意度。用户兴趣建模是个性化服务的核心和关键,信息检索、数据挖掘、电子商务以及个性化推荐领域都试图考虑使用用户兴趣模型来提高信息服务的质量。传统的用户兴趣模型大都基于VSM(Vector Space Model,向量空间模型),使用关键词来表示用户的兴趣,既没有考虑关键词之间的粒度层次关系,也没有利用领域知识来推断用户感兴趣的具体概念或者主题,使得用户兴趣模型难以准确合理的表示用户的兴趣。针对传统建模方法存在的问题,本文以个性化Web新闻服务为例,对层次型用户兴趣建模展开研究,提出了一种基于图划分的中文词语层次聚类算法GCPHC(Graph Partition-based Chinese Phrases Hierarchical ClusteringAlgorithm),将用户的兴趣组织为树形层次结构,并基于HowNet和ODP领域知识,给出最大匹配映射算法HNM3(HowNet-based Maximum MatchingMapping)来定位用户的兴趣主题,最终构建带有主题标签的层次用户兴趣模型。本文主要工作如下:(1)在日益需要更加智能化的Web个性化服务的背景下,本文使用分裂式层次聚类算法对用户感兴趣的Web内容构建了层次型用户兴趣模型,为Web个性化服务提供帮助。(2)针对识别用户兴趣模型中具体兴趣主题的问题,文本使用HowNet知识库和ODP开放分类目录,将层次模型节点映射到ODP目录主题上,提高了用户模型的有效性。(3)通过相关实验,确定了构建用户模型过程中所需要的相关函数,数据规模和词性特征,为层次型用户兴趣模型在Web个性化服务领域的应用提供了依据。
|
全文目录
摘要 5-6 ABSTRACT 6-8 致谢 8-11 插图清单 11-12 表格清单 12-13 第一章 绪论 13-21 1.1 课题研究的背景、目的和意义 13-15 1.1.1 课题研究的背景 13 1.1.2 课题研究的目的 13-14 1.1.3 课题研究的意义 14-15 1.2 用户兴趣建模研究现状 15-18 1.2.1 用户兴趣识别 15-16 1.2.2 扁平模型 16-17 1.2.3 层次模型 17-18 1.3 论文内容的组织 18-19 1.4 课题来源及主要贡献 19-21 第二章 用户兴趣建模技术 21-29 2.1 用户兴趣建模的发展 21-23 2.2 用户兴趣模型的分类 23 2.3 用户兴趣建模框架 23-27 2.3.1 用户兴趣信息获取 23-24 2.3.2 用户兴趣模型表示 24-25 2.3.3 用户兴趣建模方法 25-26 2.3.4 用户兴趣模型评价 26-27 2.4 用户兴趣建模案例介绍 27-28 2.5 本章小结 28-29 第三章 层次型用户兴趣建模的理论基础 29-40 3.1 特征抽取 30-34 3.2 特征相关性 34-35 3.3 聚类算法 35-37 3.4 ODP与HowNet 37-39 3.4.1 ODP 37-38 3.4.2 HowNet 38-39 3.5 本章小结 39-40 第四章 层次型用户兴趣建模方法实现 40-47 4.1 总体思路 40-41 4.2 GCPHC算法 41-44 4.3 HNM3算法 44-46 4.4 本章小结 46-47 第五章 实验及结果分析 47-54 5.1 实验环境 47 5.2 实验数据 47-48 5.3 实验设计 48-49 5.4 实验评估与结果分析 49-53 5.4.1 评价指标 49-50 5.4.2 结果分析 50-53 5.5 本章小结 53-54 第六章 总结与展望 54-56 6.1 本文总结 54 6.2 工作展望 54-56 参考文献 56-61 攻读硕士学位期间发表论文与科研情况 61-62
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
- 对于系统发育谱法聚类算法的改进,TP311.13
- 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
- 基于Agent元搜索引擎的个性化研究,TP391.3
- 基于改进的模糊C均值聚类算法的多文档自动文摘,TP391.1
- 基于用户兴趣模型的元搜索引擎的研究,TP391.3
- 互联网新闻热点挖掘系统的研究与实现,TP393.09
- 儿童网站的界面设计方法研究,TP393.092
- 网络舆情数据获取与话题分析技术研究,TP393.09
- 网络信息提取系统关键技术研究,TP393.09
- 基于两层次聚类的车辆配载调度方法,U492.22
- 基于层次聚类法和蚁群算法的电力系统无功优化,TM714.3
- 个性化医疗信息推荐系统的研究与实现,R319
- 基于Web的社会网络搜索中人名同一性判断方法研究,TP393.09
- 面向消费者感性需求的手持GPS设计探讨,TN967.1
- 中文人名跨文档指代消解研究,TP391.1
- 基于DEA模型的我国R&D投入产出效率评估研究,G322
- 智能型搜索引擎的研究,TP391.3
- 大规模数据聚类技术研究与实现,TP311.13
- 广州汽车产业集群发展的影响因素分析,F426.471
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|