学位论文 > 优秀研究生学位论文题录展示
基于社会化标签的个性化搜索研究
作 者: 陈琛
导 师: 沈洁
学 校: 扬州大学
专 业: 计算机应用技术
关键词: 社会化标签 标签 个性化搜索 用户特征 个性化推荐
分类号: TP391.3
类 型: 硕士论文
年 份: 2008年
下 载: 510次
引 用: 7次
阅 读: 论文下载
内容摘要
在互联网技术的推动下搜索引擎的应用日趋成熟,各式搜索引擎也已成为人们在信息过载的互联网中搜寻信息时的有利工具。然而随着人们对信息的个性化要求越来越高,也对搜索引擎的搜索效果提出了更高的要求。Web2.0及其相关技术的出现为整个互联网带来了一个新的惊喜,其中最具代表的社会化标注(Social Annotation)为提高搜索引擎个性化服务质量带来了新的契机。搜索引擎的个性化方面的研究,集中在如何准确有效的获取用户的个性化特征,及如何根据获取的用户偏好为其提供个性化服务。本文首先全面分析了传统的Web日志挖掘中的关键技术,总结了传统日志挖掘在用户数据获取、数据过滤、模型表示、模型学习及更新的主要方法。在分析出传统web日志挖掘中存在的问题后,本文结合传统的Web日志挖掘方法及对标签 的学位论文">社会化标签数据的处理来获取用户的特征,并据此对用户进行个性化推荐和贡献。社会化标签网带来的是由用户主动标识过的信息资源,相比较传统的Web日志挖掘而言,从这些信息资源中学习用户的偏好特征必然更为客观和准确。其次用户标注行为的本身也具有可挖掘性,用户对某一类资源的标注的频繁度映射了其对这一兴趣点的关注程度;用户在某一类资源中总是可以较早的发现一些质量高的资源,那么依据此特征可以把这些资源推荐给具有相同兴趣的其他用户。论文的主要工作包括以下方面。(一)利用矩阵分别对用户的历史搜索记录和用户标注数据进行描述,并对用户搜索和标注中的关键term进行时间维上的描述。通过由搜索数据及标注数据构建的矩阵最终刻画描述用户的特征模型。(二)基于用户特征的表示探讨了现有的主要用户模型的学习和更新方法,并结合其优点针对其不足提出一种自适应的用户模型的学习方法。(三)在获得用户特征后,针对一般性用户的数据稀松问题提出一种基于协同过滤的个性化推荐;以及根据用户标注行为本身与一般用户特征相结合的方法为用户提供个性化共享服务。
|
全文目录
中文摘要 4-5 英文摘要 5-7 1 绪论 7-11 1.1 论文的选题背景和研究意义 7-8 1.1.1 选题背景 7-8 1.1.2 研究意义 8 1.2 论文的研究内容、主要工作及创新点 8-10 1.2.1 论文的研究内容 8-10 1.2.2 论文的主要工作及创新点 10 1.3 论文的内容组织 10-11 2. 相关工作 11-24 2.1 Web 数据挖掘研究 11-16 2.1.1 Web 内容挖掘 12 2.1.2 Web 结构挖掘 12-14 2.1.3 Web 使用挖掘 14-16 2.2 个性化搜索研究 16-17 2.2.1 个性化搜索研究现状及存在的问题 16 2.2.2 个性化搜索目前的主要方法 16-17 2.3 用户特征模型的研究 17-24 2.3.1 用户特征模型的研究现状及存在的问题 17-19 2.3.2 用户特征模型的主要技术 19-24 3 基于标签 的学位论文">社会化标签的用户特征模型的构建 24-37 3.1 社会化标签的主要技术 24 3.2 基于社会化标签用户特征模型构建方法 24-29 3.2.1 Tag Cloud (标签云) 26-28 3.2.2 Query-Tag-Tree (查询-标签-树) 28-29 3.3 基于社会化标签用户特征的表示 29-34 3.3.1 基于用户搜索记录数据的用户特征表示 29-32 3.3.2 基于用户标注行为数据的用户特征表示 32-34 3.4 基于社会化标签用户特征模型的学习 34-35 3.4.1 Rocchio 算法 34-35 3.4.2 LLSF 算法(Linear Least Squares Fit) 35 3.4.3 KNN 算法 35 3.4.4 Adaptive Learning 算法 35-37 4 基于社会化标签的用户个性化推荐 37-47 4.1 基于一般用户特征的推荐 38-39 4.2 基于用户特征的推荐 39-40 4.3 基于一般特征与用户特征相结合的推荐 40-41 4.4 基于社会化标签的协同过滤推荐 41-43 4.5 实验 43-47 4.5.1 数据准备 43 4.5.2 实验结果分析与评估 43-47 5 总结与展望 47-48 参考文献 48-54 致谢 54-55 攻读硕士期间发表论文情况 55-56
|
相似论文
- 溶藻弧菌诱导红笛鲷仔鱼差减文库的构建及其表达序列标签分析,S943
- 小麦miRNA及花器官特异表达基因的鉴定与分析,S512.1
- 小麦基因电子表达分析平台的构建及相对于水稻的小麦特异基因的鉴定,S512.1
- Delicious中文标签与汉语主题词表的结合研究,G254.2
- 香雪兰查尔酮合酶基因的克隆及其原核表达,Q943.2
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 1BL.1RS易位及条锈病抗性品种基因差异表达分析和生理参数变化研究,S512.1
- 基于BP网络的元搜索引擎研究,TP391.3
- 媒介融合时代的电视奇观研究,G206
- 能力导向终身学习个性化推荐系统学习者模型构建,G720
- 面向用户偏好的MADM方法在个性化推荐中的应用,G353.1
- 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
- 基于SRR结构的RFID技术研究与应用,TP391.44
- 基于集成节点的互连网络的控制平面技术研究,TN929.1
- 基于GMPLS的光突发交换光网络及其关键技术的研究,TN929.1
- 浏览器的安全访问及指纹识别技术,TP393.092
- 基于RFID的飞机维修工具管理系统的设计,TP311.52
- 无源微型可视化光学标签的原理与制作,TP391.44
- 基于散列函数的RFID认证协议研究,TP391.44
- 有源加密型微光学标签系统的设计与制作,TP391.44
- 宽带无线通信多用户调度与分集技术,TN92
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|