学位论文 > 优秀研究生学位论文题录展示
基于多维用户特征建模的个性化社交搜索引擎的设计与实现
作 者: 马尧
导 师: 董守斌
学 校: 华南理工大学
专 业: 计算机系统结构
关键词: 个性化 社交搜索 用户建模 社交网络 Lucene
分类号: TP391.3
类 型: 硕士论文
年 份: 2012年
下 载: 245次
引 用: 1次
阅 读: 论文下载
内容摘要
目前,搜索引擎已成为网民获取信息的一个重要途径。然而随着WEB2.0的迅速发展以及各类社交网站的日益崛起,传统搜索引擎的一些缺陷暴露了出来。一方面,各种Web2.0网站和社交网站拥有海量的用户数据,但传统搜索引擎却无法支持对其检索。另一方面,不同的用户因为职业、学历、兴趣偏好及社交关系各不相同,对搜索结果的期待也往往各不相同,因此对搜索引擎的个性化有很迫切需求。鉴于此,本文设计并实现了一个个性化社交搜索引擎,该系统以开放的社交网络为数据来源,通过分析丰富的用户特征及社交关系来改善传统搜索引擎的结果,旨在把对用户最重要、用户最感兴趣的结果排在最重要位置。用户建模是个性化社交搜索的前提和基础,本文根据真实的社交网络新浪微博的数据特征,提出了一种多维度多层次的用户模型,包括用户影响力模型、用户社交关系模型及用户兴趣模型等三个子模型,全面地描述了社交网络中的用户特征。为不干扰用户正常使用社交网络,本文根据新浪微博API特征,设计了隐式的用户数据获取算法,并根据用户模型,设计了一套用户特征生成算法,包括用于计算用户全局影响力的PersonRank特征生成算法、用以计算用户间相似度及亲密度的社交关系特征生成算法及根据朴素贝叶斯文本分类方法建立用户兴趣特征的生成算法,并采用隐式反馈的更新策略和基于用户主动反馈的策略建立了用户模型的更新机制。在用户建模的基础上,本文设计了一套个性化评分和排序机制。评分和排序算法在全文检索引擎Lucene的评分基础之上进行,融合了用户影响力得分、用户社交关系得分及用户兴趣得分来生成最终的文档得分,然后根据得分对文档重新排序。最后,本文在上述研究的基础上设计并实现了一个基于多维用户特征的个性化社交搜索引擎,并开放给数位用户进行评测。根据对点击日志的统计,表明用户对该个性化社交搜索引擎的满意度较全文检索引擎Lucene有较为明显的提升。
|
全文目录
摘要 5-6 Abstract 6-10 第一章 绪论 10-14 1.1 研究背景及意义 10-11 1.2 国内外研究现状 11-12 1.3 论文内容及组织结构 12-13 1.4 本章小结 13-14 第二章 相关理论知识与技术研究 14-23 2.1 Lucene 技术介绍 14-18 2.1.1 Lucene 简介 14 2.1.2 Lucene 的优点 14-15 2.1.3 Lucene 的系统架构及源码构成 15-16 2.1.4 Lucene 评分及排序机制 16-18 2.2 用户建模相关理论 18-22 2.2.1 用户模型表示的分类 18-21 2.2.2 用户兴趣获取方式的分类 21-22 2.3 本章小结 22-23 第三章 个性化社交搜索的用户模型 23-30 3.1 多维度的用户模型 23-28 3.1.1 用户兴趣模型 25 3.1.2 用户社交关系模型 25-27 3.1.3 用户影响力模型 27-28 3.2 文档模型 28-29 3.3 本章小结 29-30 第四章 个性化社交搜索的算法设计 30-65 4.1 用户信息获取 30-32 4.2 用户特征的生成 32-44 4.2.1 用户影响力特征的生成 32-33 4.2.2 用户社交关系特征的生成 33-37 4.2.3 用户兴趣特征的生成 37-44 4.3 用户模型更新机制 44-48 4.3.1 用户兴趣模型的更新机制 45-47 4.3.2 用户影响力模型的更新机制 47 4.3.3 用户社交关系模型更新机制 47-48 4.4 个性化社交搜索引擎的评分及排序 48-54 4.4.1 个性化社交搜索的排序机制 48-50 4.4.2 个性化社交搜索的评分机制 50-54 4.5 个性化社交搜索实验 54-64 4.5.1 实验目的 54-55 4.5.2 实验数据及参数 55-56 4.5.3 实验与结果分析 56-64 4.6 本章小结 64-65 第五章 个性化社交搜索系统的设计与实现 65-82 5.1 个性化社交搜索系统的目标 65 5.2 个性化社交搜索引擎的系统结构 65-67 5.3 个性化社交搜索引擎各模块设计与实现 67-81 5.3.1 数据抓取与存储模块 67-71 5.3.2 数据预处理模块 71-72 5.3.3 索引模块 72-75 5.3.4 个性化模块 75-78 5.3.5 检索模块 78-79 5.3.6 用户展示模块 79-81 5.4 本章小结 81-82 结论 82-84 参考文献 84-87 攻读硕士学位期间取得的研究成果 87-88 致谢 88
|
相似论文
- 万科模式的居住小区设计研究,TU984.12
- 个性化检索中相似用户群的获取与更新,TP391.3
- 大学生思想政治教育工作个性化教育的研究,G641
- 基于复杂网络特征的SNS社交网站传播特征研究,G206
- 基于Lucene的网络文学垂直搜索引擎的研究与实现,TP391.3
- Web使用挖掘与网页个性化服务推荐研究,TP311.13
- 中学个性化作文教学初探,G633.3
- 基于OAI-PMH协议及全文检索技术的图书馆联合目录系统,TP391.3
- 社交网络中个人信息与人际关系的隐私保护研究,TP393.08
- SNS用户信息披露及影响因素研究,F224
- 基于WebGIS和MMS的移动搜索服务系统开发,TP311.52
- 消防领域搜索引擎系统的设计与实现,TP391.3
- LUCENE中文分词在科研文档全文检索系统的应用研究,TP311.52
- 基于特征尺寸的个性化三维服装人台参数化建模系统的研究,TP391.41
- 基于MVC设计模式的网络服务平台的研究与实现,TP311.52
- 基于Lucene的知识库设计与实现,TP311.52
- 基于Lucene的电影票垂直搜索系统的设计与实现,TP391.3
- 基于HMM的社交网络连接关系研究,F49
- 基于Lucene.Net的全文检索研究与应用,TP391.3
- 公众论坛信息实时检索的研究与实现,TP391.3
- 基于内容的图像检索系统的设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|