学位论文 > 优秀研究生学位论文题录展示

基于社会化媒体的自适应信息推荐机制研究

作 者: 王佳
导 师: 李庆
学 校: 西南财经大学
专 业: 计算机应用技术
关键词: 推荐系统 社会化媒体 自适应推荐 新闻推荐 博客推荐 基于内容过滤
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 259次
引 用: 0次
阅 读: 论文下载
 

内容摘要


由于互联网的优越特性,在其上发布信息极为便捷,这就使得互联网上的信息数量以近乎爆炸的速度增长。如此多的信息即使浏览一遍都无法做到,用户希望能找到感兴趣的部分更是不可能的。传统的搜索方法只能呈现给所有用户一样的排序结果,无法针对不同用户的兴趣偏好提供相应的服务。信息的爆炸使得信息的利用率反而降低,这种现象被称之为“信息过载”。推荐系统是为解决互联网上的信息过载问题而提出的一种智能代理系统,能从互联网的大量信息、中向用户自动推荐出符合其兴趣偏好或需求的资源。在当前Web 2.0的环境下,社会化媒体的出现使得用户不仅是网络内容的浏览者,也是网络内容的制造者。它的发展进一步加剧了网络时代的信息爆炸。传统的推荐系统通过让用户回答问题或者主动定制的方式来获取用户的兴趣,进而实现推荐。然而,用户的兴趣不是一成不变的,它会随着时间的推移而变化。针对该点,本文提出了一种自适应信息推荐机制,来及时跟踪用户兴趣变化,推荐用户感兴趣的资源。社会化媒体形式多样,如论坛、博客、内容社区、社交网络等。在这些形式下,用户可以发布或者转帖一篇文章,其他用户可以对其阅读或评论,这些评论本身又会被其他用户阅读或评论。从用户评论中,可以观察出用户当前感兴趣的话题。传统的基于内容的推荐方法一般根据原文的内容信息来推荐相关文章。然而,我们知道,随着用户讨论的继续,讨论的主题也会发生变化,即用户兴趣也会发生变化。这时,如果仅仅依据原文本体进行推荐,则返回的文章往往不是用户当前最感兴趣的,从而会降低用户的满意度。因此,本文考虑了结合用户评论和原文本体来构建主题模型,利用该模型来选择相关文章。根据观察发现,每条评论对推荐结果的影响应该是不一样的,如有些评论对原文内容有深刻的见解,而有些评论完全是无意义的讨论。所以,当利用用户评论信息来跟踪主题演变时,区分开每条评论的影响非常重要。这里,我们从用户评论中抽取出评论间语义关系、结构关系以及用户权威来区别每条评论对推荐的影响。分析事件报道在网络上的传播,可以发现其存在如下四个特点:转载重合、报道重合、包含重合和追踪重合。这些特点使得基于内容的推荐系统存在一个严重问题—重复推荐,即推荐文章的内容与原文含有相同的信息,这样会增加用户的阅读负担。于是,本文提出了一种方法来解释推荐文章与原文本体之间的逻辑关系(包括一般化、特殊化和重复),以此降低重复内容的推荐,推荐出符合用户需求的文章。本文第一部分介绍了课题的研究背景、研究目的和意义,对文中涉及到的一些基本概念作了简单介绍。介绍了推荐系统的定义;四种主要方法,即基于内容的推荐、协同过滤推荐、混合型推荐和基于数据挖掘技术的推荐;针对四种方法,分别以一个系统实例解释其工作模式;对推荐系统的评测标准进行了汇总。还介绍了社会化媒体的概念以及与传统媒体相比,其具有的一些特点。最后,总结了本文的主要工作和贡献如下:(1)本研究是在国内外率先结合用户评论来协助信息推荐服务的研究,为基于社会化媒体的信息推荐研究提供一条崭新的研究思路,将信息推荐的研究从Web 1.0的传统静态媒体延伸到了Web 2.0的社会化媒体模式。(2)为了充分利用社会化媒体的用户交互体验特征,我们独创性地设计了一套基于图论的用户评论信息挖掘机制,可以准确地捕捉用户对事件的关注焦点,并将其与原文本体内容相结合,使得推荐的结果既反映了作者的观点,也反映了读者的观点。(3)为了减轻用户的认知负担,我们创新性地提出了一套基于信息熵理论来判断文本逻辑关系的机制。通过该机制,我们可以获得推荐文章与原文章的逻辑关系。此外,该研究成果可以广泛地应用到文本分析的内容逻辑判断中。例如,搜索引擎的结果呈现,基于内容的广告设置等。本文第二部分介绍了该课题的研究基础与背景。首先,针对本文的实验对象,即新闻和博客,对已有的相关研究工作进行了总结。新闻推荐从现有的商业新闻推荐系统和学术研究两个方面进行了介绍。接着,针对文中存在的主题漂移问题,对主题检测与跟踪技术的研究发展进行了汇总。最后,对本文将涉及到的相关理论知识作了简要介绍,如语言模型,PageRank算法、信息熵、T检验等。本文第三部分是核心部分,介绍了自适应信息推荐机制的设计。首先,展示了总体系统框架图,并对其运作流程进行简单介绍。然后,针对框架中的各个模块进行详细阐述。通过用户间关系建模计算用户权威,这里的关系包括了引用关系与回复关系。在整个社区中,根据一个用户对另一个用户的信息进行引用或者回复来构建图模型,然后利用PageRank算法计算每个用户的权威。接着,计算评论权重。这里,我们同样利用了图模型,不同的是,现在的模型是建立在用户评论之间的关系上,这里的关系包括了语义、引用和回复关系。语义关系指的是两条评论之间的内容相似性,引用或回复关系指的是一条评论对另一条评论的信息引用或者回复。模型构建好后,也利用PageRank算法得出评论的权重。一条评论质量的好坏,由其作者的权威和评论本身共同决定,因此,我们将用户权威和评论权重结合起来,计算出每条评论的最终权重。其次,将这些权重信息和原文本体、用户评论一起输入到合成器中,构建主题模型。利用该主题模型从数据库中检索出相关文章。最后,根据信息熵理论来解释相关文章与原文本体之间的逻辑关系,返回符合用户兴趣的文章。本文第四部分是实验设计与分析。介绍了系统开发环境、实验数据的获取以及详细信息。实验数据包括两部分:一个是新闻数据集,一个是博客数据集。由于我们获取的是整个网页数据,所以需要对网页进行解析,抽取出所需部分。还介绍了评测标准的选取,为了评测目的,我们除了选用一些常用的指标,还引入了一个新的评测指标—新颖度,来度量返回文章的主题多样性。接着,设计了一系列实验:1)将本文提出的方法与两种常用方法进行比较,结果表明,在新闻和博客数据集上,我们的方法都明显优于其它两种;2)分析了用户权威和评论对推荐效果的影响,实验结果表明结合用户权威和评论信息有利于提高推荐效果;3)分析了评论间关系对推荐效果的影响,实验结果显示,针对不同的文本形式,有不同的推荐效果。对于新闻数据,结合用户评论间的内容关系会导致推荐效果的降低;然而,对于博客数据,结合用户评论间的内容关系有助于推荐效果的提高;4)对推荐关系解释进行了评估。本文的最后一部分是对本文研究工作的总结和未来研究工作的展望。总结了本文研究的基于社会化媒体的自适应信息推荐系统的整体设计;针对本文的研究工作,指出了其存在的一些不足之处,并给出了以后的发展方向。

全文目录


摘要  4-8
Abstract  8-14
1. 绪论  14-28
  1.1 研究背景  14-15
  1.2 研究目的及意义  15-17
    1.2.1 研究目的  15-16
    1.2.2 研究意义  16-17
  1.3 相关知识介绍  17-26
    1.3.1 推荐系统  17-25
    1.3.2 社会化媒体  25-26
    1.3.3 其他知识  26
  1.4 本文主要工作和贡献  26-27
  1.5 论文组织结构  27-28
2. 研究基础与背景  28-41
  2.1 新闻与博客推荐  28-31
    2.1.1 新闻推荐  28-30
    2.1.2 博客推荐  30-31
    2.1.3 当前研究存在的问题  31
  2.2 主题检测与跟踪  31-33
  2.3 语言模型  33-36
    2.3.1 n-gram模型  34-35
    2.3.2 数据平滑技术  35-36
  2.4 向量空间模型  36-37
  2.5 信息熵  37-38
  2.6 图论  38-39
  2.7 PAGERANK  39
  2.8 T检验  39-40
  2.9 本章小结  40-41
3. 信息推荐机制设计  41-49
  3.1 评论结合  42-44
    3.1.1 用户权威得分  42-43
    3.1.2 评论得分  43-44
  3.2 主题模型构建  44-46
  3.3 推荐关系的解释  46-47
  3.4 本章小结  47-49
4. 实验设计与分析  49-56
  4.1 开发环境  49
  4.2 实验数据  49-50
  4.3 评测标准  50-51
  4.4 总体效果比较  51-52
  4.5 参数的设置  52
  4.6 用户权威与评论的影响分析  52-53
  4.7 评论间关系的影响分析  53-55
  4.8 推荐关系解释  55
  4.9 本章小结  55-56
5. 总结与展望  56-58
  5.1 研究工作总结  56-57
  5.2 未来的研究内容展望  57-58
参考文献  58-64
后记  64-66
致谢  66-68
攻读学位期间的科研成果目录  68-69

相似论文

  1. 基于自然遗忘的个性化推荐算法研究,TP311.52
  2. Web挖掘技术在电子商务推荐系统中的研究与应用,TP391.3
  3. 社会化网络中的推荐算法及其应用,TP391.3
  4. 个性化医疗信息推荐系统的研究与实现,R319
  5. 基于GPU的图书推荐系统研究与实现,TP391.3
  6. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
  7. 基于社会标签系统的推荐技术研究,TP391.3
  8. 基于特征向量的个性化推荐算法研究,TP391.3
  9. Agent电子商务推荐系统下协同过滤技术研究,F713.36
  10. 基于协同过滤的主动推荐系统关键技术研究,TP311.52
  11. 基于协同过滤的电子商务个性化推荐算法研究,F713.36
  12. 基于Web数据挖掘的智能推荐研究,TP391.3
  13. 联想公司社会化CRM体系优化策略,F626
  14. 网络推荐系统的营销研究,F49
  15. 基于协同过滤算法的个性化推荐系统的研究,TP393.09
  16. 基于协同过滤推荐算法电影网站的构建,TP393.092
  17. 源代码专家推荐系统设计与实现,TP311.52
  18. E-Learning个性化推荐系统研究,TP319
  19. 主谓关系识别与主题相关性计算技术研究,TP391.1
  20. 协同过滤优化算法的研究与实现,TP301.6
  21. 混合EPG推荐系统中解析器的设计与实现,TN949.292

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com