学位论文 > 优秀研究生学位论文题录展示

基于主题相关性的社交问答系统个性化专家排序算法的研究

作 者: 杨斯崑
导 师: 王移芝
学 校: 北京交通大学
专 业: 计算机科学与技术
关键词: 社交问答系统 主题相关性 标注信息 同质性 专家排序
分类号: TP391.3
类 型: 硕士论文
年 份: 2014年
下 载: 28次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着在线社交网络的逐渐兴起,越来越多的互联网用户开始广泛通过在线社交网络发布信息、传递资源和维护各种社会关系。由于在线社交网络的参与群体和内容形式的多样性,网络资源与信息的主要发布者已经从传统的门户网站逐渐发展到社交网络中无处不在的网络用户。以社交网络用户为主体的文本、图像、影音频等各种网络资源迅速涌现在网络之上,构成了大数据时代不可忽视的重要资源。因此,如何从海量的社交网络数据与资源中快速准确地检索到用户需要的内容或资源成为一个亟待解决的问题。无论是在以内容为中心的多媒体网络中还是在以人为中心的社交网络中,搜索引擎一直是社交网络用户用于发现权威信息的主要源泉。许多相关研究已经证实了基于图结构的排序算法有助于通过社交网络中用户的链接关系传递权值发现权威信息,进而通过提升社交网络中专家用户的排序并降低垃圾信息用户的排序以实现信息检索的目的。尽管如此,现有的工作很少关注通过挖掘不同用户之间的主题相关性,进而设计以人为中心的基于主题相关性的个性化专家排序算法。在本文的研究工作中,本文通过研究社交问答网络中的用户标签信息所反映的用户主题兴趣分布,实验验证了用户主题兴趣中的同质性规律,即有相同或相似兴趣爱好的社交网络用户之间产生共同评论或共同关注同一话题的概率随着他们的兴趣相似程度的提高而相应提高。基于此,本文提出了以人为中心的基于主题相关性的个性化专家排序算法,同时考虑用户的权威性和主题相关性用于计算社交网络用户的专家排序。为了验证基于主题相关性的个性化专家排序算法的可行性与算法性能,本文以在线社交问答网络AskMefi的数据为主要研究对象进行了实验。实验结果表明,以真实社交问答系统中用户的专家评判标准作为算法评价依据,本文提出的个性化专家排序算法明显优于其他经典的非个性化专家排序算法。

全文目录


致谢  5-6
摘要  6-7
ABSTRACT  7-10
1 引言  10-16
  1.1 研究背景与研究意义  10-11
  1.2 国内外研究现状  11-13
    1.2.1 链接分析技术研究  11-12
    1.2.2 用户行为模式研究  12-13
    1.2.3 用户产生内容质量的评价和专家用户发现研究  13
  1.3 本文的研究内容和创新点  13-14
  1.4 论文的组织结构  14-16
2 社交问答系统的概念及其构成  16-21
  2.1 社交问答系统的组成结构  16-17
  2.2 社交问答系统的特点  17-18
    2.2.1 宽容度高  17-18
    2.2.2 流动性高  18
    2.2.3 知识聚集度高  18
  2.3 社交问答系统的表示方法  18-20
    2.3.1 基于图的表示方法  18-19
    2.3.2 基于矩阵的表示  19-20
  2.4 本章小结  20-21
3 主题模型的研究  21-32
  3.1 主题模型的概念  21-26
    3.1.1 概率图模型的基本概念  21
    3.1.2 隐语义索引模型(Latent Semantic Index)  21-22
    3.1.3 概率隐语义索引模型(probabilistic Latent Semantic Index)  22-24
    3.1.4 隐狄利克雷分配模型(Latent Dirichlet Allocation)  24-26
  3.2 基于LDA主题模型的用户兴趣主题分析  26-31
    3.2.1 实验与分析  27-29
    3.2.2 主题分布的同质性(Homophily)  29-31
  3.3 本章小结  31-32
4 面向社交问答系统的个性化专家排序算法研究  32-45
  4.1 经典专家排序算法  32-40
    4.1.1 PageRank算法  32-34
    4.1.2 主题敏感型PageRank算法  34-35
    4.1.3 Hill Top算法  35-37
    4.1.4 HITS算法  37-38
    4.1.5 SPEAR算法  38-40
  4.2 基于主题相关性的个性化专家排序算法  40-43
    4.2.1 专家排序算法的框架  40-41
    4.2.2 专家排序算法的设计  41-43
  4.3 本章小结  43-45
5 专家排序算法的评测与分析  45-58
  5.1 评测环境与结果  45-57
    5.1.1 实验环境与数据  45
    5.1.2 数据分析与处理  45-51
    5.1.3 实验结果与分析  51-57
  5.2 结论  57-58
6 总结与展望  58-60
  6.1 总结  58
  6.2 展望  58-60
参考文献  60-63
作者简历  63-65
学位论文数据集  65

相似论文

  1. 高师大学生生活现状与问题研究,G655.5
  2. 基于提供者角度的医疗卫生行业分类比较研究,R197.1
  3. 搜索引擎主题相关性研究,TP391.3
  4. 论书法与音乐的同质性,J292.1
  5. 基于链接分析的PageRank排序算法的改进研究,TP391.3
  6. 主谓关系识别与主题相关性计算技术研究,TP391.1
  7. 基于本体的金融年报语义网自动构建方法,TP391.1
  8. 企业白领女性社会支持网研究,C913.68
  9. 面向金融信息的主题爬虫研究与应用,TP393.092
  10. 中小企业融资效果的综合评价方法及其应用研究,F275
  11. 铁路客运服务质量评价系统研究,F531.6
  12. 数学教师教学工作的评价指标体系及其方法技术,G633.6
  13. 潘德列茨基早期作品中的复调技法,J614.2
  14. 高校社会资本经营规范与运行,G647
  15. 证券公司交易系统“同质性”故障的研究,TP311.52
  16. 基于电子地图模式的警务室管理平台的设计和实现,TP311.52
  17. 基于社会网络分析的Web社区发现,TP393.092
  18. 基于产品视角的多头忠诚研究-以女性爽肤水为例,F274
  19. 实体模型标注信息管理方法的研究,TH126
  20. 环境侵权损害同质赔偿原则的实证研究,D923
  21. 基于H.264的运动估计与帧间模式选择算法研究,TN919.81

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com