学位论文 > 优秀研究生学位论文题录展示
问答社区中的问题与答案推荐机制研究与实现
作 者: 曲明成
导 师: 卜佳俊;王灿
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 问答社区 问题推荐 答案推荐 主题建模 链接分析
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 189次
引 用: 1次
阅 读: 论文下载
内容摘要
如今,用户交互式问答社区已成为网上信息获取和知识分享的重要媒介。诸如Yahoo! Answers、百度知道等问答社区网站每天发布有数以万计的问题。然而,随着问答社区数据量的增长,用户需要花更多的时间找到自己感兴趣的问题。由此,问题的提问者需要等待较长的时间才能得到该问题的答案。同时,问题候选答案数目的迅速增长、答案质量的层次不齐,也加重了提问用户选择最佳答案的负担。本文针对问答社区中的问题推荐和答案推荐机制进行了深入的研究,旨在帮助提问用户和回答用户获取信息,从而增进问答社区中的知识分享行为。问题推荐将待解决问题推荐给对该问题感兴趣的用户,使该问题能尽快得到解答。本文认为,用户将根据自己的兴趣主题选择相应的问题进行回答,故问题的主题与回答用户的兴趣需有较高的相关度。基于此,本文提出了一种基于主题建模思想的问题推荐方法,充分利用问答社区中丰富的用户个性化信息,以概率潜在语义分析模型来表达问答社区中的用户兴趣分布,并以此计算问题推荐列表。答案推荐针对问题的候选答案作自动排序,从而使提问用户能更方便地选择最佳答案。本文认为,提问用户将根据答案质量及其与问题的相关程度选择最佳答案。由此本文提出了一种基于问题与答案间的相似性及用户权威度的答案推荐方法。该方法通过用户问答关系构建用户链接图,以此使用PageRank算法估计用户权威度。在计算相似度时,综合考虑了问题和答案内容的相似度以及提问用户与回答用户的相似度。实验结果表明,本文提出的基于主题建模的问题推荐方法可有效挖掘用户兴趣,从而推荐待解决问题。答案推荐的实验结果则证明综合考虑问题和答案内容的相似度以及提问用户与回答用户相似度的有效性,及通过用户权威度衡量答案质量的可行性。
|
全文目录
摘要 3-4 Abstract 4-9 第1章 绪论 9-16 1.1 引言 9 1.2 问答社区发展现状 9-14 1.2.1 社交网络 9-10 1.2.2 社交网络服务 10-12 1.2.3 问答社区 12-14 1.3 本文工作 14-15 1.4 本文组织 15 1.5 本章小结 15-16 第2章 问答社区关键技术综述 16-35 2.1 问答社区相关研究工作 16-18 2.2 主题建模技术综述 18-30 2.2.1 潜在语义分析 19-22 2.2.2 一元混合模型 22-24 2.2.3 概率潜在语义分析 24-26 2.2.4 期望最大化 26-30 2.3 链接分析技术综述 30-34 2.3.1 HITS算法 30-32 2.3.2 PageRank算法 32-34 2.4 本章小结 34-35 第3章 基于主题建模的问题推荐算法 35-46 3.1 问题推荐定义 36-37 3.2 问题推荐总体设计 37-38 3.3 用户兴趣建模 38-44 3.3.1 模型构建 39-41 3.3.2 参数估计 41-44 3.4 相似度计算 44 3.5 本章小结 44-46 第4章 基于链接分析的答案推荐算法 46-57 4.1 答案推荐定义 46-47 4.2 答案推荐总体设计 47-49 4.3 用户权威度建模 49-54 4.3.1 链接结构构建 49-51 4.3.2 权威度评估 51-54 4.4 相似度计算 54-56 4.5 本章小结 56-57 第5章 系统设计与实现 57-74 5.1 总体设计 57-58 5.2 网页获取 58-61 5.2.1 数据源 58-59 5.2.2 网页获取实现 59-61 5.3 网页内容抽取 61-62 5.4 用户信息提取 62-63 5.5 界面展示 63-65 5.6 问题推荐结果及讨论 65-67 5.7 答案推荐结果及讨论 67-72 5.8 本章小结 72-74 第6章 总结与展望 74-76 6.1 总结 74-75 6.2 下一步工作 75-76 参考文献 76-80 攻读硕士学位期间主要的研究成果 80-81 致谢 81-82 作者简历 82
|
相似论文
- 结合用户及地理信息的图像主题建模,TP391.41
- 基于链接结构分析的Web页面排序算法,TP393.092
- 基于网络计量的211高校图书馆网站链接及流量分析研究,G250.7
- 金融领域的博客信息采集与排序算法研究,TP393.092
- 万维网的小世界效应探讨,O157.5
- 基于网页分块的Web社区识别,TP393.092
- 面向问答社区的相关信息推荐技术研究,TP391.3
- 基于问答社区的问题相关性及答案排序研究,TP391.3
- 基于链接分析的高校数字图书馆评价体系研究,G250.76
- 我国“985工程”高校研究生院网站影响力评价研究,G643
- 中文问答社区信息传播机制研究,G206
- 基于移动搜索的Spider爬行策略的研究和实现,TP391.3
- 中国省级政府网站的链接分析,D625
- 基于概念背景图的主题爬行策略研究,TP393.092
- 互动问答系统中问题回答者推荐研究,TP393.092
- 基于链接分析的网页排序作弊检测方法研究,TP393.092
- 融入语义相似度的HITS算法研究及实现,TP391.1
- 基于转移概率的PageRank算法研究,O211.62
- 基于语义的web数据挖掘在在线阅读网站应用的研究,TP393.092
- Web结构挖掘中PageRank算法研究,TP311.13
- 基于网络研判的高校群体突发事件预警平台的研究,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|