学位论文 > 优秀研究生学位论文题录展示

基于本体的微博话题发现与倾向性分析研究

作 者: 王娟
导 师: 王晓东
学 校: 河南师范大学
专 业: 计算机应用技术
关键词: 情感本体 微博语料获取 话题发现 话题倾向性分析 舆情分析
分类号: TP393.092
类 型: 硕士论文
年 份: 2013年
下 载: 40次
引 用: 0次
阅 读: 论文下载
 

内容摘要


微博简短写作,便捷发布,实时交互的特点吸引了越来越多的人在微博上实时更新消息,交流观点,微博平台的规模迅速发展起来,其提供的功能服务越来越丰富。庞大的微博信息看似杂乱无章,没有规则,实则包含了众多话题,从海量的微博信息中找出热点话题,并对其进行情感分析逐渐成为一个新的微博应用领域。本文针对中文微博做话题发现与倾向性分析研究。首先分析国内外微博话题发现和倾向性分析方面的最新研究方法和成果,设计出一个微博话题发现算法;然后,依据情感词本体、规则集和微博表情符号,对发现出来的话题进行情感分析,从而获得指定话题的情感倾向。最后,以2013年1月15日到2013年2月5日20天内的新浪微博数据为基础,初步实现了一个微博话题情感分析原型系统。本文的主要工作如下:(1)情感词汇本体构建:研究了情感词获取方法,一方面整理和总结了当前已有情感词汇资源,构建基础情感词本体,另一方面搜集网络情感用语和一些兼类词扩充基础情感词本体。(2)微博话题发现:首先对具有相同主题的原创微博、转发微博、评论微博进行合并,生成单微博树,形成一个长文本,以3-Gram模型表示该长文本;然后对具有高相似度的多个单微博树进行合并,形成一棵多微博树,再对每棵多微博树进行话题抽取形成微博话题;最后计算出每个话题的热度,并依据话题热度,对其进行排序。(3)微博话题情感倾向分析:根据语言学的知识,分析句子的上下文语义关系,建立规则集,用3-POS模式表示文档;然后,依据情感词汇本体、微博表情符号与规则集,抽取出主观性3-POS模式,并对其进行倾向性计算,设计微博话题倾向性计算算法。(4)微博话题发现与倾向性分析应用研究:以2013年1月15日到2013年2月5日20天内的新浪微博数据为基础,设计并实现一个微博话题发现与倾向性分析原型系统,初步展示了其使用价值。

全文目录


相似论文

  1. 教育新闻热点话题发现系统的设计与实现,TP391.1
  2. 基于话题的多文档文摘技术研究,TP391.1
  3. 网络舆情分析关键技术研究与实现,TP393.09
  4. 面向网络舆情监控的热点话题发现技术研究,TP393.09
  5. 高校校园网论坛热点话题发现系统的研究与实现,TP393.18
  6. 基于互联网数据的话题发现及追踪技术研究与实现,TP391.3
  7. Web社区中话题的发现与排序,O226
  8. 网络舆情发现与角色分析研究,F49;G206
  9. 武警部队舆情监测系统设计和实现,TP393.09
  10. 网络舆情监测系统研究与开发,TP393.09
  11. 微博客热点话题发现策略研究,TP393.092
  12. BBS热点话题发现与监控系统,TP393.094
  13. 基于博客的网络话题发现及追踪的研究,TP391.1
  14. 基于Web搜索的舆情分析系统的设计与实现,TP393.09
  15. 热点事件发现及事件内容特征自动抽取研究,TP391.1
  16. WEB舆情观点挖掘关键技术研究,TP311.13
  17. 互联网舆情分析关键技术的研究与实现,TP393.09
  18. 网络热点话题自动发现技术研究,TP391.1
  19. 新闻话题表示模型和关联追踪技术研究,TP391.1
  20. 食品安全话题发现与跟踪研究,TS201.6
  21. 话题跟踪和可视化技术在涉农网络舆情系统中的应用研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com