学位论文 > 优秀研究生学位论文题录展示
微博媒体的信息传播分析
作 者: 王亮
导 师: 王宇颖
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 新浪微博 爬虫 信息传播树 事件分析 舆情分析
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 0次
引 用: 2次
阅 读: 论文下载
内容摘要
微博,也可称为微博客(Micro,Blog),是一种新型媒体平台。用户可以在这个新型媒体平台上产生信息、传播信息以及获取信息。微博媒体的内在结构是一个以用户为节点,用户之间的关系为边的一个社会网络。当新的信息产生之后,其余用户的转发就会造成信息在该社会网络上的流动,也可以称为信息在该社会网络上传播。对微博媒体中的信息传播的研究包括展现完整的传播路径,传播范围和速度分析,关键节点分析等。这些研究也可以指导实际应用,例如:微博营销、谣言控制、广告投放、舆情分析等。所以对于微博社会媒体中信息传播进行研究具有重大意义。本文的主要任务是站在舆情分析的角度对新浪微博媒体中的信息传播进行分析,同时给出了一个新浪微博舆情分析系统。本文的研究包括:数据获取、信息传播分析、微博舆情分析。本文工作如下:首先是新浪微博数据获取。在该部分,主要简单介绍新浪微博数据结构以及目前比较流行的获取新浪微博数据的两种方法:利用新浪开放平台提供的API和利用新浪微博网页爬虫。并分析两种方法各自优势。其次是新浪微博信息传播分析。在该部分,主要重点介绍信息传播树的概念,以及在新浪微博媒体中信息传播树的生成算法。并以信息传播树为基础,介绍结构分析、内容分析、人群分析的概念。最后是信息传播在舆情分析中的应用,主要包括两个部分:新浪微博数据爬虫和新浪微博信息传播分析与事件统计分析。在数据爬虫部分将会介绍利用新浪微博开放平台提供的API设计的全网爬虫。在新浪微博信息传播分析与事件统计部分将会把对信息传播树的各项分析结果可视化给用户。
|
全文目录
摘要 4-5 Abstract 5-6 目录 6-8 第1章 绪论 8-17 1.1 课题的研究背景 8-10 1.2 WEB2.0 信息传播和舆情分析介绍 10-11 1.2.1 Web2.0 信息传播介绍 10 1.2.2 Web2.0 舆情分析介绍 10-11 1.3 WEB2.0 信息传播与舆情分析技术研究现状 11-13 1.3.1 国内外对 Web2.0 信息传播技术的研究 11-13 1.3.2 国内外对 Web2.0 舆情分析技术的研究 13 1.4 课题研究内容及意义 13-15 1.5 内容组织结构 15-17 第2章 新浪微博数据获取研究 17-31 2.1 新浪微博媒体的数据介绍 17-18 2.2 新浪微博媒体的数据获取过程 18-20 2.2.1 用户信息数据获取 19-20 2.2.2 微博信息数据获取 20 2.3 新浪微博媒体的数据获取方式 20-24 2.3.1 利用新浪微博 API 获得数据 20-22 2.3.2 利用新浪微博网页爬虫获取数据 22-24 2.3.3 新浪微博 API 与网页爬虫的比较 24 2.4 数据去重策略 24-26 2.5 爬虫爬行策略及算法 26-28 2.5.1 爬行策略 26-28 2.5.2 爬行算法 28 2.5.3 API 限制解决方案 28 2.6 实验结果与分析 28-30 2.7 本章小结 30-31 第3章 新浪微博媒体中的信息传播分析 31-46 3.1 信息传播树介绍及生成 31-34 3.1.1 信息传播树介绍 31 3.1.2 新浪微博信息传播树生成 31-34 3.2 信息传播树结构分析 34-39 3.2.1 信息传播树关键节点分析 35-37 3.2.2 信息传播树范围速度分析 37-38 3.2.3 信息传播树路径还原分析 38-39 3.3 信息传播树内容分析 39-40 3.3.1 信息传播树表征方式 39-40 3.3.2 信息传播树内容重构 40 3.4 信息传播树人群分析 40-41 3.4.1 人物贡献度排名 41 3.4.2 人物活跃度排名 41 3.4.3 人群网络分析 41 3.5 实验结果与分析 41-44 3.5.1 单棵传播树统计分析 41-42 3.5.2 多棵传播树统计分析 42-44 3.6 本章小结 44-46 第4章 信息传播在舆情分析中的应用 46-59 4.1 WEB2.0 舆情分析的介绍 46-48 4.1.1 Web2.0 舆情分析技术介绍 46-47 4.1.2 新浪微博舆情分析介绍 47-48 4.2 新浪微博数据爬虫 48-51 4.2.1 全网人物爬虫 48-49 4.2.2 特定人群网络更新 49-50 4.2.3 微博信息数据爬虫 50-51 4.3 新浪微博信息传播分析与事件统计分析 51-56 4.3.1 微博事件分析 51-54 4.3.2 微博事件统计分析 54-56 4.4 新浪微博舆情分析系统效率 56-58 4.5 本章小结 58-59 结论 59-61 参考文献 61-66 致谢 66
|
相似论文
- 风险视角下新浪微博融资行为研究,F49
- 基于比对技术的非法网站探测系统的实现与研究,TP393.08
- 基于SVM分类算法的主题爬虫研究,TP391.3
- 基于Lucene的网络文学垂直搜索引擎的研究与实现,TP391.3
- 基于语义网络的智能搜索引擎研究,TP391.3
- 基于聚焦爬虫技术的教学资源搜集与自动整理方法研究,TP301.6
- 基于Deep Web的图书信息集成与查询系统,TP311.52
- Web挂马检测系统的设计与实现,TP393.08
- 基于聚焦爬虫的网上药品信息监测系统,TP393.09
- 基于云计算的Web教育爬虫,TP391.3
- 垂直搜索引擎关键技术的研究与实现,TP311.52
- 基于舆情分析研判的突发事件预警平台的设计与实现,TP311.52
- 基于人工生命的蜂群行为的仿真与研究,TP391.3
- 面向汽车行业的主题爬虫研究与实现,TP391.3
- 多源媒体数据聚合与传输加速系统,TP393.09
- 基于观点挖掘的产品可用性建模与评价,F274
- 基于网页分块的主题爬虫方法研究,TP391.3
- 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
- 面向教育新闻的主题爬虫设计与实现,TP391.3
- 基于Nutch的企业搜索引擎的研究与实现,TP391.3
- 数据库全文检索方法研究及其应用,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|