学位论文 > 优秀研究生学位论文题录展示
基于微博客的网络社群构建及意见领袖挖掘技术的研究与实现
作 者: 景姗
导 师: 王大玲
学 校: 东北大学
专 业: 计算机技术
关键词: 微博客 网络社群 意见领袖 微博客分类
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 13次
引 用: 0次
阅 读: 论文下载
内容摘要
微博客作为一种新的舆论载体和传播途径,在网络舆情信息发起和传播中起着越来越重要的作用,其影响已经达到其他舆论载体不能替代的地位。微博客与传统的博客、论坛和商品评论等载体相比,有许多新的特点,其中最突出的三个特点为:无障碍、短消息和实时性。基于这些特点,对微博客进行网络社群的构建以及意见领袖的挖掘是很有必要的。本文主要研究工作分为两部分:基于用户标签的网络社群构建及意见领袖的挖掘和基于LDA的话题讨论网络社群构建及意见领袖的挖掘。针对意见领袖的挖掘,提出了两个微博客意见领袖衡量模型:微博客用户意见领袖衡量模型及微博客话题讨论中微博意见领袖衡量模型。第一部分利用微博客用户标签对微博客用户进行网络社群构建,同一社群中的微博客用户含有相似标签,表明具有相似的兴趣度、身份等。微博客用户意见领袖衡量模型从群众关注度、自身活跃度及自身价值度三个方面综合衡量了微博客用户的影响力,最后根据层次分析法对多个因素进行科学地权值分配。第二部分利用微博数据对同一话题的阐述侧重点不同进行网络社群的构建,同一社群中的微博客数据对话题阐述的侧重点相同。利用微博客分类构建网络社群,提出利用LDA语义信息,基于类别特征词的微博客分类算法,并将其与现有的基于支持向量机的分类算法进行比较。话题讨论中微博意见领袖衡量模型从显式影响力、隐式影响力及用户影响力三个方面综合考虑了微博的影响力,最后根据层次分析法对多个因素进行科学地权值分配。实验表明,本文提出的两个意见领袖衡量模型对微博客意见领袖的挖掘是有效的。同时,针对本文的微博客分类需求,本文提出的基于类别特征词的方法较基于支持向量机的方法具有更好的效果,而对于垃圾数据的清除,基于支持向量机的分类方法则有更好的效果。
|
全文目录
摘要 5-6 Abstract 6-10 第1章 绪论 10-18 1.1 微博客的特点与研究意义 10-11 1.2 微博客意见领袖的特点及研究意义 11-12 1.3 国内外研究现状 12-14 1.3.1 微博客社群构建研究现状 12-13 1.3.2 微博客意见领袖研究现状 13-14 1.3.3 短文本分类研究现状 14 1.4 问题提出 14-15 1.5 本文的主要工作及组织结构 15-18 1.5.1 本文的主要工作 15-16 1.5.2 本文的组织结构 16-18 第2章 相关理论及技术 18-28 2.1 文本预处理 18-21 2.1.1 数据下载 18-19 2.1.2 微博噪音去除 19-21 2.1.3 中文分词 21 2.2 层次分析法 21-22 2.2.1 层次分析法简介 21-22 2.2.2 层次分析法工作原理 22 2.3 汉语词语相似度计算方法 22-24 2.3.1 基于语义词典的汉语词语相似度计算 23 2.3.2 基于统计的汉语词语相似度计算 23-24 2.4 文本分类 24-26 2.4.1 文本分类概述 24-25 2.4.2 分类效果评价 25-26 2.5 本章小结 26-28 第3章 基于新浪微博客开放平台的数据下载 28-34 3.1 新浪微博客开放平台简介 28-29 3.2 新浪微博客数据下载 29-31 3.2.1 开放平台授权机制简介 29-30 3.2.2 开放平台主要API介绍 30-31 3.3 本文主要微博客数据下载 31-33 3.3.1 用户微博客数据下载 32 3.3.2 话题微博客数据下载 32-33 3.4 本章小结 33-34 第4章 基于微博客标签的网络社群构建及意见领袖挖掘 34-48 4.1 基于标签的网络社群建模 34-37 4.1.1 社群构建 35-36 4.1.2 数据获取 36-37 4.2 微博客用户意见领袖衡量模型 37-47 4.2.1 模型提出 38 4.2.2 模型分析 38-42 4.2.3 基于层次分析法的指标定量化 42-47 4.3 本章小结 47-48 第5章 基于LDA的话题讨论社群构建及意见领袖挖掘 48-70 5.1 LDA模型描述 48-50 5.2 基于LDA的话题讨论社群构建及意见领袖挖掘框架 50-53 5.3 基于LDA的话题讨论社群构建的具体阐述 53-62 5.3.1 针对话题讨论的数据获取 53-55 5.3.2 基于类别特征词的微博客分类算法描述 55-59 5.3.3 基于支持向量机的微博客分类算法描述 59-62 5.4 话题讨论微博意见领袖衡量模型 62-67 5.4.1 模型提出 63-64 5.4.2 模型分析 64-66 5.4.3 基于层次分析法的指标定量化 66-67 5.5 本章小结 67-70 第6章 实验结果及分析 70-80 6.1 实验语料与实验环境 70-71 6.1.1 实验语料 70-71 6.1.2 实验环境 71 6.2 实验设计与分析 71-79 6.2.1 微博客用户意见领袖衡量模型结果分析 71-73 6.2.2 基于LDA的微博客分类算法比较 73-78 6.2.3 话题讨论微博意见领袖衡量模型结果分析 78-79 6.3 本章小结 79-80 第7章 结论及未来工作 80-82 7.1 总结 80-81 7.2 进一步工作 81-82 参考文献 82-84 致谢 84-86 攻硕期间参与项目及发表的论文 86
|
相似论文
- 意见领袖与乡村和谐社会构建,G206
- 网络传播中的精英现象探究,G206
- 基于社会网络分析法的大学生网络意见领袖研究,G206
- 网络舆论监督中的意见领袖分析,G206
- 论微博客中的网络公众聚集现象,G206
- 基于系统动力学的网络舆情应对问题分析,G206
- 网络政治动员中意见领袖的行为分析及规制,G206
- 基于微博客的社区挖掘研究,TP393.092
- 基于网络舆情的企业危机管理研究,G206
- BBS中组织拓扑结构研究和意见领袖识别,TP393.094
- 基于符号网络的社群分析方法研究,TP393.0
- 微博客的虚拟社群及其“人际化”传播分析,G206
- 微博客的传播特征及社会影响分析,G206
- 中国微博客的发展困境和策略研究,G206
- 基于微内容的新闻开发研究,G206
- 微博客营销信息的在线评论与转发对消费者态度的影响,F274;F224
- 人格特质、社群承诺和品牌认同的关系研究,F224
- 微博客话题追踪及实时检索的相关研究,TP393.092
- 软件外包企业知识管理体系的设计与实现,TP311.52
- 微博客的传播学解读,G206
- Web2.0营销传播中意见领袖形成的社会心理归因分析,G206
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|