学位论文 > 优秀研究生学位论文题录展示
网络舆情热点信息发现及其倾向性研究
作 者: 李海林
导 师: 聂规划
学 校: 武汉理工大学
专 业: 国际贸易学
关键词: 网络舆情 热点信息 极性词 文本特征
分类号: F49
类 型: 硕士论文
年 份: 2010年
下 载: 268次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息技术的发展和互联网的日益普及,网络已经成为广大民众获取信息的主要渠道,同时网络也成为人们发表评论、表达民意的重要平台。面对互联网上飞速增长的新闻话题以及人们的评论信息,如何从海量信息中采集到满足特定需求的信息,如何将互联网信息组织整理成有效的机器数据,如何从采集到的数据中区分有用信息和无用信息等等这些问题都是信息科技发展所面临的难题。网络舆情是指民众通过互联网对政府管理以及现实社会中各种现象、问题所表达的政治信念、态度、意见和情绪的总和。网络舆情与社会舆情相互作用、相互影响。两者不仅在内容表现形态方面具有一致性,同时网络舆情在一定程度上会影响社会舆情的发展趋势,对社会影响巨大。因此,政府部门对网络舆情信息必须具备一定的监控能力,能够及时掌握一定时期内民众所关注的热点问题,了解民众对热点事件的看法和态度,从而做出正确的决策,主动引导舆论走向。本文在分析网络舆情热点信息发现和网络舆情热点信息倾向性研究现状的基础上,从舆情信息的来源入手,设计了详细的采集流程。针对大众和政府部门都比较关注的热点信息,本文根据热点信息的概念和特征建立了热点信息的判断标准,并将热点信息的特征定量化,构建数学模型,用算法来描述热点信息的发现和获取。针对热点信息的倾向性分析,本文首先手工构建了极性词典,并对极性词典进行了扩充和修正,将未登录词汇、否定词和强调副词对原始极性词的影响做了进一步分析,并提出相应的解决办法。对于普通的文本信息,用向量来进行表示,通过计算特征词的权重来选取文本的特征词条。由于中文句子以标点符号进行划分,本文对句子进行句法分析,解析出词语之间的依存关系,并对词语进行词性标注。本文建立了语义模板,通过语义模板的匹配来确定句子的语义模式,利用极性词典计算出词语的极性值,再结合句法分析和模式匹配得出其上下文极性。句子的倾向性由组成句子的主题词和极性词及其极性值决定,文本的倾向性由句子的倾向性和句子在整个文本中的权重计算得出。最后,本文对所做的研究工作进行了模拟实验,对实验结果进行了讨论与分析。
|
全文目录
摘要 4-5 Abstract 5-9 第1章 绪论 9-17 1.1 研究目的及意义 9-10 1.2 国内外研究现状 10-16 1.2.1 舆情基本理论 11-12 1.2.2 网络舆情热点信息发现研究现状 12-14 1.2.3 网络舆情热点信息倾向性研究现状 14-16 1.3 研究内容和组织结构 16-17 第2章 网络舆情热点信息发现研究 17-26 2.1 网络舆情信息的采集 17-20 2.1.1 信息来源 17-18 2.1.2 采集方式 18-20 2.2 网络舆情热点信息判断标准的建立 20-22 2.2.1 热点信息的概念和特征 20-21 2.2.2 热点信息的判断标准 21-22 2.3 网络舆情热点信息发现算法的设计 22-26 2.3.1 热点信息特征项的定量化 22-23 2.3.2 热点信息发现算法分析 23-24 2.3.4 热点信息的获取 24-26 第3章 网络舆情热点信息倾向性分析 26-39 3.1 网络舆情倾向性分析的思路和方法 26-27 3.2 极性词典的构建 27-31 3.2.1 极性词典的初始构建 28-29 3.2.2 极性词典的扩充和修正 29-31 3.3 网络舆情热点信息的文本表示 31-33 3.3.1 文本特征表示 31-32 3.3.2 文本特征词条选取和权重设置 32-33 3.4 网络舆情倾向性分类算法分析 33-39 3.4.1 舆情文本信息的浅层句法分析 33-36 3.4.2 语义模板的建立 36 3.4.3 文本倾向分类的算法设计 36-39 第4章 实验与结果分析 39-43 4.1 网络舆情热点信息发现实验 39-40 4.2 网络舆情倾向性分析实验 40-43 4.2.1 中文分词 40 4.2.2 句法分析 40-42 4.2.3 网络舆情倾向性判断 42-43 第5章 总结与展望 43-45 5.1 全文总结 43-44 5.1.1 全文主要内容 43 5.1.2 主要创新点 43-44 5.2 研究展望 44-45 参考文献 45-48 在读期间的科研成果 48-49 致谢 49
|
相似论文
- 中国区域性网上社区的舆情研究,G206
- 教育新闻热点话题发现系统的设计与实现,TP391.1
- 基于网络舆情的企业危机管理研究,G206
- 网络舆情热点事件中的网民行为研究,G206
- 网络舆情主体特征及其成因分析,G206
- 虚拟世界的意见集合,G206
- 负面网络舆情及其治理研究,G206
- 互联网舆情信息挖掘与群体行为分析,F49
- 中文网页热门主题获取系统的研究与实现,TP393.092
- 基于BP神经网络的网络舆情危机预警研究,F224
- 基于网络评论的文本倾向性分类技术的研究与实现,TP311.52
- 基于不平衡数据集的文本分类技术,TP391.1
- 网络舆情模型构建与网民分析,G206
- 网络发言人的现状及未来发展,G206
- 当代中国网络舆情与地方政府对策研究,G206
- 当前网络舆情与公共政策过程研究,G206
- 群体智能涌现在网络舆情预测中的应用,TP393.09
- 图书领域消费者在线评论的有用性影响因素研究,F724.6
- 基于共现链的微博情感分析技术的研究与实现,TP393.092
- 网络舆情分析关键技术的研究与实现,TP393.09
中图分类: > 经济 > 信息产业经济(总论)
© 2012 www.xueweilunwen.com
|