学位论文 > 优秀研究生学位论文题录展示
基于Web舆情的意见挖掘关键技术研究
作 者: 卫伟
导 师: 佘莉
学 校: 电子科技大学
专 业: 计算机软件与理论
关键词: Web舆情 网络舆情 意见挖掘 情感倾向 动态知识库
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 176次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,Web舆情频繁发生,特别是互联网上一些带有敏感内容的事件、国内外的重大事件,往往会在极短的时间内就引起全国网民的关注,形成Web舆情事件,严重威胁国家安全。在这些Web舆情事件中,网民所发表的意见对左右舆情的走向具有重要的作用,甚至被视为舆情的“核心”。因此,快速准确地了解网民意见对分析舆情发展态势、把握舆情走向有着非常重要的意义。但是,国内外现有的Web舆情预警系统并没有进行深入的意见挖掘,而只是强调了舆情事件的识别。本文在舆情理论分析的基础上,将意见挖掘技术运用到Web舆情预警系统中,以达到及时掌握网民意见、引导舆情走向的目的。意见挖掘就是利用自然语言处理技术自动地提取主观性文本中所包含的情感倾向以及评价对象。传统的意见挖掘是基于产品评论语料的,而Web舆情的语料则是新闻报道等以事实为主的客观性文本。因此,传统的意见挖掘并不能准确有效地发现Web舆情事件中网民所发表的意见。本文依据Web舆情语料的特点,提出了基于动态知识库的细颗粒度Web舆情意见挖掘方法,该方法不但能从整体上分析网民对一个Web舆情事件的情感倾向,而且可以有效地挖掘意见所评价的对象,即意见主题。在情感倾向分析方面,本文构造了一种结构新颖的情感词典,该词典考虑了词性对词语情感值的影响。同时,还提出了基于投票策略的情感倾向分析方法,该方法结合程度副词、否定词、以及标点符号的影响,可以更加准确地计算网民意见的情感倾向值。最后,本文将所提出的方法应用到Web舆情预警系统中,并取得了较好的结果,证明了本文所提出的方法的有效性。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 引言 9-14 1.1 研究背景 9 1.2 研究意义 9-10 1.3 国内外研究现状 10-12 1.4 本文的重点工作 12-13 1.5 论文的组织结构 13-14 第二章 Web 舆情挖掘与意见挖掘理论综述 14-26 2.1 Web 舆情理论模型 14-16 2.1.1 Web 舆情定义 14-15 2.1.2 Web 舆情特征 15 2.1.3 Web 舆情发展态势 15-16 2.2 数据挖掘技术 16-18 2.3 意见挖掘技术 18-25 2.3.1 意见持有者挖掘 20-21 2.3.2 意见主题挖掘 21-22 2.3.3 情感倾向分析 22-25 2.4 本章小结 25-26 第三章 Web 舆情意见挖掘 26-40 3.1 NTCIR 评测介绍 26-27 3.2 Web 舆情语料的特殊性研究 27-30 3.3 基于动态知识库的意见挖掘 30-39 3.3.1 算法流程 31-32 3.3.2 热点事件提取 32-33 3.3.3 关键句提取 33 3.3.4 动态知识库的构建 33-34 3.3.5 关键句聚类 34-37 3.3.6 实验分析 37-39 3.4 本章小结 39-40 第四章 情感倾向分析 40-49 4.1 情感词典结构 40-41 4.2 程度副词对情感的影响 41-43 4.3 基于投票策略的情感倾向分析 43-45 4.4 实验分析 45-48 4.5 本章小结 48-49 第五章 Web 舆情预警系统架构 49-65 5.1 系统架构 49-50 5.2 系统逻辑结构 50-59 5.2.1 信息采集模块 50-53 5.2.2 事件提取模块 53-54 5.2.3 舆情识别模块 54-57 5.2.4 舆情分析模块 57-58 5.2.5 信息决策模块 58-59 5.3 Web 舆情监控 59-63 5.4 本章小结 63-65 第六章 总结和展望 65-67 致谢 67-68 参考文献 68-72 攻硕期间取得的研究成果 72-73
|
相似论文
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 中国区域性网上社区的舆情研究,G206
- 网络舆情的形成机制研究,G206
- 基于网络舆情的企业危机管理研究,G206
- 社会焦点事件网络舆情演变研究,G206
- 网络舆情热点事件中的网民行为研究,G206
- 基于博客的作者声誉度分析,TP393.092
- 基于意见挖掘技术的网购评论倾向性分析的研究与应用,TP393.09
- 面向互联网中文舆情信息的情感倾向分析,TP391.1
- 群体性事件的网络舆情及其治理,G206
- 政府网络新闻发布理论与实践探析,G219.2
- 网络舆情主体特征及其成因分析,G206
- 网络舆情的伦理研究,G206
- 语言文字网络舆情基础资源建设研究,H08
- 汉字简繁之争的网络舆情研究,H124
- 我国网络舆情的政府管理研究,G206
- 网络舆情与政府电子治理研究,D630
- 虚拟世界的意见集合,G206
- 网络口碑传播对企业形象影响的研究,G206
- 负面网络舆情及其治理研究,G206
- 高校网络舆情的现状与引导,G206
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|