学位论文 > 优秀研究生学位论文题录展示

互联网舆情监控分析系统的研究与实现

作 者: 刘德鹏
导 师: 徐谡;许慧新
学 校: 电子科技大学
专 业: 软件工程
关键词: 网络舆情 监控分析 热点识别 文本倾向分析 语义角色标注
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 400次
引 用: 3次
阅 读: 论文下载
 

内容摘要


随着互联网的高速发展,网络给人们提供了前所未有的开放、便捷的信息共享与发布平台,越来越多的人通过网络来表达自己的意见、想法、情绪和态度,其中既包括对对事件的发展有着正面、积极作用的信息,也包括一些负面、消极的信息。同时,网络平台的开放性、直接性和隐蔽性使得网络舆论越来越重要地影响人们的意识形态。因此,对大量舆情信息的及时有效监控分析,对维护社会稳定、促进国家发展具有重要的现实意义。网络舆情监控系统与自然语言处理技术密切相关。受限于自然语言处理技术水平,传统的网络舆情监控系统,主要为话题识别的相关内容,而对舆情的情感因素关注较少。虽然也有学者对舆情情感意见信息挖掘进行了研究,但由于处理结果与语料相关性较高,导致实用性不足。近年来,随着自然语言处理研究的逐步深入,浅层语义分析开始崭露头角,并在相关应用研究中体现出相对词性标注、句法分析更为智能实用的优势。浅层语义分析是一种简化了的语义分析形式,它利用动词对句意理解的关键作用,以动词为中心对句子意义的进行了形式化表示。语义角色标注作为一种浅层语义分析,对句子中一些成分为给定动词谓词的语义角色进行了标注,具有分析任务定义明确、便于评价等优点。结合这种最新的自然语言处理技术,基于对现有舆情监控分析算法的对比分析,我们设计并实现了一个网络舆情监控分析系统,创新性的提出了:(1)一种新的结合HowNet中公开的计算词语语义相似性算法和基于字的倾向计算算法,并对现有话题识别与追踪技术进行优化整合;(2)通过对大量样本的统计分析,得到倾向性语言表现形态规律,具体表现为角色-特征性概率表和角色-情感性概率表,为后续分析提供客观数据基础。本文包括的主要内容有:(1)舆情监控分析系统框架设计与模块设计。根据网络舆情信息的特点,提出系统总体框架,并对信息预处理模块、信息挖掘模块和信息服务模块进行了设计。(2)舆情热点话题识别技术研究。对网络中一段时间内大量出现的某个新闻主体进行提取追踪,通过对ICTCLAS分词技术、文档频率特征抽取方法、TFIDF权重计算以及K均值聚类算法的有效整合,实现热点话题识别与追踪。(3)舆情信息浅层语义分析研究。主要利用语义角色标注工具,通过训练测试,对文本语义层角色进行标注。(4)舆情信息倾向分析研究。实现文本中意见、情感等信息的提取,主要包括情感词库建设、特征库建设、情感倾向计算算法研究以及语料知识发现等。本文所涉工作在国内相关事件和分析中得到应用,可有效辅助舆情监控并减少人为干预,必将在未来的网络信息管理中发挥积极的效益。

全文目录


摘要  4-6
Abstract  6-10
第一章 引言  10-19
  1.1 研究的背景与意义  10-11
  1.2 网络舆情概述  11-13
  1.3 研究内容及目标  13
  1.4 国内外研究现状  13-17
    1.4.1 国外研究现状  13-15
    1.4.2 国内研究现状  15-17
  1.5 本文组织结构  17-19
第二章 系统需求分析  19-29
  2.1 概述  19-20
  2.2 系统功能性需求  20-28
    2.2.1 业务分析  20-21
    2.2.2 系统前台整体结构  21-28
      2.2.2.1 系统前台整体结构图  21
      2.2.2.2 典型页面  21-25
      2.2.2.3 栏目说明  25-28
    2.2.3 系统性能需求  28
  2.3 本章小结  28-29
第三章 系统设计  29-43
  3.1 系统的设计流程  29
  3.2 系统体系结构  29-34
    3.2.1 舆情信息的采集  30-31
    3.2.2 搜索引擎的基本技术  31-34
  3.3 系统整体构架  34-37
    3.3.1 采集系统构架  35-36
    3.3.2 后端应用系统构架  36-37
  3.4 舆情信息预处理模块设计  37-40
    3.4.1 舆情信息的网页解析  37-39
    3.4.2 中文分词  39
    3.4.3 信息浅层语义分析  39-40
  3.5 舆情信息挖掘模块设计  40
    3.5.1 热点话题识别  40
    3.5.2 文本倾向性分析  40
  3.6 舆情信息服务模块设计  40-42
  3.7 本章小结  42-43
第四章 系统实现  43-78
  4.1 系统界面设计  43-52
  4.2 舆情信息采集实现  52-57
  4.3 舆情信息热点话题识别实现  57-67
  4.4 信息浅层语义分析实现  67-73
  4.5 文本倾向性分析实现  73-77
  4.6 本章小结  77-78
第五章 系统测试  78-82
  5.1 软件测试  78-81
  5.2 本章小结  81-82
第六章 结论与展望  82-83
致谢  83-84
参考文献  84-87

相似论文

  1. 中国区域性网上社区的舆情研究,G206
  2. 网络舆情的形成机制研究,G206
  3. 网络舆情对司法过程的影响,D926
  4. 网络新闻发言人制度构建,G219.2
  5. 网络舆情的司法监督功能,D926
  6. 评价对象抽取研究,TP391.1
  7. 基于树核方法的中文语义角色标注研究,TP391.1
  8. 中文名词性谓词的语义角色标注研究,TP391.1
  9. 高校突发事件网络舆情预警机制探究,G647
  10. 基于网络舆情的企业危机管理研究,G206
  11. 上市公司网络舆情管控研究,F276.6
  12. 社会焦点事件网络舆情演变研究,G206
  13. 网络舆情热点事件中的网民行为研究,G206
  14. 群体性事件的网络舆情及其治理,G206
  15. 政府网络新闻发布理论与实践探析,G219.2
  16. 网络舆情主体特征及其成因分析,G206
  17. 网络舆情的伦理研究,G206
  18. 语言文字网络舆情基础资源建设研究,H08
  19. 汉字简繁之争的网络舆情研究,H124
  20. 我国网络舆情的政府管理研究,G206
  21. 网络舆情与政府电子治理研究,D630

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com