学位论文 > 优秀研究生学位论文题录展示
互联网舆情监控分析系统的研究与实现
作 者: 刘德鹏
导 师: 徐谡;许慧新
学 校: 电子科技大学
专 业: 软件工程
关键词: 网络舆情 监控分析 热点识别 文本倾向分析 语义角色标注
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 400次
引 用: 3次
阅 读: 论文下载
内容摘要
随着互联网的高速发展,网络给人们提供了前所未有的开放、便捷的信息共享与发布平台,越来越多的人通过网络来表达自己的意见、想法、情绪和态度,其中既包括对对事件的发展有着正面、积极作用的信息,也包括一些负面、消极的信息。同时,网络平台的开放性、直接性和隐蔽性使得网络舆论越来越重要地影响人们的意识形态。因此,对大量舆情信息的及时有效监控分析,对维护社会稳定、促进国家发展具有重要的现实意义。网络舆情监控系统与自然语言处理技术密切相关。受限于自然语言处理技术水平,传统的网络舆情监控系统,主要为话题识别的相关内容,而对舆情的情感因素关注较少。虽然也有学者对舆情情感意见信息挖掘进行了研究,但由于处理结果与语料相关性较高,导致实用性不足。近年来,随着自然语言处理研究的逐步深入,浅层语义分析开始崭露头角,并在相关应用研究中体现出相对词性标注、句法分析更为智能实用的优势。浅层语义分析是一种简化了的语义分析形式,它利用动词对句意理解的关键作用,以动词为中心对句子意义的进行了形式化表示。语义角色标注作为一种浅层语义分析,对句子中一些成分为给定动词谓词的语义角色进行了标注,具有分析任务定义明确、便于评价等优点。结合这种最新的自然语言处理技术,基于对现有舆情监控分析算法的对比分析,我们设计并实现了一个网络舆情监控分析系统,创新性的提出了:(1)一种新的结合HowNet中公开的计算词语语义相似性算法和基于字的倾向计算算法,并对现有话题识别与追踪技术进行优化整合;(2)通过对大量样本的统计分析,得到倾向性语言表现形态规律,具体表现为角色-特征性概率表和角色-情感性概率表,为后续分析提供客观数据基础。本文包括的主要内容有:(1)舆情监控分析系统框架设计与模块设计。根据网络舆情信息的特点,提出系统总体框架,并对信息预处理模块、信息挖掘模块和信息服务模块进行了设计。(2)舆情热点话题识别技术研究。对网络中一段时间内大量出现的某个新闻主体进行提取追踪,通过对ICTCLAS分词技术、文档频率特征抽取方法、TFIDF权重计算以及K均值聚类算法的有效整合,实现热点话题识别与追踪。(3)舆情信息浅层语义分析研究。主要利用语义角色标注工具,通过训练测试,对文本语义层角色进行标注。(4)舆情信息倾向分析研究。实现文本中意见、情感等信息的提取,主要包括情感词库建设、特征库建设、情感倾向计算算法研究以及语料知识发现等。本文所涉工作在国内相关事件和分析中得到应用,可有效辅助舆情监控并减少人为干预,必将在未来的网络信息管理中发挥积极的效益。
|
全文目录
摘要 4-6 Abstract 6-10 第一章 引言 10-19 1.1 研究的背景与意义 10-11 1.2 网络舆情概述 11-13 1.3 研究内容及目标 13 1.4 国内外研究现状 13-17 1.4.1 国外研究现状 13-15 1.4.2 国内研究现状 15-17 1.5 本文组织结构 17-19 第二章 系统需求分析 19-29 2.1 概述 19-20 2.2 系统功能性需求 20-28 2.2.1 业务分析 20-21 2.2.2 系统前台整体结构 21-28 2.2.2.1 系统前台整体结构图 21 2.2.2.2 典型页面 21-25 2.2.2.3 栏目说明 25-28 2.2.3 系统性能需求 28 2.3 本章小结 28-29 第三章 系统设计 29-43 3.1 系统的设计流程 29 3.2 系统体系结构 29-34 3.2.1 舆情信息的采集 30-31 3.2.2 搜索引擎的基本技术 31-34 3.3 系统整体构架 34-37 3.3.1 采集系统构架 35-36 3.3.2 后端应用系统构架 36-37 3.4 舆情信息预处理模块设计 37-40 3.4.1 舆情信息的网页解析 37-39 3.4.2 中文分词 39 3.4.3 信息浅层语义分析 39-40 3.5 舆情信息挖掘模块设计 40 3.5.1 热点话题识别 40 3.5.2 文本倾向性分析 40 3.6 舆情信息服务模块设计 40-42 3.7 本章小结 42-43 第四章 系统实现 43-78 4.1 系统界面设计 43-52 4.2 舆情信息采集实现 52-57 4.3 舆情信息热点话题识别实现 57-67 4.4 信息浅层语义分析实现 67-73 4.5 文本倾向性分析实现 73-77 4.6 本章小结 77-78 第五章 系统测试 78-82 5.1 软件测试 78-81 5.2 本章小结 81-82 第六章 结论与展望 82-83 致谢 83-84 参考文献 84-87
|
相似论文
- 中国区域性网上社区的舆情研究,G206
- 网络舆情的形成机制研究,G206
- 网络舆情对司法过程的影响,D926
- 网络新闻发言人制度构建,G219.2
- 网络舆情的司法监督功能,D926
- 评价对象抽取研究,TP391.1
- 基于树核方法的中文语义角色标注研究,TP391.1
- 中文名词性谓词的语义角色标注研究,TP391.1
- 高校突发事件网络舆情预警机制探究,G647
- 基于网络舆情的企业危机管理研究,G206
- 上市公司网络舆情管控研究,F276.6
- 社会焦点事件网络舆情演变研究,G206
- 网络舆情热点事件中的网民行为研究,G206
- 群体性事件的网络舆情及其治理,G206
- 政府网络新闻发布理论与实践探析,G219.2
- 网络舆情主体特征及其成因分析,G206
- 网络舆情的伦理研究,G206
- 语言文字网络舆情基础资源建设研究,H08
- 汉字简繁之争的网络舆情研究,H124
- 我国网络舆情的政府管理研究,G206
- 网络舆情与政府电子治理研究,D630
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|