学位论文 > 优秀研究生学位论文题录展示
基于本体的话题情感分析研究
作 者: 刘倩
导 师: 王晓东
学 校: 河南师范大学
专 业: 计算机软件与理论
关键词: 本体学习 话题过滤 语料库构建 情感分析 舆情分析
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 113次
引 用: 0次
阅 读: 论文下载
内容摘要
?针对“未然态”的舆情信息,挖掘网络热点、焦点及敏感话题,把握舆情动态,提高处置与监管网络突发事件能力等,是舆情分析的重要研究内容。话题情感分析是舆情分析的重要组成部分。论文针对特定话题的网络资源分析其情感倾向性,目的是解决情感词汇的倾向性判断、文本情感分类即话题整体倾向性判断等问题。本文针对特定话题的网络资源进行情感分析。首先,通过本体学习的方法半自动地建立领域知识库,基于领域知识从多话题的基础语料库中过滤出特定话题的语料。然后,以情感词汇本体对情感知识的细粒度分类和倾向性强度判定为指导,对过滤出来的话题语料进行情感分析,从而获得指定话题的整体情感倾向。最后,以春晚评价为应用实例,初步实现了话题情感分析系统中的主要功能模块。本文的主要工作如下。(1)本体构建:包括特定话题的领域本体构建和情感词汇本体构建。前者用于从多话题基础语料库中过滤出特定话题的语料。后者旨在为段落和篇章级的情感分类,以及为话题语料中的情感特征词细粒度划分提供依据。(2)话题语料库构建:首先从Web上自动获取语料,语料文本经预处理后,对其进行聚类以构建多话题基础语料库,然后基于构建的领域本体对话题语料进行过滤,形成单一话题的语料库。(3)话题情感分析:其关键是主观信息的提取和计算,包括从语料文本中抽取主观句,从主观句中提取情感词,以及基于情感词汇本体对主观句中的情感词进行情感倾向计算。最后,通过实验证明了话题情感分析算法的有效性。(4)话题情感分析应用研究:介绍了一个将话题情感分析应用到春晚评价领域中的应用实例。对系统中的主要功能模块进行了详细描述,并通过初步实现系统的主要功能,展示了将话题情感分析技术应用到舆情监控系统中能够提高分析的准确性。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 绪论 9-16 1.1 研究意义 9-11 1.2 国内外研究现状 11-14 1.2.1 词语情感分析现状 11-12 1.2.2 句子级和篇章级情感分析现状 12-13 1.2.3 存在的问题 13-14 1.3 本文的主要工作 14-15 1.4 本文的组织结构 15-16 第二章 话题情感分析理论基础 16-23 2.1 本体学习概述 16-17 2.2 领域本体概念术语的抽取方法 17-19 2.2.1 基于统计的方法 17-18 2.2.2 基于语言学的方法 18 2.2.3 混合方法 18-19 2.3 情感词汇本体构建 19-22 2.3.1 情感词汇本体的知识获取 19-20 2.3.2 情感词汇本体的构建方法 20-22 2.4 本章小结 22-23 第三章 话题语料库构建 23-38 3.1 Web 语料的获取 23-25 3.2 语料文本的预处理 25-33 3.2.1 语料的标注规范 26-29 3.2.2 中文分词与词性标注 29-32 3.2.3 文本特征词初选 32-33 3.3 多话题基础语料库构建 33-36 3.3.1 聚类算法对比分析 33-35 3.3.2 基于聚类算法的多话题基础语料库构建 35-36 3.4 基于领域本体的话题语料过滤 36-37 3.5 本章小结 37-38 第四章 话题情感分析算法设计 38-49 4.1 算法整体框架 38-39 4.2 文本主观句的提取 39 4.3 基于情感词汇本体的主观句情感倾向性计算 39-42 4.3.1 情感词汇倾向性计算 39-41 4.3.2 主观句倾向性计算 41-42 4.4 文本倾向性计算 42-43 4.4.1 篇章级文本情感倾向性计算 42-43 4.4.2 海量级文本情感倾向性计算 43 4.5 实验结果及分析 43-48 4.5.1 实验安排 44-45 4.5.2 实验结果分析 45-48 4.6 本章小结 48-49 第五章 话题情感分析应用实例 49-57 5.1 话题情感分析系统框架设计 49-51 5.2 语料库管理模块功能实现 51-55 5.3 话题情感查询模块功能实现 55-56 5.4 本章小结 56-57 第六章 总结和展望 57-59 6.1 工作总结 57-58 6.2 下一步工作展望 58-59 参考文献 59-63 致谢 63-64 攻读学位期间的科研成果 64-65
|
相似论文
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 数据挖掘技术在世博客流与社交媒体预测中的研究与应用,TP311.13
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 面向互联网中文舆情信息的情感倾向分析,TP391.1
- 网络舆情分析关键技术研究与实现,TP393.09
- AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
- 基于叙词表的领域本体构建方法研究,TP391.1
- Rails框架与语义Web技术在Web开发中的研究与应用,TP393.09
- UML类图转换到OWL DL本体的一种形式化方法的研究,TP391.1
- XML/Schema到OWL DL本体映射的研究,TP391.1
- 基于关系数据库的OWL本体建模技术的研究,TP311.13
- 基于HowNet的中文语义倾向性分析技术研究,TP391.1
- 主观性文本的情感极性分析研究,TP391.1
- 互联网公关传播效果评估研究,G206
- 基于客户反馈的FTP搜索引擎的研究与设计,TP391.3
- 网络舆情分析关键技术的研究与实现,TP393.09
- 网络舆情监控系统的研究与实现,TP393.09
- 面向中文Web评论的情感分析技术研究,TP391.1
- 基于情感分析的新闻浏览平台关键技术研究,TP391.1
- 产品名实体识别及规范化研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|