学位论文 > 优秀研究生学位论文题录展示
基于关联规则和图排序的句子情感倾向性研究
作 者: 宋艳雪
导 师: 张绍武
学 校: 大连理工大学
专 业: 计算机应用技术
关键词: 语境歧义词 关联规则 多情感词汇 图排序 情感消歧 情感分析
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 74次
引 用: 0次
阅 读: 论文下载
内容摘要
当今,互联网在我们的工作、学习、生活中扮演着无可替代的角色,它已经与我们的生活息息相关。一些互联网新兴宠儿的出现更加使互联网信息呈爆炸式增长,人们通过博客、微博客、论坛等平台表达个人对热点新闻、社会舆论,产品等的意见或评论,这使得主观性文本所占的比例急剧增加,使用什么方法能够有效地从这些主观性文本中挖掘出作者的观点呢?这已经成为当今自然语言处理领域的一个热点问题,单纯的依靠人工的方法难以解决如此海量的信息,情感分析技术恰恰解决了这一烦恼。通过计算机对主观性文本进行分析、归纳和处理,进而得出作者的观点,这就是情感倾向性分析。本文主要研究的是句子级别的情感倾向性分析问题。在详尽分析了句子级情感倾向性分析在国内外的发展状况以及遇到的主要瓶颈后,本文针对“语境歧义词”和“多情感词汇”两大难题提出了“基于关联规则和图排序的句子情感倾向性研究”的课题,为以后的学习研究提供帮助。首先,本文在关联规则挖掘的经典应用“购物篮问题”的背景下提出了“基于语境歧义词的句子情感倾向性分析方法”。使用关联规则挖掘的方法找出句子中存在的语境歧义词搭配对,通过互信息方法过滤掉噪音,进而判断搭配对是否具有情感倾向性,将具有情感倾向性的搭配对构建成“语境歧义词搭配词典”。结合“语境歧义词搭配词典”,采用语义分析的方法对COAE2008语料进行情感倾向性分析。实验充分证明了“语境歧义词搭配词典”对情感倾向性分析具有很大的帮助。其次,基于pagerank算法在网页链接分析中的成功应用,我们提出了“基于图排序的词汇情感消歧”思想。首先,对语料进行预处理,通过《现代汉语词典》构建“词义关系图”,在“词义关系图”上进行随机游走、迭代计算。最终选择多情感词汇的所有词义中具有“最大收敛值”的词义作为最终的词义,从而完成词汇情感消歧。将此方法在“微博客”和“情感语料本体”两种语料上与“基于统计”和“基于贝叶斯模型”两种方法分别进行对比,实验结果充分说明了该方法的可行性。最后,本文将以上两种思想结合,对COAE2008语料进行句子的情感倾向性分析上,实验结果在准确率、召回率、F值上都有一定的提高,体现了本课题的研究意义。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪论 9-16 1.1 研究背景 9-10 1.2 情感分析的研究现状及意义 10-13 1.2.1 情感元素抽取 11 1.2.2 情感倾向性分析 11-12 1.2.3 情感信息的检索与归纳 12-13 1.3 句子情感分析的研究意义及难点 13-14 1.4 待解决的问题 14 1.5 本文工作 14-15 1.6 本文的结构 15-16 2 外部资源和相关知识 16-26 2.1 研究背景 16-19 2.1.1 情感词汇本体 16-17 2.1.2 HowNet 17-19 2.2 关键技术 19-24 2.2.1 关联规则挖掘 19-21 2.2.2 PageRank算法 21-24 2.3 评价方法 24-25 2.4 本章小结 25-26 3 基于语境歧义词的句子情感倾向性分析 26-39 3.1 相似研究 26 3.2 问题定义 26-27 3.3 算法思想 27-30 3.3.1 关联规则在本文中的应用 27-29 3.3.2 基于语义分析的句子情感倾向性分析 29-30 3.4 语境歧义词搭配的识别 30-33 3.4.1 种子词的选取 30 3.4.2 语境歧义词搭配的挖掘 30-33 3.5 句子的情感倾向性判断 33-34 3.5.1 基于语境歧义词的情感词典 33 3.5.2 句子的倾向性判断 33-34 3.6 实验结果及分析 34-38 3.6.1 语料预处理 34-35 3.6.2 实验结果与分析 35-38 3.7 本章小结 38-39 4 基于图排序的词汇情感消歧 39-53 4.1 相似研究 39-40 4.2 问题定义 40 4.3 算法思想 40-43 4.4 基于图排序的词汇情感消歧算法 43-47 4.4.1 多情感词汇的获取 44-45 4.4.2 语料的选取与预处理 45-46 4.4.3 基于图排序的词汇情感消歧 46-47 4.5 实验结果及分析 47-51 4.5.1 对比实验 47-49 4.5.2 实验结果分析 49-51 4.6 本章小结 51-53 结论 53-55 参考文献 55-59 攻读硕士学位期间发表学术论文情况 59-60 致谢 60-61
|
相似论文
- 基于数据挖掘的税务稽查选案研究,F812.42
- 关联规则算法在高职院校贫困生认定工作中的应用,G717
- 数据挖掘在学校管理和学生培养中的应用,TP311.13
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 基于关联规则的结构化浏览技术及其应用,TP391.41
- 数据挖掘技术在独立学院教学评估中的应用研究,TP311.13
- 通信行为指纹研究,TP311.13
- 动态关联规则的研究,TP311.13
- 高速网络环境下的入侵检测系统的研究,TP393.08
- 基于日志分析的超级计算机错误预测方法研究,TP338
- 数据挖掘技术在世博客流与社交媒体预测中的研究与应用,TP311.13
- 用户交易行为的分析与展示—在现代易货业中的应用,TP311.13
- 基于数据挖掘的入侵检测技术的研究,TP393.08
- 基于Web使用挖掘的网站优化研究,TP393.092
- 基于关联技术的中文文本分类研究,TP391.1
- 基于XML的Web文本挖掘及关联算法的研究,TP311.13
- 数据挖掘在电信移动客户行为分析中的应用研究,TP311.13
- 数据挖掘在中职幼教课程改革中的应用,TP311.13
- 关联规则在高校人力资源系统中的应用,TP311.13
- 数据挖掘在教学质量评价中的应用研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|