学位论文 > 优秀研究生学位论文题录展示
文本情感分析的若干关键问题研究
作 者: 单单
导 师: 郭军
学 校: 北京邮电大学
专 业: 信号与信息处理
关键词: 文本分类 情感分析 CRF 最大熵 查询构建
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 433次
引 用: 1次
阅 读: 论文下载
内容摘要
随着Web2.0的兴起与普及,网络文本内容激增,针对文本的情感分析是目前文本挖掘领域的研究热点,可归属于文本分类问题。本文采用机器学习的方法,针对文本不同粒度的极性分类、情感分类以及针对主题检索中的查询构建进行有益的尝试,取得了如下成果:(1)本文提出了一种基于CRF的词语级中文情感倾向分类模型,从“喜、怒、哀、惧”四类分别对情感词的活跃度进行量化。本文主要关注文本分类中的特征选择问题及基于CRF的分类模型,对词的词性、句法分析、否定词、转折词、程度词特征和位置信息的使用进行了分析,基于COAE评测语料的实验结果证明了此方法在分类的准确率和召回率方面的有效性。(2)本文提出了一种基于最大熵的句子级中文情感极性分类模型,最终得到正倾向、负倾向、客观三类句子。本文关注词汇的Unigram特征、Bigram特征、否定词特征和程度词特征以及权值计算的比较,基于COAE评测语料的实验结果证明了此方法在分类的准确率和召回率方面的有效性。(3)情感分析技术与检索技术紧密相关,本文提出了一种基于CRF的半监督查询构建方法,并与手动构造查询和基于无监督的机器学习提取查询词这两种方法进行比较。最终,我们将文本检索与段落检索结合,弥补为了提高精度而造成召回率的损失。实验基于Blog Track语料并且取得了良好的效果。
|
全文目录
相似论文
- 领域实体属性及事件抽取技术研究,TP391.1
- 人物言论抽取与跟踪技术研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 城市轨道交通运营管理系统测试与评价方法研究,TP311.52
- 汉语框架自动识别中的歧义消解,TP391.1
- 基于数据分布特征的文本分类研究,TP391.1
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于树型条件随场的特定域事件提取方法研究,TP391.1
- 快动眼睡眠剥夺对抑郁模型大鼠延髓、海马及下丘脑中CRF及受体mRNA表达的影响,R749.4
- 数据挖掘技术在世博客流与社交媒体预测中的研究与应用,TP311.13
- 基于半结构化文本的转运蛋白底物信息提取系统,Q811.4
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于图的彩色图像目标分割算法研究,TP391.41
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 基于语义分析的文本挖掘研究,TP391.1
- 等距离采样时间序列曲线拟合,O211.61
- 海马区CRFR1受体介导间歇低氧诱导的新生鼠空间学习记忆增强,R33
- 自由搜索算法的改进及其在图像分割中的应用,TP391.41
- 基于最大熵模型的中文实体关系自动抽取研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|