学位论文 > 优秀研究生学位论文题录展示

评价对象抽取研究

作 者: 鞠久朋
导 师: 周国栋;李寿山
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 情感分析 评价对象抽取 条件随机场 多领域学习 语义角色标注
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 89次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着Web 2.0技术的迅猛发展,互联网上带有丰富观点的资源(如评论、博客等)正以指数级的速度增长。基于用户发布内容的情感分析已经成为自然语言处理领域一个引人注目的研究热点。情感分析又称意见挖掘,是指通过计算机手段,帮助用户快速获取、整理和分析相关评价信息。近年来,情感分析研究已经取得了一系列进展,特别是在情感信息的褒、贬极性分类方面。目前,越来越多的研究者开始把目光转向细粒度的情感分析以及基于情感分析的上层应用,如情感信息抽取、情感信息的检索与归纳等。评价对象抽取是情感分析研究中情感信息抽取任务的重要研究内容之一。本文着眼于情感信息抽取中评价对象抽取的研究,内容主要包括:1.基于条件随机场模型的评价对象抽取方法。在引入常用于情感信息抽取的特征的基础上,将特征归纳为词法、语法、相对位置、语义等四大类别,从特征的角度扩展了基于条件随机场的评价对象抽取系统,重点考查了不同特征及其组合对系统性能的影响,并做了详细的比较研究。2.考虑到在文本情感分析研究中普遍存在的领域适应问题,本文提出了多领域评价对象抽取融合,即将多个领域的训练样本充分利用起来,使得不同领域之间的训练样本能够互相帮助。通过多个领域基模型的融合,提高每个单一领域评价对象抽取的性能。本文研究了常用融合方法在该任务上的应用,并结合任务特点在元学习的基础上提出了改进的融合方法。3.随着语义角色标注技术的成熟及其在其他自然语言处理任务上的应用,本文探索了将语义角色标注信息应用于评价对象抽取。通过把语义角色信息作为一个特殊的特征,研究语义角色对评价对象抽取的作用。本文的主要贡献在于对单领域任务中有效特征的选择,以及对多领域融合方法的研究,具体来讲包括:1.提出了依存关系、情感词、语义角色等新特征,并对现有的特征加以归纳总结,成功地用于基于条件随机场模型的评价对象抽取。2.通过大量的对比实验,研究了评价对象抽取任务中的特征选择问题,系统地比较、研究了各特征之间的组合对评价对象抽取性能的影响。3.研究了在评价对象抽取中的多领域融合问题,指出了常用的多领域融合方法在该任务上的不足,并结合任务特点提出了适用于该任务的融合方法。4.探索了基于语义角色标注的浅层语义特征在该任务上的应用,实验表明语义角色信息对评价对象有很好的指示作用。这些方法的研究和所取得的成果将有助于提高评价对象抽取的性能,对今后情感分析领域的研究具有重要的参考价值。

全文目录


中文摘要  4-6
Abstract  6-11
第1章 绪论  11-22
  1.1 研究背景和意义  11-13
    1.1.1 研究背景  11-12
    1.1.2 研究意义  12-13
  1.2 情感分析概述  13-18
    1.2.1 情感分析的研究框架  14-15
    1.2.2 关键任务及主流方法  15-18
  1.3 评价对象抽取概述  18-20
    1.3.1 评价对象简介  18-19
    1.3.2 研究现状  19-20
  1.4 研究内容  20
  1.5 组织结构  20-22
第2章 相关知识介绍  22-34
  2.1 语料资源介绍  22-26
    2.1.1 DSRC 语料  23-25
    2.1.2 IMDb 影评语料  25-26
  2.2 机器学习模型介绍  26-30
    2.2.1 条件随机场模型  26-29
    2.2.2 支持向量机  29-30
  2.3 依存句法分析简介  30-32
  2.4 k 倍交叉验证法  32
  2.5 性能评测指标  32-33
  2.6 本章小结  33-34
第3章 单领域评价对象抽取  34-47
  3.1 相关研究  34-35
  3.2 基于CRFs 的系统实现  35
  3.3 特征概述  35-37
  3.4 实验设置  37-41
    3.4.1 数据预处理  37-40
    3.4.2 特征模板定义  40-41
  3.5 实验结果与分析  41-46
    3.5.1 基于基本词法特征的实验  42
    3.5.2 采用扩展特征后的实验  42-45
    3.5.3 学习的性能曲线  45-46
  3.6 本章小结  46-47
第4章 多领域评价对象抽取融合研究  47-59
  4.1 引言  47-48
  4.2 相关研究  48-49
  4.3 模型层融合方法  49-54
    4.3.1 问题描述  49-50
    4.3.2 常用的融合方法  50-52
    4.3.3 改进的融合方法  52-54
  4.4 实验结果与分析  54-58
    4.4.1 实验设置  54
    4.4.2 实验结果与分析  54-58
  4.5 本章小结  58-59
第5章 语义角色标注在评价对象抽取上的应用  59-68
  5.1 SRL 简介  59-61
    5.1.1 SRL 定义  59-60
    5.1.2 SRL 技术简介  60-61
    5.1.3 SRL 相关应用  61
  5.2 SRL 在评价对象抽取上的应用  61-66
    5.2.1 问题描述  61-62
    5.2.2 SRL 特征提取算法  62-66
  5.3 实验结果与分析  66-67
    5.3.1 实验设置  66
    5.3.2 实验结果与分析  66-67
  5.4 本章小结  67-68
第6章 总结与展望  68-71
  6.1 研究工作总结  68-69
  6.2 下一步工作设想  69-71
参考文献  71-76
攻读学位期间公开发表的论文  76
攻读学位期间参与的科研项目  76-77
致谢  77-78

相似论文

  1. 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
  2. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  3. 基于空间邻域词袋模型的图像标注技术,TP391.41
  4. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  5. 数据挖掘技术在世博客流与社交媒体预测中的研究与应用,TP311.13
  6. 基于条件随机场的RNA二级结构预测算法,R346
  7. 基于字词联合解码的中文分词研究,TP391.1
  8. 基于关联规则和图排序的句子情感倾向性研究,TP391.1
  9. 特定领域中文术语抽取,TP391.1
  10. 中文命名实体识别与歧义消解研究,TP391.1
  11. 基于英文博客空间文本的情感分析研究,TP391.1
  12. 中文命名实体识别及若干相关问题的研究,TP391.41
  13. 基于马尔可夫逻辑网络的语义角色标注,TP391.1
  14. 基于信息抽取技术的商业社会网络创建研究,TP391.1
  15. 基于条件随机场的中文命名实体识别研究,TP391.4
  16. 基于HowNet的中文语义倾向性分析技术研究,TP391.1
  17. 基于条件随机场的中文命名实体识别,TP391.43
  18. 主观性文本的情感极性分析研究,TP391.1
  19. 本地搜索领域POI缩略词词典的研究,TP391.3
  20. 基于条件随机场的汉语短语识别研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com