学位论文 > 优秀研究生学位论文题录展示

情感倾向分析中的结构化方法

作 者: 吴苑斌
导 师: 黄萱菁
学 校: 复旦大学
专 业: 计算机应用技术
关键词: 情感倾向分析 结构化机器学习 短语依存句法树 树核函数 倾向性的图表示 解码算法 整数线性规划
分类号: TP391.1
类 型: 博士论文
年 份: 2012年
下 载: 229次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来情感倾向分析在自然语言处理领域引起了广泛的关注.它可以帮助分析文本中与情感相关的信息,从而提供直接的应用结果或者为其他的自然语言处理任务服务.结构化方法是自然语言处理的各个任务中广泛使用的一类机器学习方法,它通过利用结构化的信息提高分类器的性能.本文中主要研究倾向性信息抽取任务中的结构化方法.首先,对于倾向性信息抽取中的评价词,评价对象的关系抽取任务,过去的关系抽取方式要么为简单的将相邻评价词,评价对象的关联在一起,要么依靠手工制定的模板,都没有充分利用句法树上的信息.同时,也忽略了评价词.评价对象的短语结构.本文提出了短语依存句法树,将短语结构引入了依存句法树中,较好的处理了短语间的依存关系.在短语依存句法树上,首次提出了依赖于短语结构的树核函数.它能够区别对待不同类型的依存关系,很大的提高了树核函数在关系抽取中的辨识能力.在5个不同领域的在线评论语料上的实验证明了短语依存句法树能够很好的处理短语类型的评价词,评价对象;同时,新的树核函数能够有效的提高关系抽取的各方面性能.其次、传统的文本倾向性信息表示忽略了文本中许多与倾向性相关的信息.这使得最终的抽取结果可能是不准确,不完整的.针对这样的问题,本文提出了基于图的倾向性表示.其中除了传统的评价词,评价对象等要素外,还包括了对评价词的限制隐含的评价对象,以及评价词之间的关系.它极大的丰富了倾向性信息抽取的结果,也扩充了倾向性任务处理的对象能够提供更加精确,更加完备的抽取结果.本文使用了一种新的结构化方法将一个句子的倾向性信息转化成对应的图表示.它通过整数线性规划,有力的整合了图上的各类结构化约束,同时有较强的扩展能力和稳定性.在中文在线评论语料库上的实验证明,基于图的倾向性表示有较强的表示能力,同时结构化方法能构明显的提高倾向信信息抽取系统的各方面性能.

全文目录


摘要  9-10
Abstract  10-11
第一章 前言  11-16
  §1.1 倾向性分析任务  11-12
  §1.2 结构化方法  12-13
  §1.3 本文贡献  13-14
  §1.4 各章组织  14-16
第二章 概论  16-44
  §2.1 情感倾向性分析  16-31
    2.1.1 情感倾向性分析任务描述  16-17
    2.1.2 情感倾向性分析的特点  17-24
    2.1.3 情感识别与分类  24-29
    2.1.4 倾向性信息抽取与摘要  29-30
    2.1.5 倾向性检索  30-31
  §2.2 结构化方法  31-44
    2.2.1 定义  31-33
    2.2.2 基于边际的结构化方法  33-37
    2.2.3 基于概率的结构化方法  37-42
    2.2.4 具体问题中的解码算法  42-44
第三章 短语依存句法树上的倾向性分析  44-64
  §3.1 引言  44-45
  §3.2 短语依存句法树  45-49
    3.2.1 系统框架  45-46
    3.2.2 短语依存句法分析  46-47
    3.2.3 短语依存句法树的构造  47-49
  §3.3 倾向性信息抽取  49-57
    3.3.1 倾向性要素的抽取  49-51
    3.3.2 倾向性关系抽取  51-57
  §3.4 实验  57-62
    3.4.1 语料库  57
    3.4.2 倾向性要素抽取结果  57-58
    3.4.3 倾向性关系抽取实验  58-60
    3.4.4 结果的讨论  60-62
  §3.5 总结  62
  §3.6 关于文献的说明  62-64
第四章 基于图表示的结构化倾向性挖掘  64-86
  §4.1 引言  64-66
  §4.2 倾向性信息的图表示  66-68
    4.2.1 单个评价词的表示  66-67
    4.2.2 评价词之间的关系  67-68
  §4.3 针对图表示的结构化方法  68-78
    4.3.1 符号的说明  68-70
    4.3.2 解码算法  70-77
    4.3.3 训练算法  77
    4.3.4 特征构造  77-78
  §4.4 实验  78-84
    4.4.1 语料库  78
    4.4.2 实验建立  78-80
    4.4.3 实验结果和讨论  80-84
  §4.5 总结  84
  §4.6 关于文献的说明  84-86
第五章 结语和展望  86-87
参考文献  87-93
攻读博士期间主要工作  93-94
致谢  94-95

相似论文

  1. 面向统计机器翻译的解码算法的研究,TP391.2
  2. 一维组合装车问题模型与算法研究,F224
  3. 基于分割一致性的二维人体姿态估计,TP391.41
  4. 面向互联网中文舆情信息的情感倾向分析,TP391.1
  5. 哈尔滨市群力新区土方调配优化研究,TU751
  6. 废旧木材逆向物流网络构建研究,F416.88
  7. 基于支持向量机的篇章情感倾向分析系统研究与实现,TP18
  8. 基于待消解项识别的全局优化共指消解方法研究,TP391.1
  9. Petri网死锁迭代控制中若干问题研究,TP301.1
  10. 基于依存关系的中文语义角色标注研究,TP391.1
  11. 中文零指代消解研究,TP391.1
  12. 中文词语情感倾向研究,TP391.1
  13. 直接优化方法在核电厂堆芯换料中的可行性研究,TM623
  14. 电子废弃物逆向物流网络设计研究,F713.2
  15. 基于电子废弃物的逆向物流网络设计研究,F252
  16. 中文意见挖掘中的特征词提取以及情感倾向分析,TP391.1
  17. 句子和篇章文本倾向分析,TP391.1
  18. 时变网络有向中国邮路问题的割平面算法研究,F618
  19. 基于组块分析的中文短语情感倾向研究,TP391.1
  20. Petri网死锁迭代控制算法研究,TP301.1
  21. 虚拟网络映射问题研究,TP393.01

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com