学位论文 > 优秀研究生学位论文题录展示

基于Hownet和Verbnet的中文动词性隐喻识别

作 者: 刘晗
导 师: 陈怡疆
学 校: 厦门大学
专 业: 计算机技术
关键词: 自然语言处理 隐喻识别 动词性隐喻 语义映射
分类号: TP391.1
类 型: 硕士论文
年 份: 2014年
下 载: 1次
引 用: 0次
阅 读: 论文下载
 

内容摘要


隐喻是语言和思维的中心问题,是人类语言中普遍存在的现象。现今,隐喻的机器识别问题已经成为自然语言领域研究的热门课题。目前,汉语隐喻识别的研究大部分都集中在对名词的识别上,然而,相对于其它类型的隐喻,动词性隐喻在实际文本中出现的频率最高,更应该受到中文隐喻的研究者们的重视。本文的研究目的,是把中文动词性隐喻识别问题转化为英文的隐喻识别问题,利用完善的英文动词知识库Verbnet,去更好的进行中文的动词性隐喻识别工作,从而弥补现有的中文隐喻知识库规模小的缺点。本文分析了知网、同义词词林和Wordnet的构建特点,提出了一种Hownet、同义词词林和Wordnet之间的语义映射方法。首先,把同义词词林中的义项转化为Hownet概念的集合,再根据概念的英文翻译,把同义词词林中同义词集转为英文的同义词集,最后,计算该英文同义词集与Wordnet中Synset的词汇相交度的最大值,从而建立起Hownet概念到Wordnet中Synset的映射关系。实验结果证明,该方法的映射准确率达到了90%以上,显示了映射方法的可行性。在成功的把中文词汇映射为英文词汇后,本文提出了一种基于Hownet和Verbnet的中文动词性隐喻识别方法,该方法利用Verbnet中动词的题元角色及其语义选择限制,判断语句中动作的施事者和受事者是否符合正常的搭配,从而识别出超常规的搭配。随后,从“读者”语料库中随机抽取了20个句子对方法进行测试,实验结果达到了预期,有力的证明了该方法对动词隐喻识别的有效性。综上所述,本文的研究给出了基于Hownet和Verbnet的中文动词性隐喻识别的思想和方法,为汉语隐喻识别的进一步研究,提供了一定的理论意义和参考价值。

全文目录


摘要  4-5
Abstract  5-7
目录  7-10
Contents  10-13
第一章 绪论  13-21
  1.1 研究背景与意义  13-14
  1.2 隐喻的概念  14-16
    1.2.1 隐喻的定义  14-15
    1.2.2 隐喻的分类  15-16
  1.3 国内外研究现状  16-18
    1.3.1 国外研究现状  16-17
    1.3.2 国内研究现状  17-18
  1.4 论文工作和章节安排  18-19
  1.5 本章小结  19-21
第二章 隐喻识别的相关理论和知识库  21-39
  2.1 隐喻识别的相关理论  21-26
    2.1.1 依存句法分析  21-22
    2.1.2 超常规搭配  22-23
    2.1.3 机器学习算法  23-24
    2.1.4 词汇相似度计算  24-26
  2.2 现有的中文动词性隐喻识别方法分析  26-28
    2.2.1 汉语隐喻分类识别方法  26-27
    2.2.2 汉语语义超常搭配识别方法  27
    2.2.3 基于语义知识的动词隐喻识别方法  27-28
  2.3 相关知识库介绍  28-38
    2.3.1 Hownet介绍  28-30
    2.3.2 Wordnet介绍  30-32
    2.3.3 同义词词林介绍  32-33
    2.3.4 Verbnet介绍  33-38
  2.4 本章小结  38-39
第三章 Hownet到Wordnet的映射  39-53
  3.1 基于Wordnet词汇相似度的Hownet到Wordnet映射方法  39-41
    3.1.1 映射算法流程图  39-40
    3.1.2 映射步骤  40
    3.1.3 映射方法分析  40-41
  3.2 Hownet、同义词词林和Wordnet之间的语义映射方法  41-47
    3.2.1 映射算法流程图  41-42
    3.2.2 映射步骤  42-46
    3.2.3 映射方法分析  46-47
  3.3 Hownet、同义词词林和Wordnet之间的语义映射方法的改进  47-49
  3.4 实验及分析  49-52
    3.4.1 实验说明  49
    3.4.2 测试语料  49
    3.4.3 实验结果分析  49-52
  3.5 本章小结  52-53
第四章 基于Hownet和Verbnet的中文动词性隐喻识别算法  53-65
  4.1 动词隐喻识别的两个检查点  53
  4.2 算法流程图  53-54
  4.3 基于Hownet和Verbnet的中文动词隐喻识别  54-59
    4.3.1 Hownet名词概念到Verbnet的限制名词类的映射  54-55
    4.3.2 Verbnet语义选择限制查询  55-56
    4.3.3 算法的步骤  56-59
    4.3.4 算法总结  59
  4.4 算法伪代码  59-60
  4.5 实验及分析  60-64
    4.5.1 实验说明  60
    4.5.2 测试语料  60-61
    4.5.3 实验结果分析  61-64
  4.6 本章小结  64-65
第五章 总结与展望  65-67
  5.1 本文工作总结  65
  5.2 本文创新点  65-66
  5.3 未来工作展望  66-67
参考文献  67-70
攻读硕士学位期间发表论文及科研情况  70-71
致谢  71-72
附录 Hownet名词概念到Verbnet限定名词类映射表  72-76

相似论文

  1. 词义消歧语料库自动获取方法研究,TP391.1
  2. 基于自适应本体的异构数据语义集成框架研究,TP311.52
  3. 基于RFID的离散车间物流信息语义集成技术研究,TP391.1
  4. 语义目录的实现机制研究,TP391.1
  5. 基于机器学习算法的隐喻识别研究,TP181
  6. 基于语义网格的异构资源集成关键技术研究,TP393.09
  7. 基于本体的分布式数据库语义映射研究,TP311.13
  8. 首饰设计符号性之初探,J526
  9. 专家信息语义模型异构数据转换技术研究,TP391.1
  10. 基于本体的企业模型互操作研究,TP311.52
  11. 基于自然语言处理的文本数字水印技术研究,TP309.7
  12. 一种本体演化条件下的语义映射可视化维护方法研究,TP391.1
  13. 基于语义相似度的地理信息检索技术研究,TP391.3
  14. 中文用户健康词表构建方法的实证研究,G354
  15. 基于语义的广告图像垃圾邮件过滤技术研究,TP393.098
  16. 基于单目视觉的道路检测算法的研究,TP391.41
  17. 隐喻在线加工模式探索,H05
  18. 英语从句关联词歧义结构分析,H314
  19. 基于本体的扩散制造信息集成研究与应用,TP311.52
  20. 面向远程教育的智能答疑系统的研究与实现,TP311.52
  21. 一种基于语义的将关系数据转换为XML数据的方法,TP312

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com