学位论文 > 优秀研究生学位论文题录展示
基于Hownet和Verbnet的中文动词性隐喻识别
作 者: 刘晗
导 师: 陈怡疆
学 校: 厦门大学
专 业: 计算机技术
关键词: 自然语言处理 隐喻识别 动词性隐喻 语义映射
分类号: TP391.1
类 型: 硕士论文
年 份: 2014年
下 载: 1次
引 用: 0次
阅 读: 论文下载
内容摘要
隐喻是语言和思维的中心问题,是人类语言中普遍存在的现象。现今,隐喻的机器识别问题已经成为自然语言领域研究的热门课题。目前,汉语隐喻识别的研究大部分都集中在对名词的识别上,然而,相对于其它类型的隐喻,动词性隐喻在实际文本中出现的频率最高,更应该受到中文隐喻的研究者们的重视。本文的研究目的,是把中文动词性隐喻识别问题转化为英文的隐喻识别问题,利用完善的英文动词知识库Verbnet,去更好的进行中文的动词性隐喻识别工作,从而弥补现有的中文隐喻知识库规模小的缺点。本文分析了知网、同义词词林和Wordnet的构建特点,提出了一种Hownet、同义词词林和Wordnet之间的语义映射方法。首先,把同义词词林中的义项转化为Hownet概念的集合,再根据概念的英文翻译,把同义词词林中同义词集转为英文的同义词集,最后,计算该英文同义词集与Wordnet中Synset的词汇相交度的最大值,从而建立起Hownet概念到Wordnet中Synset的映射关系。实验结果证明,该方法的映射准确率达到了90%以上,显示了映射方法的可行性。在成功的把中文词汇映射为英文词汇后,本文提出了一种基于Hownet和Verbnet的中文动词性隐喻识别方法,该方法利用Verbnet中动词的题元角色及其语义选择限制,判断语句中动作的施事者和受事者是否符合正常的搭配,从而识别出超常规的搭配。随后,从“读者”语料库中随机抽取了20个句子对方法进行测试,实验结果达到了预期,有力的证明了该方法对动词隐喻识别的有效性。综上所述,本文的研究给出了基于Hownet和Verbnet的中文动词性隐喻识别的思想和方法,为汉语隐喻识别的进一步研究,提供了一定的理论意义和参考价值。
|
全文目录
摘要 4-5 Abstract 5-7 目录 7-10 Contents 10-13 第一章 绪论 13-21 1.1 研究背景与意义 13-14 1.2 隐喻的概念 14-16 1.2.1 隐喻的定义 14-15 1.2.2 隐喻的分类 15-16 1.3 国内外研究现状 16-18 1.3.1 国外研究现状 16-17 1.3.2 国内研究现状 17-18 1.4 论文工作和章节安排 18-19 1.5 本章小结 19-21 第二章 隐喻识别的相关理论和知识库 21-39 2.1 隐喻识别的相关理论 21-26 2.1.1 依存句法分析 21-22 2.1.2 超常规搭配 22-23 2.1.3 机器学习算法 23-24 2.1.4 词汇相似度计算 24-26 2.2 现有的中文动词性隐喻识别方法分析 26-28 2.2.1 汉语隐喻分类识别方法 26-27 2.2.2 汉语语义超常搭配识别方法 27 2.2.3 基于语义知识的动词隐喻识别方法 27-28 2.3 相关知识库介绍 28-38 2.3.1 Hownet介绍 28-30 2.3.2 Wordnet介绍 30-32 2.3.3 同义词词林介绍 32-33 2.3.4 Verbnet介绍 33-38 2.4 本章小结 38-39 第三章 Hownet到Wordnet的映射 39-53 3.1 基于Wordnet词汇相似度的Hownet到Wordnet映射方法 39-41 3.1.1 映射算法流程图 39-40 3.1.2 映射步骤 40 3.1.3 映射方法分析 40-41 3.2 Hownet、同义词词林和Wordnet之间的语义映射方法 41-47 3.2.1 映射算法流程图 41-42 3.2.2 映射步骤 42-46 3.2.3 映射方法分析 46-47 3.3 Hownet、同义词词林和Wordnet之间的语义映射方法的改进 47-49 3.4 实验及分析 49-52 3.4.1 实验说明 49 3.4.2 测试语料 49 3.4.3 实验结果分析 49-52 3.5 本章小结 52-53 第四章 基于Hownet和Verbnet的中文动词性隐喻识别算法 53-65 4.1 动词隐喻识别的两个检查点 53 4.2 算法流程图 53-54 4.3 基于Hownet和Verbnet的中文动词隐喻识别 54-59 4.3.1 Hownet名词概念到Verbnet的限制名词类的映射 54-55 4.3.2 Verbnet语义选择限制查询 55-56 4.3.3 算法的步骤 56-59 4.3.4 算法总结 59 4.4 算法伪代码 59-60 4.5 实验及分析 60-64 4.5.1 实验说明 60 4.5.2 测试语料 60-61 4.5.3 实验结果分析 61-64 4.6 本章小结 64-65 第五章 总结与展望 65-67 5.1 本文工作总结 65 5.2 本文创新点 65-66 5.3 未来工作展望 66-67 参考文献 67-70 攻读硕士学位期间发表论文及科研情况 70-71 致谢 71-72 附录 Hownet名词概念到Verbnet限定名词类映射表 72-76
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 基于自适应本体的异构数据语义集成框架研究,TP311.52
- 基于RFID的离散车间物流信息语义集成技术研究,TP391.1
- 语义目录的实现机制研究,TP391.1
- 基于机器学习算法的隐喻识别研究,TP181
- 基于语义网格的异构资源集成关键技术研究,TP393.09
- 基于本体的分布式数据库语义映射研究,TP311.13
- 首饰设计符号性之初探,J526
- 专家信息语义模型异构数据转换技术研究,TP391.1
- 基于本体的企业模型互操作研究,TP311.52
- 基于自然语言处理的文本数字水印技术研究,TP309.7
- 一种本体演化条件下的语义映射可视化维护方法研究,TP391.1
- 基于语义相似度的地理信息检索技术研究,TP391.3
- 中文用户健康词表构建方法的实证研究,G354
- 基于语义的广告图像垃圾邮件过滤技术研究,TP393.098
- 基于单目视觉的道路检测算法的研究,TP391.41
- 隐喻在线加工模式探索,H05
- 英语从句关联词歧义结构分析,H314
- 基于本体的扩散制造信息集成研究与应用,TP311.52
- 面向远程教育的智能答疑系统的研究与实现,TP311.52
- 一种基于语义的将关系数据转换为XML数据的方法,TP312
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|