学位论文 > 优秀研究生学位论文题录展示
基于树核方法的中文语义角色标注研究
作 者: 吴方磊
导 师: 朱巧明;李培峰
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 语义角色标注 语义角色分类 树核 复合核
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 32次
引 用: 0次
阅 读: 论文下载
内容摘要
语义角色标注(Semantic Role Labeling,简称SRL)是浅层语义分析的一种实现方式,其任务是对于给定句子,对句子中的每个谓词标注出句中的相应语义成分,并作出相应的语义标记,如施事、受事、工具或附加语等。近期主流的SRL研究都基于特征向量的方法,取得了较好的效果。然而,这种方法存在的问题也日益突显,如:更有效的特征很难被抽取,丢失了重要的结构化信息等。目前,一种研究趋势是探索基于核函数的SRL方法,可以有效地解决特征工程所带来的瓶颈。本文深入探讨了基于树核方法的中文语义角色标注,重点研究SRL的分类阶段。首先,我们研究了应用在中文SRL上的各种核方法:使用二次多项式核实现了一个基于特征向量的语义角色分类系统;探索了基于卷积树核的语义角色分类方法,并在最小句法树结构的基础上,进一步定义了两种不同的句法结构。在中文PropBank语料上的精确率达到91.53%;使用复合核将基于树核和基于特征的方法结合,性能进一步提高,分类精确率达到94.23%。接着,我们对适用于中文SRL的有效结构化信息做了更为深入的研究,探索了结构化特征对语义角色分类的重要性。考虑到同一谓词的各论元间的影响,提出了多论元-谓词结构化特征空间(AAPF),并在结构化特征中融入平面特征的信息,提出了三种受平面特征启发的方法,分类精确率提高到92.54%。再使用复合核将最优的树核方法FIT与特征向量结合起来对语义角色进行分类,分类精确率达到95.21%,性能优于目前同类SRL系统。最后,我们使用树核函数的方法对中文名词性谓词语义角色分类进行了初步探索,结果表明,将树核函数应用于中文名词性谓词语义角色分类有较大的潜力。
|
全文目录
摘要 4-5 Abstract 5-10 第1章 绪论 10-15 1.1 研究背景 10 1.2 研究意义 10-11 1.3 研究现状 11-13 1.3.1 基于特征向量的方法 11-12 1.3.2 基于树核函数的方法 12-13 1.4 本文研究内容 13-14 1.5 论文组织结构 14-15 第2章 相关知识 15-22 2.1 语义角色标注概述 15-18 2.1.1 语义角色标注定义 15 2.1.2 语义角色标注语料 15-17 2.1.3 语义角色标注方法 17-18 2.2 实验结果评测指标 18-19 2.3 分类器的选择与构造 19-21 2.3.1 SVM 原理 19-20 2.3.2 SVM 分类器构造 20-21 2.4 本章小结 21-22 第3章 中文动词性谓词语义角色标注 22-40 3.1 核函数方法 22-25 3.1.1 多项式核 22-23 3.1.2 卷积树核 23-24 3.1.3 复合核 24-25 3.2 特征的选取 25-30 3.2.1 平面特征集构造 25-28 3.2.2 结构化信息获取 28-30 3.3 实验结果与分析 30-38 3.3.1 数据资源及实验设置 30-32 3.3.2 基于多项式核的角色分类结果 32-34 3.3.3 基于卷积树核的角色分类结果 34-36 3.3.4 基于复合核的角色分类结果 36-38 3.4 本章小结 38-40 第4章 中文SRL 的结构化特征研究 40-53 4.1 相关研究 40-41 4.2 结构化特征的研究 41-48 4.2.1 多论元-谓词结构化特征空间 41-42 4.2.2 平面特征启发的结构化特征 42-48 4.3 实验结果与分析 48-52 4.3.1 数据资源及实验设置 48 4.3.2 结果分析 48-52 4.4 本章小结 52-53 第5章 基于树核函数的中文名词性谓词语义角色分类 53-59 5.1 相关研究 53 5.2 中文NomBank 介绍 53-54 5.3 中文名词性谓词SRL 流程 54-55 5.4 基于树核函数的中文名词性谓词语义角色分类 55-56 5.5 实验结果与分析 56-58 5.5.1 实验设置 56-57 5.5.2 实验结果 57-58 5.6 本章小结 58-59 第6章 总结与展望 59-61 6.1 总结 59 6.2 展望 59-61 参考文献 61-65 附录 65-67 攻读学位期间公开发表的论文 67 攻读硕士学位期间参与的项目 67-68 致谢 68-69
|
相似论文
- 评价对象抽取研究,TP391.1
- 中文名词性谓词的语义角色标注研究,TP391.1
- 基于特征的中文名词性谓词语义角色标注研究,TP391.1
- 基于联合方法的中文语义角色标注研究,TP391.1
- 基于马尔可夫逻辑网络的语义角色标注,TP391.1
- 基于复合核函数及软边缘的新型支持向量机的研究,TP18
- 互联网舆情监控分析系统的研究与实现,TP393.09
- 语义角色标注的集成策略的研究,TP391.1
- 基于Web的比较观点挖掘方法研究,TP391.1
- 基于依存关系的中文语义角色标注研究,TP391.1
- 指代消解中待消解项识别研究,TP391.1
- 基于依存句法分析的语义角色标注,TP391.1
- 基于条件随机场模型的汉语框架语义角色自动标注研究,TP391.1
- 面向三维场景生成的中文语义角色标注方法研究,TP391.1
- 基于汉语框架网的问句语义角色标注研究,TP391.1
- 基于支持向量机的汉语框架语义角色自动标注,TP391.1
- 基于最大熵模型的汉语框架语义角色自动标注,TP391.1
- 中文复杂句语义角色标注,TP391.1
- 语义角色标注中的关键技术研究,TP391.1
- 基于结构学习的语义角色标注,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|