学位论文 > 优秀研究生学位论文题录展示
语义角色标注的集成策略的研究
作 者: 郑培祥
导 师: 赵瑞莲
学 校: 北京化工大学
专 业: 计算机应用技术
关键词: 语义角色标注 组块分析 随机梯度下降条件随机场 句法分析
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 21次
引 用: 0次
阅 读: 论文下载
内容摘要
自然语言理解的目的之一就是让计算机能够理解人类的语言,能够和人类进行无障碍的沟通。其中,语义角色标注的作为一种浅层的语义分析,.目标是分析句子的论旨结构,即在给定动词的基础上,识别出与该动词相搭配的论元,并对识别出的论元进行语义分类。在很多高层的自然语言处理的任务上,例如问答系统,信息抽取等,语义角色标注都得到了成功的应用。本文使用条件随机场作为机器学习的模型,针对原有句法分析的优点和缺点,提出了一种集成策略。该策略在精确度和召回率较高、提供信息相对简单的浅层句法分析的基础上,加入精确度、召回率较低但是提供信息比较丰富的完全句法分析的信息,集成了两种句法分析的优点。同时本文设计实现了浅层句法分析、语义角色标注和使用改进策略后的语义角色标注三个子系统。通过对子系统的实验结果对比分析后发现,语义角色标注系统在使用了集成策略后,无论在自动的句法分析的基础上还是在完全正确的句法分析的基础上,系统的性能都能取得明显的提高。尤其是在完全正确的句法分析上,F值提高10%以上,大大提高了系统的潜力。在句法分析性能进一步提高的情况下,使用集成策略的新系统的性能提升幅度相对与传统的系统会更大。
|
全文目录
摘要 4-6 ABSTRACT 6-12 第一章 绪论 12-18 1.1 背景及意义 12-16 1.1.1 课题背景 12-15 1.1.2 课题意义 15-16 1.2 本文的工作 16-18 1.2.1 本文的工作 16-17 1.2.2 本文的组织结构 17-18 第二章 浅层语义角色标注的研究现状 18-28 2.1 语义角色标注的基本概念 18-21 2.1.1 语义角色标注的定义 18 2.1.2 语义角色标注的语料 18-21 2.2 语义角色标注的研究现状 21-25 2.2.1 基于短语句法分析的语义角色标注的基本方法 21-23 2.2.2 基于依存句法分析的语义角色标注的基本方法 23-24 2.2.3 基于浅层句法分析的语义角色标注的基本方法 24-25 2.3 语义角色标注的评测方法 25-26 2.4 语义角色标注的国际评测 26-28 第三章 浅层句法分析系统 28-40 3.1 系统背景 28-32 3.2 系统概述 32-34 3.3 系统详细设计 34-36 3.3.1 序列标注模型 34 3.3.2 语料以及特征 34-36 3.4 实验结果与分析 36-37 3.5 本章小结 37-40 第四章 基于浅层句法分析的浅层语义角色标注 40-52 4.1 引言 40-41 4.2 的浅层语义角色标注 41-45 4.2.1 系统的结构 41-43 4.2.2 问题的定义 43-45 4.3 实验细节 45-50 4.3.1 系统结构 45-47 4.3.2 特征的选择 47-48 4.3.3 实验结果以及结果分析 48-50 4.4 小结 50-52 第五章 一种浅层语义角色标注的集成策略 52-60 5.1 引言 52-53 5.2 浅层语义角色标注集成策略 53-55 5.2.1 集成策略 53-54 5.2.2 句法分析器 54-55 5.2.3 特征系统 55 5.3 实验结果及分析 55-59 5.3.1 实验结果 55-57 5.3.2 实验分析 57-59 5.4 本章小结 59-60 第六章 结束语 60-62 6.1 本文的主要工作 60 6.2 进一步的工作 60-62 参考文献 62-66 致谢 66-68 攻读学位期间发表的学术论文 68-70 作者和导师简介 70-71 硕士研究生学位论文答辩委员会决议书 71-72
|
相似论文
- 基于句法特征的代词消解方法研究,TP391.1
- 面向统计机器翻译的解码算法的研究,TP391.2
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 语义网自动构建中句法分析的研究,TP391.1
- 基于空间句法分析的城市地价与合理用地结构关系研究,F224;TU984.113
- 基于马尔可夫逻辑网络的语义角色标注,TP391.1
- 统计机器翻译中层次短语翻译模型的研究与实现,TP391.2
- 基于贝叶斯分类方法的中文问句分类研究,TP391.1
- 基于数据库的自然语言查询技术研究与实现,TP391.1
- 基于知网和贝叶斯模型的词义消岐技术的研究,TP391.1
- 中文问答系统中问题分析关键技术的研究,TP391.1
- 基于条件随机场的汉语短语识别研究,TP391.1
- “二程语录”被动式研究,H146
- 汉语联合短语结构分析与识别,H146
- 基于领域词典的汉语语块分析的研究,TP391.1
- 否定标记“没有”的句法语义分析,H146
- “没A没B”格式分析,H146
- 结构化支持向量机学习方法及应用研究,TP18
- 新闻语料中名词短语识别的研究,TP391.43
- 基于情感分析的新闻浏览平台关键技术研究,TP391.1
- 基于主动学习的汉语依存树库构建,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|