学位论文 > 优秀研究生学位论文题录展示
语义网自动构建中句法分析的研究
作 者: 杨雪娇
导 师: 王宏生
学 校: 沈阳工业大学
专 业: 计算机应用技术
关键词: 汉语句法分析 PCFG模型 句法树 语义网
分类号: TP391.1
类 型: 硕士论文
年 份: 2012年
下 载: 45次
引 用: 0次
阅 读: 论文下载
内容摘要
随着语义网研究的不断发展,对自然语言的机器理解提出了更高的要求,作为其基础技术之一的句法分析成为研究的热点。准确构建语义网的核心问题是如何排除句法分析结果中的歧义结构。概率上下文无关(PCFG)模型是一种新型的句法分析模型,该模型执行效率高,分析结果准确,利用PCFG模型对语句的句法结构进行分析能有效的实现分析结果的排歧。本文基于Cocke、Kasami和Younger提出的句法分析算法(CYK算法),利用PCFG模型完成了句法分析算法的优化,同时为CYK算法构建句法树过程中使用的规则库进行重构,为该规则库中的每条规则添加一个概率值,在句法分析过程中通过概率值选择所需要的规则和处理的语句进行匹配,从而达到语句结构排歧的目的。论文首先通过分词模块进行语句分词和词性标注,接着对初始化完成的词串进行句法分析。采用Java语言将ICTCLAS4J系统生成分词和词性标注的接口,读取了ICTCLAS4J的词性标注文件,并将该文件的数据结构转换为对应的Java数据结构。在句法树的生成过程中,采用二维数组来存储和显示算法生成的句法分析结构。对CYK算法与PCFG模型之间的关系进行分析,采用概率计算的有效形式,利用Inside-Outside算法来对句法树构建中的规则进行匹配,并采用Java语言提供的Swing组件设计并实现句法分析的系统界面。此外,论文通过PARSEVAL测评方式对系统的性能进行了评价。本文采用Java语言开发了具有语义分析功能的汉语句法分析系统,通过对简单句进行分析处理,得到了较为准确的分析结果,实验结果表明本文在理论上是可行的,系统在实现上是有效的,具有进一步研究的价值。
|
全文目录
摘要 5-6 Abstract 6-9 第一章 绪论 9-18 1.1 研究背景及意义 9-12 1.2 国内外句法分析的概况 12-16 1.2.1 国外句法分析概况 12-14 1.2.2 国内句法分析概况 14-16 1.3 论文的研究工作 16-18 第二章 句法分析的方法 18-27 2.1 句法分析概述 18-20 2.2 句法分析的主体内容与基本功能 20-21 2.2.1 句法分析的主体内容 20-21 2.2.2 句法分析的基本功能 21 2.3 句法分析技术的主要方法 21-23 2.3.1 规则匹配的方法 21-23 2.3.2 规则的概率统计的方法 23 2.4 分析算法的概述和分类 23-27 2.4.1 分析算法的概述 24-25 2.4.2 主要分析算法的分类 25-27 第三章 句法分析的模型 27-42 3.1 句法分析的概率模型 27-30 3.1.1 概率模型 27-28 3.1.2 初始概率的计算方法 28-30 3.2 语法规则的概率获取方法 30-31 3.3 结构信息同现的概率计算 31-32 3.4 算法的原理与实现 32-42 3.4.1 算法原理概述 32-33 3.4.2 规则库的说明与应用 33-37 3.4.3 算法的实现过程 37-42 第四章 汉语句法分析系统的设计 42-47 4.1 传统PCFG 模型 42-43 4.2 系统的开发框架 43-45 4.2.1 系统的设计要求 43-44 4.2.2 系统结构的设计 44-45 4.3 系统的详细设计 45-47 4.3.1 系统模块的描述 45 4.3.2 系统功能的设计 45-47 第五章 汉语句法分析系统的实现 47-59 5.1 汉语句法分析系统的实现 47-51 5.1.1 开发环境 47 5.1.2 系统的主界面 47-51 5.2 系统的数据处理 51-52 5.3 系统性能的评价 52-55 5.4 句法分析程序 55-59 第六章 结论 59-60 参考文献 60-63 在学研究成果 63-64 致谢 64
|
相似论文
- 基于大规模模糊RDF数据的推理引擎,TP181
- AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
- 基于语义网的设备知识管理,TP391.1
- 结合WordNet的领域语义标注研究,TP391.1
- 基于本体的知识管理系统的设计与实现,TP311.52
- 描述逻辑归结推理的研究,TP18
- 移动式社会化网络服务的研究与实现,TP393.09
- 基于语义网的教学资源管理系统关键技术研究,TP311.52
- 基于对象语义的图像检索,TP391.41
- 基于语义目录的个人图书管理系统,TP315
- 一种基于语义标注的个性化搜索技术的研究与实现,TP391.3
- 基于语义网格的异构资源集成关键技术研究,TP393.09
- 基于语义网的教学资源本体的可视化研究,TP391.1
- 分布式环境下的语义查询推理,TP311.13
- 面向语义关系发现的本体映射技术研究与实现,TP391.1
- 基于OWL-S的Web服务发现框架研究,TP393.09
- 结构化数据的自然语言接口技术研究,TP311.13
- 基于动词次范畴化的汉语句法分析后处理方法的研究,TP391.1
- 语义网中基于相似度计算的本体映射研究,TP391.1
- 基于语义Web服务的个性化网络学习资源服务系统构建研究,G434
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|