学位论文 > 优秀研究生学位论文题录展示

基于双向搜索的ILP算法构建汉语语义自动切分系统

作 者: 许中卫
导 师: 吴建国
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 自然语言理解 语义切分 切分器构建 论旨角色 控制规则 评估函数 束搜索
分类号: TP391.1
类 型: 博士论文
年 份: 2006年
下 载: 180次
引 用: 0次
阅 读: 论文下载
 

内容摘要


自然语言理解主要有两种途径。一种是利用各种语言规则对自然语句进行分析,得到句中各组成成分间的关系结构。另一种是基于数据分析方法,被称为自然语言理解中的“经验主义”,或称实证方法,它主要是利用大规模的语料库,采用概率的方法得到各语言现象共存的概率,在分析新语料时以共存概率的大小来确定语言成分之间的关系。基于规则的理性方法,本质是一种确定性的演绎推理方法。其优点在于根据上下文对确定事件的定性描述,能够充分利用现有的语言学成果。缺点是对一些不确定的事件则无能为力,同时规则的相容性和适应性也存在着限制。基于统计的方法是一种经验主义的方法,其优势在于它的全部知识都是通过对大规模的语料库加工分析而得到的,可以获得很好的一致性和覆盖性。基于统计的方法是一种非确定性的定量分析方法,这种定量分析是基于概率的,因此必然会掩盖小概率事件的发生。本文考察一种新的实证途径,采用结构化的知识表示,应用ILP方法解决自然语言语句切分分析器的获取问题。 自然语言语义结构的分析是自然语言理解的基础,可分为二个层次,其一是研究能充分表达自然语句内各成份间语义关系的表示方法;其二是研究如何将自然语句转换成某种期望的语义表示形式,即在自然语言语句和其对应的语义表示间建立正确的映射,完成这种映射也称为自然语言语句的语义切分分析,这也是本文研究的重点之一,本文给出了一种基于ILP算法的自动语义切分器的构建系统ICASP,并通过一个切分示例来说明ICASP构建的切分器将自然语句映射成论旨角色语义表示的方法途径。论旨角色语义分析的基本思想是:在句中起中心作用的动词,同参与动作的各个成分个体一起构成句子的“语义格”框架,以此描述自然语句中各组成成分间的深层语义关系,表达施事(谁做的)、受事(对谁做的)、工具(用什么工具)等概念所表示的语法语义关系。 “切分”一词常用来表达将句子转换成能够明确描述句子语法关系的一种层次结构,依据某一上下文无关文法,自然语句可能可被切分为由句子成分加入适当的标注组成的层次结构,然而局限在语法结构上的切分只是自然语言语句理解

全文目录


中文摘要  4-6
英文摘要  6-11
第一章 绪论  11-19
  1.1 自然语言理解  11-12
  1.2 基于ILP构建语义自动切分系统  12-14
  1.3 归纳逻辑程序设计技术  14-17
  1.4 研究内容及论文安排  17-19
    1.4.1 本文的主要研究内容  17
    1.4.2 本文的结构及内容安排  17-19
第二章 自然语言理解基础  19-34
  2.1 自然语言理解概述  19-21
  2.2 国外关于自然语言理解方面的研究  21
  2.3 汉语的特点及理解过程中的难点  21-22
  2.4 国内关于自然语言理解方面的研究  22-23
  2.5 语义分析  23-31
    2.5.1 语义文法  23-24
    2.5.2 格语法  24-25
    2.5.3 语义网络文法  25-26
    2.5.4 蒙塔格文法(MG理论)  26-27
    2.5.5 概念从属理论(CD理论)  27-31
  2.6 基于ILP算法构建语义切分系统  31-33
  2.7 本章小结  33-34
第三章 构建语义自动切分系统  34-56
  3.1 控制规则学习  35-38
  3.2 用ICASP进行切分归纳  38-42
    3.2.1 “移出-合并”切分分析  39-41
    3.2.2 ICASP系统结构  41-42
  3.3 论旨角色映射  42-48
    3.3.1 菲尔摩格语法  43-45
    3.3.2 使用格语法进行语义分析:格框架约束分析技术  45-47
    3.3.3 基于“移出-合并”操作的语义切分分析方法  47-48
  3.4 ICASP的各阶段  48-53
    3.4.1 切分操作的生成  48-49
    3.4.2 示例分析  49-52
    3.4.3 归纳学习控制规则  52
    3.4.4 精化初始切分器  52-53
  3.5 实验测试及分析  53-55
  3.6 本章小结  55-56
第四章 归纳逻辑程序设计  56-72
  4.1 ILP发展简要回顾  56-58
  4.2 一阶逻辑中的基本定义  58-60
  4.3 ILP的标准问题环境  60-62
  4.4 ILP的理论研究  62-64
    4.4.1 ILP的语义理论  62
    4.4.2 ILP的计算理论  62-63
    4.4.3 ILP的证明理论  63-64
  4.5 ILP的算法框架  64-69
    4.5.1 基于逆归结的归纳逻辑程序设计  65-67
    4.5.2 基于逆蕴含的归纳逻辑程序设计  67-69
    4.5.3 基于生成再测试的序列覆盖算法  69
  4.6 基于双向搜索的ILP算法  69-70
  4.7 本章小结  70-72
第五章 双向搜索学习一阶规则  72-96
  5.1 自顶向下搜索的FOIL算法  73-74
  5.2 自底向上搜索的GOLEM算法  74-75
  5.3 ICCR算法概述  75-77
  5.4 构建一般化子句  77-83
    5.4.1 初始一般化  78-79
    5.4.2 增加前件  79-81
    5.4.3 发明新谓词  81-82
    5.4.4 处理递归  82-83
  5.5 基于绑定的规则评估函数  83-92
    5.5.1 规则空间的结构化  83-86
    5.5.2 基于绑定的规则评估函数  86-89
    5.5.3 等价规则的信息赢取  89-92
  5.6 实验测试及分析  92-94
  5.7 本章小结  94-96
第六章 束搜索算法精度优化  96-105
  6.1 启发式搜索  96-97
  6.2 启发式搜索算法基本框架  97-98
  6.3 束搜索算法  98-99
  6.4 束搜索精度优化方法  99-101
    6.4.1 基于成员序号的选择方式  100
    6.4.2 基于聚类的侯选成员选取算法  100-101
    6.4.3 避免单亲填满现象  101
  6.5 实验测试及分析  101-103
  6.6 本章小结  103-105
第七章 总结及进一步工作  105-107
  7.1 本文主要创新点  105-106
  7.2 进一步工作  106-107
参考文献  107-114
致谢  114-115
攻读学位期间发表的学术论文  115

相似论文

  1. 面向领域的数据库问答系统关键技术研究,TP311.13
  2. 六子棋中基于BP-TD学习的局面估值方法研究,TP18
  3. 主观题自动评分技术研究,TP391.1
  4. 中国象棋博弈树搜索算法研究与实现,TP391.3
  5. 基于增强学习的计算机博弈策略的研究与实现,TP18
  6. 基于混合元胞自动机方法的结构拓扑优化研究,O342
  7. 建筑图中有限自然语言的分析与理解的研究,TU204
  8. 对我国企业管理过程中内部控制体系建设的思考,F272
  9. 基于自然语言理解的3D场景构造研究,TP391.41
  10. 以动词为逻辑驱动的中文信息处理系统的建设,TP391.1
  11. 基于控制规则的业务流程建模方法的研究,TP393.09
  12. 农业信息网,TP393.02
  13. 辽阳职业技术学院某精品课程网站及其网络考试系统的设计与实现,TP311.52
  14. 电熔镁炉新型控制系统研究与开发,TF355.2
  15. 中国象棋计算机博弈评估函数与开局库研究,TP18
  16. 六子棋机器博弈研究与开发,TP18
  17. 基于概念扩展的中文问答系统模型研究,TP391.1
  18. 基于HNC理论的句子语义分析,TP391.1
  19. 基于实例语境的语音识别后文本检错与纠错研究,TN912.34
  20. 基于结构学习的语义角色标注,TP391.1
  21. 基于智能算法的六子棋博弈行为选择的应用研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com