学位论文 > 优秀研究生学位论文题录展示

俄语军事文本的局部语义分析

作 者: 周翰博
导 师: 易绵竹
学 校: 中国人民解放军外国语学院
专 业: 俄语语言文学
关键词: 自然语言处理 局部语义分析 语义语言 语义词典
分类号: H35
类 型: 硕士论文
年 份: 2007年
下 载: 94次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,随着计算技术的迅速发展,尤其是国际互联网的普及,人类社会的信息化程度越来越高。面对浩如烟海的信息,人们迫切希望在计算机上建立起一套能够理解人类自然语言的系统,以便进行快速、有效的信息处理。于是,以自然语言的自动化处理为主要研究内容的计算语言学就成为一门重要的新兴学科。这门学科的最终目的是要使计算机能够像人那样理解自然语言的语义。为了达到这个目标,对自然语言进行语义分析并研制语义算法就势在必行。实际上,自然语言文本的语义处理已经成为信息技术领域最迫切的任务之一。然而,从总体上看,语义分析技术还远不如语法分析、形态分析技术那样成熟,它尚处于探索的阶段。面向计算机的语义分析方法有很多种,但不管采用哪种方法都需要解决两个重要的问题:知识的获取以及句子的语义表征。总体而言,知识的获取方式主要包括从语义词典中获取和从大规模真实文本中获取这两种;句子语义的表征就是要把自然语言的语义信息映射为一种计算机能够理解的语义中介语。知识的获取方式直接决定了语义表征的方法和结果。本文将着重讨论基于语义词典的文本语义分析技术,这种方法最重要的两个环节就是设计语义语言和建立语义词典。本文的研究任务是利用语义分析技术实现对俄语军事文本的局部语义分析。为此,我们首先从理论上论证了对军事文本进行语义分析的可行性,然后用具体实例展示分析的结果,由此彰显军事文本语义分析技术的可操作性。我们期望此项研究能够有助于推动俄文信息计算机处理技术的相关理论问题的深入探讨,同时为俄语军事文本自动处理系统的设计与研发提供一些有益启示,这正是本文研究的理论意义和实用价值所在。本文研究的新意:首次运用局部语义分析技术处理俄语军事文本,将有助于为此类特殊文本的计算机处理提供一些新思路;通过论述自然语言的函数性,将对解决自然语言语义信息的形式化问题探索新的途径;从理论与应用两个方面论证俄语军事文本计算机处理的必要性和可行性,将为研制开发满足军队信息化建设需求的自然语言处理系统奠定较为坚实的基础;此外,文中还阐述了词汇语义编码和语义知识库建设的基本方略,以及在实用系统中嵌入人机对话模块以提高计算机处理性能的新见解。论文由绪论、第一章、第二章、第三章、第四章和结论六部分组成。绪论绪论部分首先概述在当今信息化时代自然语言处理技术的重要作用和地位,并简要描述本文所要研究的对象;然后论述自然语言处理的关键概念、工作流程、语义分析的地位、局部语义分析技术的特点及其应用等问题;最后对本文的研究对象——俄语军事文本的定义和特点以及选题动机加以扼要说明。第一章简述传统的语义分析技术这一章共分三节。首先,在概述部分根据获取知识的方式不同,将语义分析技术分为两类:经验主义和理性主义;随后考察语义分析技术的发展简史,简要剖析语义网络文法理论、逻辑表示语义理论、义素分析法、优选语义学、蒙塔格语法以及格语法等多种常见的语义分析方法,指出上述理论方法各自的优势与不足以及对于本文研究的启示;最后重点介绍俄罗斯的语义分析技术研究现状与应用前景。第二章语义语言语义语言是整个语义分析系统的理论基础。作为本文的重点章节,本章首先从计算机能否“理解”文本这一问题入手,分析语义语言在自然语言处理过程中的重要性及相关概念和特点;接着详细介绍语义语言的核心部分——基元函项,包括基元函项的概念、结构,常见的基元函项列表、基元函项中的辅助符号、句法信息的形式化描写方法,以及常见的时间函项、地点函项和逻辑函项的意义及其表达方法;最后论述语义语言的基础,即句法语义和词类语义的表征方法。第三章语义词典语义词典是整个语义分析系统的物质基础。本章分4小节论述语义词典的结构和内容:首先介绍现在比较流行的词汇语义资源研发技术,重点介绍《俄语词汇信息库》的内容和结构;然后从编纂语义词典的起点——词类语义入手,介绍各种词类在语义词典中的描写方法;最后着重介绍俄罗斯学者图佐夫研制的语义词典的语义层级结构和语义类别编码体系,并通过实例论证这种编码体系的优越性。第四章基于词典的语义分析器语义分析器是最终实现语义分析的工具。本章包括4个小节:首先,介绍语义词典的使用方法,指出在实际使用中语义词典被分解成语义-句法词典和语用词典两部分;接着,重点论述语义分析器对句子进行局部语义分析的过程,包括形态分析、逐词预处理、句子的组配三个步骤;然后从理论上说明语义分析器的应用范围,继而以军事文本语句为例,按照上述步骤对其进行语义分析,演示语义分析的全过程以及各分析步骤所得出的结果。结论综括全文的理论探索与实验模拟,我们得出以下4点认识:1)自然语言具有一定的函数性质,可以采用函数的方法实现对自然语言的形式化描写;2)语义词典在语义分析系统中占有重要的位置,一个语义分析系统质量的好坏,最终由语义词典决定;3)用计算机实现对俄语军事文本语句进行局部语义分析不仅具有重要的学术意义,而且具有广泛的实际应用价值;4)完全依靠计算机对文本进行语义处理的结果可能并不理想,应当在系统中添加人机对话的模块,以提高文本语义分析的性能。致谢:在论文的选题、撰写直到最后的定稿过程中,我的导师易绵竹教授认真指导,多次提出修改意见,对论文的质量要求甚严,倾注了大量的心血。导师对本学科研究热点的准确把握以及丰硕的研究成果,使本人在论文的撰写过程中受益匪浅;同时,他严谨的治学态度,精益求精的工作作风使我深受感动,成为我终生受用的财富。在此对尊敬的导师表示感谢。此外,郅友昌教授在论文的选题以及修改过程中提出了宝贵的意见,教育部语言文字应用研究所计算语言学研究室研究员冯志伟先生、中国科学院HNC研究院院长晋耀红博士及北京师范大学中文信息处理研究所苗传江博士对论文的结构、内容和论证方法等方面都提出了宝贵的建议,在此一并表示感谢。

全文目录


中文摘要  4-7
Автореферат  7-14
绪论  14-20
  0.1 概述  14
  0.2 自然语言处理  14-18
    0.2.1 概念  14-15
    0.2.2 自然语言处理的流程  15-16
    0.2.3 语义分析所处的地位  16
    0.2.4 局部语义分析的概念和地位  16-18
    0.2.5 自然语言处理的应用  18
  0.3 研究对象  18-19
    0.3.1 军事文本的定义和特点  18-19
    0.3.2 选择军事文本的目的  19
  0.4 论文框架  19-20
第一章 简述传统的语义分析技术  20-26
  1.1 概述  20
  1.2 语义分析技术的发展  20-25
    1.2.1 语义网络理论  20-21
    1.2.2 逻辑表示语义的方法  21-22
    1.2.3 义素分析法  22-23
    1.2.4 优选语义学  23-24
    1.2.5 蒙塔格语法  24
    1.2.6 格语法  24-25
  1.3 小结  25-26
第二章 语义语言  26-42
  2.1 概述  26-27
    2.1.1 语义语言的概念  26
    2.1.2 语义语言的特点  26-27
  2.2 基元函项  27-35
    2.2.1 基元函项的概念  27-28
    2.2.2 常见的基元函项  28-32
    2.2.3 常见函项的定义  32-35
  2.3 语义语言的基础  35-41
    2.3.1 句法语义  35-41
    2.3.2 词类语义  41
  2.4 小结  41-42
第三章 语义词典  42-56
  3.1 语义词典  42-45
    3.1.1 语义词典的概念  42-43
    3.1.2 几种词汇语义知识资源  43-44
    3.1.3 俄语《词汇信息库》  44-45
  3.2 词类语义  45-51
    3.2.1 客体(名词)语义表示  46-48
    3.2.2 对客体的运算(形容词的表示)  48-49
    3.2.3 行为(动词的表示)  49-50
    3.2.4 对函数的运算(副词的表示)  50-51
    3.2.5 其它词类的语义  51
  3.3 图氏俄语语义词典  51-55
    3.3.1 基元概念词典分类表  52-54
    3.3.2 词典片段举例  54-55
  3.4 小结  55-56
第四章 基于词典的语义分析器  56-85
  4.1 语义词典的使用  56-57
  4.2 局部语义分析过程  57-77
    4.2.1 文本的预处理  60-68
    4.2.2 句子的组配方法  68-70
    4.2.3 各种词类的相互作用  70-77
  4.3 实例分析  77-83
  4.4 小结  83-85
结论  85-87
参考文献  87-89

相似论文

  1. 词义消歧语料库自动获取方法研究,TP391.1
  2. 学术主页信息抽取系统的研究,TP393.092
  3. 基于自然语言打印机人机交互方法研究与实现,TP11
  4. 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
  5. 基于话题的多文档文摘技术研究,TP391.1
  6. 基于丰富特征和多核学习的蛋白质关系抽取,Q51
  7. 基于WEB的社区智能医疗服务系统的研究,TP311.52
  8. AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
  9. 基于写作风格特征的论文剽窃检查优化方法研究,TP391.1
  10. 自然语言理解中并列名词歧义消解及其在智能仪器设计领域的应用,TP391.1
  11. 面向自然语言处理的汉语句子语义知识库构建研究,H13
  12. 筛选规则智能化生成的研究与设计,TP393.08
  13. 基于统计NLP技术的甲骨卜辞的分析研究,TP391.1
  14. 面向网络知识服务的医疗信息分类方法,TP391.1
  15. 基于叙词表的领域本体构建方法研究,TP391.1
  16. 面向事件的多文档自动文摘研究,TP391.1
  17. 基于语义词典和局部分析的查询扩展研究,TP391.3
  18. 用例图到顺序图转换的研究,TP311.52
  19. 基于数据库的自然语言查询技术研究与实现,TP391.1
  20. 基于知网和贝叶斯模型的词义消岐技术的研究,TP391.1
  21. 主观题辅助评分方法的研究与应用,TP391.1

中图分类: > 语言、文字 > 常用外国语 > 俄语
© 2012 www.xueweilunwen.com