学位论文 > 优秀研究生学位论文题录展示

动词次范畴化驱动的汉语句法分析

作 者: 刘春阳
导 师: 韩习武
学 校: 黑龙江大学
专 业: 计算机应用技术
关键词: 规则特征 统计特征 动词次范畴化 汉语句法分析
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 43次
引 用: 0次
阅 读: 论文下载
 

内容摘要


句法分析是自然语言处理领域的一个关键性问题,句法分析的任务就是根据给定的语法自动推导出句子的语法结构。句法分析性能的提高对机器翻译、信息检索、信息抽取、语音处理等应用产生重要的推动作用。汉语的句法分析技术是中文信息处理的基础,由于汉语在语法上独有的一些特点,对汉语的分析造成了一定的影响,使我们不能照搬现成的像英语句法分析的方法,要从汉语自身特点出发,研究适合汉语的句法分析技术。对汉语句法分析的研究将对自然语言处理的各种问题提供帮助,是解决自然语言理解的重要手段之一。本文首先简单介绍了句法分析的相关理论和相关技术,介绍了句法分析算法和模型。又简单介绍了动词次范畴化的概念以及形式化描写方式,以及汉语句法分析与动词次范畴化之间的关系,在此基础上提出了基于次范畴化规则的句法分析方法和基于次范畴化统计特征的汉语句法分析方法。我们在基于次范畴化规则的句法分析方法中引入了最大相似度的手段,提出了利用动词次范畴化信息对栈内规则的模式进行相似度匹配的方法实现了对汉语句子的句法分析;在基于统计的句法分析方法中应用了取概率平均值的措施,通过对栈内句法分析规则和次范畴化规则的概率取平均值的方法对汉语句子进行句法分析。我们通过上述两种方法得到的分析结果与基准方法相比有了很明显的提高。

全文目录


中文摘要  3-4
Abstract  4-7
第1章 绪论  7-14
  1.1 本文研究的目的和意义  7-9
  1.2 国内外相关研究现状  9-11
  1.3 本文的主要研究内容  11-12
  1.4 本文的结构安排  12-14
第2章 动词次范畴化理论和句法分析模型  14-34
  2.1 动词次范畴化基本理论  14-18
  2.2 动词次范畴化的形式化描写  18-19
  2.3 文法  19-21
  2.4 句法分析算法介绍  21-25
    2.4.1 CYK 算法  21-22
    2.4.2 Marcus 确定性分析算法  22
    2.4.3 Earley 算法  22-23
    2.4.4 Tomita 算法  23-24
    2.4.5 Chart 算法  24-25
  2.5 常用的统计句法分析模型  25-32
    2.5.1 概率型上下文无关模型  25-27
    2.5.2 基于历史的句法分析模型  27-28
    2.5.3 分层渐进式句法分析模型  28-29
    2.5.4 中心词驱动的统计句法分析模型  29-30
    2.5.5 四种模型的比较  30-32
  2.6 次范畴化与句法分析规则选择的关系  32-33
  2.7 本章小结  33-34
第3章 基于次范畴化规则的句法分析  34-45
  3.1 引言  34-35
  3.2 次范畴化规则的特征提取  35-36
  3.3 基于次范畴化规则的汉语句法分析的实现过程  36-40
  3.4 句法分析评测标准  40
  3.5 系统测试和结果分析  40-44
  3.6 本章小结  44-45
第4章 基于次范畴化统计特征的汉语句法分析  45-57
  4.1 引言  45
  4.2 动词次范畴化特征的概率分布  45-46
  4.3 次范畴化统计特征的提取  46-48
  4.4 基于次范畴化统计特征的汉语句法分析的实现过程  48-51
  4.5 系统测试和结果分析  51-53
  4.6 两种句法分析方法的性能的比较  53-55
  4.7 本章小结  55-57
结论  57-59
参考文献  59-65
附录1 汉语词类标记集  65-67
附录2 句法功能结构标记集  67-68
附录3 语法规则示例  68-70
附录4 汉语动词次范畴化信息提取示例  70-71
致谢  71-72
攻读学位期间发表的学术论文  72

相似论文

  1. 用于检索的人脸特征提取与匹配算法研究,TP391.41
  2. 民族面部特征提取及其识别算法研究,TP391.41
  3. P2P流媒体特征提取技术研究与实现,TN919.8
  4. 语义网自动构建中句法分析的研究,TP391.1
  5. 基于动词次范畴化的汉语句法分析后处理方法的研究,TP391.1
  6. 汉英动词次范畴相关技术的研究,H042
  7. 堆石体物理力学特性及其工程应用研究,TD313
  8. 基于层叠条件随机场的汉语句法分析技术的研究,TP391.1
  9. 西北太平洋热带气旋强度的年际变化特征及其机理分析,P444
  10. 中国东部夏季中尺度对流系统和中尺度对流涡旋的特征,P458.121.1
  11. 基于Markov模型和隐Markov模型的三维模型分类研究,TP391.41
  12. 基于谱直方图及其相似性的纹理图像分割研究,TP391.41
  13. 适用于模板保护技术的三维人脸识别算法研究,TP391.41
  14. 居民地的提取与边缘优化,P237
  15. 近50年中国降水和温度的统计分析和海洋对其影响初步研究,P468
  16. 非织造布疵点检测研究,TP391.41
  17. 支持向量机及其应用于感应加热装置优化设计的研究,TP18
  18. 领导—下属人口统计特征的正向差异对心理契约破裂的作用机制研究,F224
  19. 基于复杂网络理论的电力系统网络模型及网络性能分析的研究,F407.61
  20. 僵尸网络异常流量分析与检测,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com