学位论文 > 优秀研究生学位论文题录展示

基于规则抽取的汉语语块识别

作 者: 王呈艳
导 师: 李新福
学 校: 河北大学
专 业: 计算机软件与理论
关键词: 汉语功能块识别 汉语基本块识别 词性 决策树 语义消歧
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 53次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语块可用于自然语言处理领域中,其中包括信息抽取、问答系统、语句相似度的比较等应用系统研究中,也可以应用于句法分析。并在这些领域中发挥了重要的作用。本文主要从句法分析的角度以基于规则的方法为出发点来对汉语功能语块进行识别,这种方法根据词性在句法分析中所起的作用来区分不同的功能语块,以标注显示句子的结构骨架。这种方法相比较于其它方法所选择的特征少,识别的速度快,同时提高了对多动词连用结构的识别率。此后又用决策树的方法对汉语功能语块进行识别,这种方法不需要人工抽取规则,在一定程度上提高了识别率。对于汉语基本语块,根据词汇之间的关联信息,语义关系以及句法形式来确定汉语基本语块。对汉语基本语块的识别,采用了规则抽取和统计相结合的方法,有效地提高了识别率。这种方法使汉语基本语块有很强的内聚性,把句法形式与语义内容关联起来,同时也考虑到了语义消歧,在一定程度上避免了歧义的发生,补充了单纯依靠置信度进行消歧的缺陷。

全文目录


摘要  5-6
Abstract  6-9
第1章 引言  9-14
  1.1 研究背景和意义  9-10
    1.1.1 浅层句法分析  9
    1.1.2 Abney 的组块分析体系  9-10
  1.2 国内外的研究现状及分析  10-13
  1.3 本文的工作及组织结构  13-14
第2章 语块识别方法  14-21
  2.1 基于统计的方法  14-16
    2.1.1 基于隐马尔科夫模型(HMM)的方法  14
    2.1.2 互信息方法  14-15
    2.1.3 χ~2 统计方法  15
    2.1.4 基于中心词依存概率的方法  15-16
  2.2 基于规则的方法  16
  2.3 语法规则的自动学习  16
    2.3.1 基于转换的规则学习方法  16
    2.3.2 基于实例的规则学习方法  16
  2.4 基于机器学习的方法  16-20
    2.4.1 支持向量机  17-18
    2.4.2 基于属性的异常点检测  18
    2.4.3 决策树  18-20
  2.5 本章小结  20-21
第3章 汉语功能语块和基本语块的识别  21-33
  3.1 汉语功能语块  21-22
  3.2 汉语基本语块  22
  3.3 汉语功能语块的识别  22-28
    3.3.1 基于词性规则的汉语功能语块的识别  22-26
    3.3.2 决策树识别汉语功能语块的方法  26-28
  3.4 汉语基本语块的识别  28-32
  3.5 本章小结  32-33
第4章 实验结果及分析  33-42
  4.1 实验数据  33
  4.2 评估函数  33-34
  4.3 实验结果及分析  34-37
  4.4 汉语语块的一些结果实例  37-41
  4.5 本章小结  41-42
第5章 结论与展望  42-44
  5.1 工作总结  42-43
  5.2 后续工作展望  43-44
参考文献  44-46
致谢  46-47
攻读学位期间取得的科研成果  47

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 教学质量评估数据挖掘系统设计与开发,TP311.13
  3. 《汉语水平词汇等级大纲》甲级词汇词性标注研究,H146
  4. 基于SCOT的语义标签推荐模型及算法研究,TP391.3
  5. 基于学生评教数据挖掘与教学质量分析系统的研究,TP311.13
  6. 基于粗糙集理论的决策树分类算法与应用研究,TP18
  7. 基于核心示例集的属性约简方法研究,O159
  8. 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
  9. 基于意见挖掘技术的网购评论倾向性分析的研究与应用,TP393.09
  10. 基于改进的ID3算法的蛋白质纯化方法研究,Q51
  11. 五种决策树算法的比较研究,TP311.13
  12. 信用卡风险管理技术及利润预测模型,F224
  13. 汉语语音合成系统的改进与实现,TN912.33
  14. 面向专利领域的中文文本分类与检索方法研究,TP391.1
  15. 中国15岁以上人群乙型肝炎免疫预防的决策分析模型研究,R392.1
  16. 广州市乙肝相关疾病经济负担及1~14岁人群乙肝疫苗接种策略研究,R186
  17. 数据挖掘在研究生调剂中的应用研究,TP311.13
  18. 基于决策树分类算法的Web文本分类研究,TP391.1
  19. 基于决策树的短期负荷预测系统研究与实现,TM715
  20. 航次知识发现及其应用研究,F552.6
  21. 某型主动雷达制导导弹的通用自动测试设备研究,TJ760.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com