学位论文 > 优秀研究生学位论文题录展示

基于Ontology的领域知识库层次分类体系的构建

作 者: 于楠
导 师: 朱靖波
学 校: 东北大学
专 业: 软件工程
关键词: 本体 领域知识 领域知识库 知识表示 层次分类体系 文本分类
分类号: TP18
类 型: 硕士论文
年 份: 2005年
下 载: 502次
引 用: 5次
阅 读: 论文下载
 

内容摘要


在许多领域问题的研究中,领域知识都起到了不可忽视的作用。在文本的主题分析和内容分析中也不例外。领域知识是文本的主题分析和内容分析领域研究中应用的基础知识。如何构建领域知识库,如何让领域知识库在文本的主题分析和内容分析领域发挥出更好的作用就成为迫切的研究问题。 本体能够提供知识库建模所需的基本词汇并说明它们之间的关系。建立大型数据库的第一步就是设计相应的本体,这对整个知识库的组织至关重要。基于Ontology思想建立领域知识库,不仅可以清晰地描述领域知识库中的领域特征概念及其关系,还可以实现领域知识的共享和重用,有利于领域知识库的维护。在构建领域知识库的过程中,领域知识库的层次分类体系的构建工作就成为我们重点要研究的内容之一。 本文研究了领域知识库的定义、领域知识的表示等问题,重点研究和讨论了如何在Ontology思想的指导下构建领域知识库,从而建立领域知识库的层次分类体系。 近年来,互联网上的文档资源日益丰富,迫切需要一个有效的文本分类系统来帮助人们自动收集和管理各种文档。文本分类的目的在于对文档自动分类。在信息技术高速发展的今天,文本分类具有广泛的应用前景和较高的实用价值。但是,现有的文本分类系统仍然存在很多问题。 在领域知识库的基础上,我们对领域知识在文本分类中的应用进行了一些尝试性的研究工作。我们提出将领域知识应用于文本特征表示的两种方法。第一种表示:用领域知识库中的领域特征概念作为文本的特征;第二种表示:用领域知识库中的领域特征属性作为文本的特征。 实验结果表明,利用领域知识作为文本特征,可以有助于增强文本特征的表达能力,并降低文本特征空间维数,从而大大改善文本分类的性能。引用自划分学习模型可以帮助我们学习出新的领域特征概念,从而获取新的领域特征属性。那么,领域专家就可以利用新学习到的领域知识扩充领域知识库。这种领域知识与学习模型相结合的方法不仅可以提高文本分类的性能,还可以大大减少构建领域知识库的人工劳动量,提高工作效率。

全文目录


独创性声明  4-5
摘要  5-7
Abstract  7-11
第一章 前言  11-24
  1.1 课题的背景  11-12
  1.2 课题的研究现状  12-20
  1.3 课题的来源及研究的目的和意义  20-21
  1.4 课题的主要研究内容  21-22
  1.5 本文的组织结构  22-24
第二章 领域知识库  24-34
  2.1 知识的定义  24-26
  2.2 领域知识库的定义  26
  2.3 领域知识库的特色  26-27
  2.4 领域知识库的两个基本概念  27-28
  2.5 领域知识库建设的方法  28-29
  2.6 领域知识库的领域知识表示  29-34
第三章 基于Ontology构建领域知识库的层次分类体系  34-52
  3.1 本体论  34-44
    3.1.1 本体的定义  34-35
    3.1.2 本体的分类  35-36
    3.1.3 本体的建模元语  36-37
    3.1.4 本体的理论研究  37-38
    3.1.5 本体建模的优点  38-39
    3.1.6 本体建模的方法  39-43
    3.1.7 本体在自然语言处理领域里的应用  43-44
  3.2 基于本体构建领域知识库的层次分类体系  44-48
  3.3 领域知识库层次分类体系的实例  48-52
第四章 领域知识在文本分类中的应用  52-65
  4.1 领域知识库  52-54
  4.2 文本的特征选取  54-57
    4.2.1 领域特征概念作为文本特征  55
    4.2.2 领域特征属性作为文本特征  55-56
    4.2.3 领域特征属性和机器学习相结合的文本特征表示  56-57
  4.3 自划分模型  57-60
    4.3.1 定义  57-58
    4.3.2 相似度计算  58
    4.3.3 自划分模型算法  58-60
  4.4 实验与分析  60-62
    4.4.1 评价方法  60
    4.4.2 实验语料  60-61
    4.4.3 实验结果  61-62
  4.5 讨论  62-65
第五章 结束语  65-67
参考文献  67-71
致谢  71-72
攻硕期间参加的科研项目和发表的论文  72

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 基于仿生模式识别的文本分类技术研究,TP391.1
  3. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  4. 哲学思想在指导中学数学教学中的作用,G633.6
  5. 基于本体的语义检索研究,TP391.3
  6. 不同人群本体感觉差异性比较及脑机制研究,B845
  7. 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
  8. 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
  9. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  10. WordNet和《中国分类主题词表》的映射研究,G254
  11. 拉图尔的行动者网络理论研究,N02
  12. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  13. 基于数据分布特征的文本分类研究,TP391.1
  14. 220kV输电线路除冰机器人机械本体研究,TP242
  15. 基于本体的食品投诉文档文本聚类研究,TP391.1
  16. 关系数据库到RDF(S)映射方法的研究,TP311.13
  17. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  18. 基于语义的Web服务发现研究,TP393.09
  19. 本体在智能小区中的应用研究,TP391.1
  20. 基于领域本体的海洋环境数据仓库设计,TP311.13
  21. 数据空间中数据资源之间关联关系发现模型研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com