学位论文 > 优秀研究生学位论文题录展示
本体构建中概念和关系获取方法研究
作 者: 廖福燕
导 师: 董丽丽
学 校: 西安建筑科技大学
专 业: 计算机软件与理论
关键词: 本体 本体构建 组合词获取 概念获取 概念关系获取
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 83次
引 用: 0次
阅 读: 论文下载
内容摘要
本体(ontology)能够在语义和知识层次上对系统的概念模型进行描述,因而广泛的应用于信息检索、人工智能和知识管理等领域。由于人工构建本体的代价高昂,自动或半自动构建领域本体的学习方法成为本体研究的热点。本文针对领域本体自动构建过程中的两个主要问题:领域概念的提取和概念间关系的获取展开研究。主要工作进展如下:1)通过对本体相关理论的研究学习本体构建方法,对本体自动构建过程中的概念获取和概念间关系获取方法进行比较分析。2)提出了基于互信息与领域相关度的概念词提取方法,领域概念词通常是以组合词的形式出现,组合词是建立本体的首要步骤,利用互信息以及上下文依赖的方法提取组合词。领域概念词必须是领域相关的,在领域内广泛使用,并且在其他领域较少出现,论文通过分析概念词的领域相关度和领域一致度,实现概念词的获取。3)分别通过规则的方法和层次聚类算法实现分类关系的获取,并且对两种方法进行比较分析。采用基于关联规则的概念之间的非分类关系获取方法,计算概念对之间的关联度,设置阈值自动提取非分类关系概念对。通过实验证明了上述算法的可行性,将研究成果应用到基于本体的机械产品本体知识库的构建当中。本研究得到陕西省教育厅专项项目-“面向特定领域需求的概念设计方自动生成方案法研究(2010JK620)”支持。
|
全文目录
摘要 3-4 ABSTRACT 4-8 1 绪论 8-12 1.1 研究背景与意义 8-9 1.2 国内外研究现状 9-10 1.3 论文研究内容及组织结构 10-12 2 本体构建理论概述 12-26 2.1 本体概述 12-18 2.1.1 本体的定义 12-13 2.1.2 本体的类型 13-14 2.1.3 本体的构成 14-16 2.1.4 本体建模语言 16-17 2.1.5 本体构建原则 17-18 2.2 中文分词方法概述 18-20 2.2.1 正向最大匹配法(MM) 19 2.2.2 逆向最大匹配法(RMM) 19 2.2.3 双向匹配法 19-20 2.3 领域本体概念获取方法 20-23 2.3.1 基于语言学的方法 20-21 2.3.2 基于统计的方法 21-22 2.3.3 混合方法 22-23 2.4 领域概念间关系获取方法 23-26 2.4.1 层次聚类法 23 2.4.2 基于特征向量的方法 23 2.4.3 基于关联规则的方法 23-26 3 领域本体概念获取方法研究 26-42 3.1 语料预处理 26-28 3.1.1 构建专业词典 26-27 3.1.2 分词与标注 27 3.1.3 停用词过滤 27-28 3.2 基于互信息与上下文依赖的合成词提取方法 28-34 3.2.1 基于互信息合成词提取方法 30-31 3.2.2 基于上下文依赖的合成词提取方法 31-34 3.2.3 合成词提取算法描述 34 3.3 基于领域相关度和一致度的概念提取 34-37 3.3.1 领域相关度和领域一致度 34-36 3.3.2 领域概念筛选算法描述 36-37 3.4 实验结果与分析 37-42 3.4.1 建立语料库 37 3.4.2 合成词提取实验分析 37-39 3.4.3 领域概念词获取实验分析 39-42 4 领域本体概念关系获取方法研究 42-60 4.1 概念分类关系获取方法 42-50 4.1.1 基于包含原理概念分类关系获取 42-43 4.1.2 基于规则的概念分类关系获取 43-46 4.1.3 基于层次聚类的概念分类关系获取 46-50 4.2 概念非分类关系的获取方法 50-52 4.2.1 基于扩展关联规则的非分类关系获取方法 51-52 4.2.2 非分类关系获取算法描述 52 4.3 实验结果与分析 52-60 4.3.1 概念分类关系获取实验分析 52-57 4.3.2 概念非分类关系获取实验分析 57-60 5 总结与展望 60-62 5.1 工作总结 60 5.2 研究展望 60-62 致谢 62-64 参考文献 64-68 硕士研究生期间的研究成果 68 读硕士学位期间发表的论文 68 硕士学位期间参与的科研项目 68
|
相似论文
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
- 普适计算下智能空间的哲学探究,N02
- 企业级软件组件质量保障与快速部团策略的研究,TP311.53
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- 一种基于语义的建筑工程质量检测方法研究,TP391.1
- 基于本体的医学命名实体识别技术研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|