学位论文 > 优秀研究生学位论文题录展示
效应领域本体库自动填充方法研究
作 者: 付秋实
导 师: 马建红
学 校: 河北工业大学
专 业: 计算机应用技术
关键词: 效应 本体库 语义 自动填充 B-M-Onto 最大熵
分类号: TP391.1
类 型: 硕士论文
年 份: 2012年
下 载: 16次
引 用: 0次
阅 读: 论文下载
内容摘要
创新设计是企业能够不断发展不断进步的动力。创新原理和创新知识可以启发设计人员产生全新式的设计思路。效应表达的是科学原理,利用本体对科学效应进行表达更加规范且实现了对知识的推理,可以拓宽解决问题的途径,帮助设计人员进行产品的创新。但Protégé等本体编辑工具对本体的编辑和扩充需要大量的人为参与,人工录入和填充本体库耗时耗力,效率低。原有效应知识存储于关系数据库中,其表达内容不能满足效应本体库丰富的关系要求。本文提出了一种基于浅层语义分析和机器学习的方法,对已有效应信息进行进一步分析和抽取,并与本体库结构自动匹配,最终完成效应领域本体库的自动填充。本文主要研究内容如下:1对效应领域本体库的结构进行分析,获得自动填充效应本体库的标准格式和组成效应本体的关键概念,包括操作、输入流、输出流、输入流属性和输出流属性。2本文从原效应关系库抽取名称和说明字段进行浅层语义分析,依次经过切分单词、构建句法结构树、语义角色分析、语义角色分类特征抽取等过程。3本文提出B-M-Onto模型,该模型以最大熵模型为基础,以原效应关系库的语义分析结果为特征并引入自训练的机制,自训练的引入使该模型在小规模语料库下可以获得较好的语义角色分类效果,并对语义角色分类的结果与效应关键概念类别进行转化和匹配,最后调用Protégé-OWLAPI完成对效应原理的自动填充。4对整个自动填充过程进行实验分析,B-M-Onto模型完成了效应知识从关系数据库到本体库的自动填充,与传统最大熵分类在样本规模相同的情况下整体性能提高4%。本课题已成功应用于现有的本实验室开发的创新软件产品中,完成了效应知识从之前软件版本的关系数据库向当前版本的效应本体库的自动转化与填充功能。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第一章 绪论 8-11 §1-1 研究背景和意义 8 §1-2 相关基础及现状 8-9 §1-3 本文的主要研究内容 9 §1-4 本文的主要组织结构 9-11 第二章 效应领域本体库 EKB 简介 11-16 §2-1 本体 11-14 2-1-1 本体论概述 11-12 2-1-2 本体的建模元语 12 2-1-3 本体的描述语言—OWL 12-13 2-1-4 常用的本体处理工具 13-14 §2-2 效应领域本体库 14-16 2-2-1 效应领域本体库简介 14 2-2-2 效应领域本体库结构分析 14-16 第三章 浅层语义分析及信息提取 16-23 §3-1 浅层语义分析 16-20 3-1-1 词法分析 16-17 3-1-2 ICTCLAS 的分词流程 17-18 3-1-3 句法分析 18-19 3-1-4 Stanford-Parser 句法分析流程 19-20 §3-2 信息提取 20-23 3-2-1 最大熵模型介绍 20-21 3-2-2 最大熵算法描述 21 3-2-3 特征选择 21-23 第四章 改进的训练算法和填库 23-36 §4-1 基于 Bootstrapping 的学习方法 23-29 4-1-1 语义角色标注介绍 23-24 4-1-2 传统学习方法 24-25 4-1-3 Bootstrapping 概念介绍 25 4-1-4 B-M-Onto 流程 25-29 §4-2 本体库 EKB 的自动填充 29-36 4-2-1 效应领域本体库描述 29-31 4-2-2 效应信息作为概念对本体的填充 31-32 4-2-3 概念的对象属性集的填充 32-34 4-2-4 调用 Protégé-OWL API 流程 34-36 第五章 系统的具体实现及结果分析 36-44 §5-1 总体结构 36-37 §5-2 功能实现 37-40 §5-3 实验结果分析 40-44 5-3-1 数据源和评价方法 40 5-3-2 实验结果及分析 40-44 第六章 总结和展望 44-45 §6-1 论文总结 44 §6-2 论文展望 44-45 参考文献 45-47 致谢 47
|
相似论文
- 基于巨磁阻抗效应磁测传感器及地磁匹配算法研究,P318
- 煤制液体燃料过程中可弃型催化剂的设计与实验研究,TQ529.1
- 钛酸锶钡铁电薄膜的制备及电热效应,TB383.2
- 流动与混合过程中不可逆损失的研究,TK12
- 永磁同步电机转子初始位置估计,TM341
- HID灯整流效应的研究,TM923.32
- 文学语言的模糊修辞研究,H05
- 《左传》名词陈述化研究,H146
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 领域实体属性及事件抽取技术研究,TP391.1
- 人物言论抽取与跟踪技术研究,TP391.1
- 大豆疫霉RXLR效应分子靶标的筛选,S435.651
- 碳酸根柱撑水滑石的制备及结构重构性能研究,TQ424.2
- S-O-R模型的批判和预期效应的研究,B841
- 水葫芦对浮游动物群落及部分种群遗传结构的影响分析,X174
- 氯氟吡氧乙酸与莱茵衣藻的相互作用,S482.4
- 不同类型土壤中镍的生物富集特性及其对蚯蚓的毒性效应,X131.3
- 太湖地区水稻土有机碳空间表征尺度效应研究,S158
- 花前干旱锻炼对花后干旱逆境下小麦产量和品质形成的影响及其生理机制,S512.1
- 不同轮作制度稻田生态系统温室气体排放研究,S511
- 棉花间歇性土壤涝渍的产质效应及其生理基础研究,S562
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|