学位论文 > 优秀研究生学位论文题录展示
融合FAQ、本体和推理技术的问答系统研究
作 者: 张巍
导 师: 陈俊杰
学 校: 太原理工大学
专 业: 计算机应用技术
关键词: 自然语言处理 信息检索 问答系统 本体 受限领域
分类号: TP391.1
类 型: 博士论文
年 份: 2011年
下 载: 209次
引 用: 0次
阅 读: 论文下载
内容摘要
互联网技术已经给人类社会带来翻天覆地的变化,人们已经习惯于从互联网上获取各类信息,这得益于搜索引擎技术的发展。然而,搜索引擎仍然有一些问题没有解决。首先是用户检索时,相关信息返回太多且不精确,其次是检索只能按关键字进行匹配,实际上并不能精确表达人们的检索需求。由于以上问题的存在,问答系统应运而生。问答系统允许用户以自然语言方式进行提问,系统返回的是简洁的答案。由于基于web的问答系统,不足以专注于研究语义理解在问答系统中的应用。因此本文选择特定领域,结合FAQ(常问问题库)和本体知识库的问答策略,针对问句处理、答案抽取、语义推理等问答系统的主要技术进行深入的研究。本文的主要内容和创新点如下:1、为了提高问答系统的性能,提出了一种多策略混合的问答系统模型,结合FAQ库和本体知识库问答技术的优势,实现了以此为框架的受限领域问答系统。对于常见的问题,本系统首先采用策略一:用户输入问句和FAQ库问句匹配技术实现问答;对于特定的领域知识采用策略二:构建领域本体库,浅层语义分析和SPARQL查询技术实现。浅层语义分析通过语义块定义规则和语义块判定规则,生成了问句向量。再用SPARQL查询技术进行本体库的查询。少量无法回答的问题采用策略三:人工回答或者返回相关网页等方式回答用户提问。实验结果表明,这种多策略混合的问答系统比采用单一策略更能够有效地提高系统的召回率,准确率以及F测度值。2、为了检索专业领域的知识,构建了医院领域本体库,提出了一种基于医院信息本体库的问答系统答案抽取方法。首先建立医院信息本体库然后使用浅层语义分析技术对问句进行分析,识别出问句的未知及已知信息,最后生成问句向量。接着使用SPARQL查询技术从本体库中进行查询,从而返回答案。这样有效地提高了对专业领域知识提问而返回的答案召回率,因而改善了系统的性能。3、为了提高问答系统的召回率,扩充本体知识库,提出了一种用于问答系统中进行推理的Jena推理方法。首先构建推理规则,然后把这些规则加入到Jena推理机中。再将推导的结果加入到知识库,从而扩充了知识库。这样可以使一些在本体库中查找不到的答案,能够通过Jena推理而得到答案,从而可以提高问答系统的召回率。另外,为了挖掘出医院本体中的一些隐含信息,提出了一种用于问答系统中进行推理的SWRL描述推理规则并结合Jess推理引擎的推理方法。实验表明,这种方法可以使计算机拥有一定的症状推理能力,从而扩展了问答系统的性能。4、将提出的问答系统模型用于医院领域中。通过应用,可以验证本课题的相关技术和算法。经实验测试,本系统具有较高的准确率和召回率,因此本文对自动问答系统的设计和应用做了有价值的研究。
|
全文目录
摘要 3-5 ABSTRACT 5-8 目录 8-12 图索引 12-16 表索引 16-17 符号说明 17-19 第一章 绪论 19-29 1.1 课题背景及研究意义 19-22 1.1.1 课题背景 19-21 1.1.2 研究意义 21-22 1.2 问答系统国内外研究现状 22-23 1.3 论文研究内容及创新之处 23-26 1.4 本文结构 26-27 1.5 本章小结 27-29 第二章 本体相关研究及医院领域本体的构建 29-43 2.1 本体语言简介 29-31 2.1.1 本体的概念 29-30 2.1.2 本体描述语言OWL 30-31 2.2 "医院"领域本体的构建 31-36 2.2.1 医学知识的特点 31-32 2.2.2 利用Protege构建"医院"领域本体 32-36 2.3 实验及结果分析 36-42 2.3.1 本体构建实验 36-39 2.3.2 本体推理实验-阿莫西林与抗感染药推理过程 39-42 2.3.3 实验结果分析 42 2.4 本章小结 42-43 第三章 面向FAQ库的问答策略 43-63 3.1 问题库的建设 43-45 3.2 基于常问问题集的问答策略分析 45-55 3.2.1 索引表的建立 46-47 3.2.2 句子相似度计算策略1—基于统计和语义的方法 47-51 3.2.3 句子相似度计算策略2—基于依存句法和改进编辑距离的方法 51-55 3.2.4 FAQ库的更新 55 3.3 实验及结果分析 55-61 3.3.1 实验评测标准 55-56 3.3.2 实验结果及分析 56-61 3.4 本章小结 61-63 第四章 面向本体知识库的问答策略 63-79 4.1 本体知识库问答模块概述 63 4.2 问句浅层语义分析 63-73 4.2.1 语义块定义规则 65-69 4.2.2 问句向量 69-71 4.2.3 语义块的判定 71-72 4.2.4 语义块冲突的处理 72-73 4.3 问句处理实验结果及分析 73-74 4.4 本体查询模块答案的抽取 74-76 4.5 实验及结果分析 76-77 4.6 面向本体知识库的问答策略的不足与展望 77-78 4.7 本章小结 78-79 第五章 Jena推理及在问答系统中的应用 79-91 5.1 推理机研究 79-81 5.1.1 推理机的功能 79 5.1.2 本体推理机 79-81 5.2 Jena研究 81-84 5.2.1 Jena及其结构 81-83 5.2.2 Jena2推理机 83-84 5.3 实验设计及实现 84-89 5.3.1 Jena推理实验一 84-87 5.3.2 Jena推理实验二 87-89 5.3.3 实验结果分析 89 5.4 本章小结 89-91 第六章 SWRL及Jess推理在问答系统中的应用 91-105 6.1 SWRL架构及表示方式 91-92 6.2 基于本体的SWRL及Jess推理系统框架 92-93 6.3 推理系统的实现框架 93-94 6.4 推理过程 94-98 6.4.1 SWRL规则的建立 94-98 6.4.2 SWRL规则及OWL本体知识转换 98 6.5 实验及结果分析 98-103 6.5.1 在Protege3.4.1环境下的实验 99-101 6.5.2 在MyEclipse环境下的实验 101-103 6.5.3 实验结果分析 103 6.6 本章小结 103-105 第七章 城域医院问答检索系统的实现 105-111 7.1 系统的构建意义 105 7.2 系统设计原则 105-106 7.3 系统总体结构 106-107 7.4 系统实现与分析 107-110 7.5 本章小结 110-111 第八章 结论 111-115 8.1 本文工作总结及创新 111-112 8.2 下一步的研究工作 112-115 参考文献 115-121 致谢 121-123 攻读学位期间发表的学术论文目录 123-125 攻读学位期间主持和参与的科研项目 125-127
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
- 普适计算下智能空间的哲学探究,N02
- 针对教育视频的虚拟学习社区设计与实现,G434
- 企业级软件组件质量保障与快速部团策略的研究,TP311.53
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|