学位论文 > 优秀研究生学位论文题录展示
基于受限域常问问答库的中文问答系统研究
作 者: 黄莉
导 师: 余正涛
学 校: 昆明理工大学
专 业: 模式识别与智能系统
关键词: 受限域问答系统 常问问答库 知网 领域知识库 问题分类 问句相似度
分类号: TP319
类 型: 硕士论文
年 份: 2007年
下 载: 193次
引 用: 1次
阅 读: 论文下载
内容摘要
问答系统为人们提供了自然语言的人机交互方式,相对于传统的关键词方式搜索引擎来说,其具有显著的优势。在受限域,基于常问问答库的问答系统在对问题答案的定位上,有更准确,快捷和高效的特点,在日常生活的各个领域,有着非常重要的应用前景,是当前研究的热点问题。本文围绕受限域FAQ汉语问答系统实现过程中的领域知识库构建,受限域FAQ的收集和组织,问句分类,相似问句的查找及答案提取等关键核心技术进行了一系列的研究和探讨,主要取得了以下较有特色的成果:(1)提出了在受限域中,构建“领域知网”知识库的方法。该方法利用领域知识的特点,借助本体思想与“知网”知识资源,构建了领域知识库,实现与常识知识库“知网”融合,领域知识库与常识知识库的结合为自然语言处理方面的研究提供了更有效的资源。(2)提出了一种利用领域知识特点来收集、组织和归类FAQ的方法。该方法在分析旅游领域知识特点的基础上,根据地域及问题类型等特征,实现了FAQ的收集和组织。(3)提出了一种基于规则的领域问句分类与识别的方法。该方法利用问句语言规则与领域知识特点提取问句类别规则,基于规则来进行问句分类与识别。该方法能够有效的缩小候选问题查找范围,提高答案定位的准确率。(4)提出了一种利用领域知识特点的语义依存的问句相似度计算方法。该方法利用领域问题特点,提取问题类别,根据类别进行相似问题过滤,以“知网”及“领域知网”知识库为基础,采用句法分析提取问句有效依存对,利用依存对和概念语义关系,实现问句之间相似度计算。(5)在云南旅游领域,设计实现了云南旅游问答原型系统。构建了领域知识库和领域FAQ数据库,采用文中问句相似度计算方法,进行问句相似度的计算,实现问题答案提取。云南旅游FAQ问答原型系统测试结果表明该方法可行,有较好的效果。
|
全文目录
摘要 3-4 ABSTRACT 4-8 第一章 引言 8-13 1.1 研究背景及意义 8-9 1.2 FAQ的汉语问答系统介绍 9-10 1.2.1 FAQ问答系统的基本体系结构 9-10 1.2.2 FAQ问答系统的实现过程 10 1.3 FAQ问答系统国内外研究现状 10-11 1.4 本文研究内容 11 1.5 论文的组织 11-13 第二章 领域知识库构建 13-26 2.1 资源应用 13-16 2.1.1 知网 13-15 2.1.2 同义词词林 15-16 2.2 旅游本体库的构建 16-24 2.2.1 引言 16-17 2.2.2 领域知识库的构建方法 17-21 2.2.3 实例及解释 21-24 2.3 本章小结 24-26 第三章 受限域FAQ收集和组织 26-32 3.1 引言 26 3.2 受限域 FAQ的收集 26-31 3.2.1 人工收集 26-30 3.2.2 网络爬虫方式 30-31 3.3 受限域 FAQ的组织 31 3.4 本章小结 31-32 第四章 问句分类 32-40 4.1 引言 32 4.2 问句类型定义 32-33 4.3 类别规则提取 33-34 4.4 类型识别 34-39 4.5 本章小结 39-40 第五章 相似问句的查找及答案抽取 40-51 5.1 引言 40 5.2 问句相似度的计算相关研究 40-44 5.2.1 TFIDF方法 40-41 5.2.2 语义词典方法 41-42 5.2.3 词形与词序综合方法 42-43 5.2.4 依存树方法 43 5.2.5 编辑距离方法 43-44 5.3 领域问句相似度计算方法 44-47 5.3.1 词的语义相似度计算 45-46 5.3.2 问句句法依存对提取 46-47 5.3.3 领域问句相似度计算 47 5.4 候选问题集的选取 47-49 5.5 问句答案抽取 49-50 5.6 FAQ库的更新 50 5.7 本章小结 50-51 第六章 云南旅游FAQ问答系统设计与实现 51-55 6.1 系统框架 51-52 6.2 系统设计与实现 52-53 6.3 实验结果及系统评价 53-54 6.4 本章小结 54-55 第七章 结束语 55-57 7.1 论文总结 55-56 7.2 下一步研究设想 56-57 致谢 57-58 参考文献 58-62 附录 A 攻读学位期间发表论文及参与项目 62
|
相似论文
- 基于词义及语义分析的问答技术研究,TP391.1
- WordNet和《中国分类主题词表》的映射研究,G254
- 基于概念集合的网页内容过滤方法的研究,TP393.092
- 基于知网的受限域问答系统原型的设计与实现,TP391.1
- 领域知识对领域问答系统答案抽取影响研究,TP391.3
- 基于语义的单文档自动摘要研究,TP391.1
- 基于知网和贝叶斯模型的词义消岐技术的研究,TP391.1
- 汉语语义依存分析研究,TP391.1
- 交互式问答系统中的省略恢复研究,TP391.1
- 中文问答系统中问题分析关键技术的研究,TP391.1
- 基于HowNet的中文语义倾向性分析技术研究,TP391.1
- 主谓关系识别与主题相关性计算技术研究,TP391.1
- 基于语义理解的论文相似度研究,TP391.1
- CNKI文献关联推荐用户选择行为的实验研究,G354
- 基于本体的教学领域知识库研究,TP391.1
- 大规模汉语语义词典构建,TP391.1
- 基于Hownet的汽车领域产品评论挖掘方法研究,TP391.1
- 受限域问答系统文本检索研究,TP391.1
- 基于语义Web的金融信息服务模式探讨,H313
- 基于本体的ERP实施知识库构建与管理研究,TP182
- 中文文本分类研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 专用应用软件
© 2012 www.xueweilunwen.com
|