学位论文 > 优秀研究生学位论文题录展示
基于开放域问答系统的问题分类技术研究与实现
作 者: 刘桥妹
导 师: 王振宇
学 校: 华南理工大学
专 业: 计算机系统结构
关键词: 开放域问答系统 问题分类 答案抽取 贝叶斯 知网
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 90次
引 用: 0次
阅 读: 论文下载
内容摘要
随着网络的快速发展,人们对搜索引擎的依赖越来越强。问答系统作为新一代搜索引擎,是信息检索的高级形式,它允许用户用自然语言提问,并能够向用户返回准确的答案。与传统的关键词搜索引擎相比,问答系统能够更好满足用户对快速、准确地获取信息的需求。问答系统一般包括问题理解,信息检索,答案抽取三大部分。本文基于开放域问答系统,重点研究了问题理解的问题分类技术以及事实性问题和定义性问题的答案抽取技术。并通过实验对这两部分进行了验证和分析。具体来说,本文主要的工作成果如下:1.本文针对问句词汇信息少的特点,利用问句焦点,问句的依存关系和问句成分的语义角色,识别不同的语义块,提出一种以语义块为特征的贝叶斯分类模型,并且进行了语义块扩展和特征选择。同时,针对问点块对问题分类的影响,结合了问点块与问题类型的对应规则来进行问题分类。实验结果表明该分类模型具有良好的效果。2.针对事实性问题,本文利用语义角色分析和问句关键词相结合的方法进行答案抽取,用基于问句关键词的方法弥补语义角色分析的缺陷。并把关键词分为不同的集合,针对其重要性赋予不同的权重。实验证明该方法相对于其他方法答案抽取准确率得到了提高。3.应用知网语义关系对定义性问题进行答案抽取,利用知网的知识描述语言来分析候选答案句中关键词与需要解释的词汇在知网中的语义关系,得到每个候选答案句的得分,识别出问题的答案。在小范围的实验中验证了该方法的可行性。
|
全文目录
摘要 5-6 Abstract 6-10 第一章 绪论 10-16 1.1 研究背景及意义 10-11 1.2 问答系统研究概述 11-14 1.2.1 问答系统的发展历史 11 1.2.2 问答系统分类 11-12 1.2.3 国外研究现状 12-13 1.2.4 国内研究现状 13-14 1.3 本文的研究内容 14-15 1.4 本文的组织架构 15-16 第二章 问答系统的相关理论 16-22 2.1 基于机器学习的问题分类 16-18 2.1.1 分类简介 16-17 2.1.2 贝叶斯分类器 17-18 2.2 知网 18-21 2.2.1 知网的结构 18-19 2.2.2 知网的知识描述语言 19-21 2.3 依存文法 21 2.4 本章小结 21-22 第三章 基于语义块的问题分类 22-40 3.1 问题分类概述 22-23 3.1.1 问题分类的作用 22 3.1.2 问题分类的研究现状 22-23 3.2 问题分类体系 23-25 3.3 问题分类的语义块特征提取 25-33 3.3.1 问题分类特征概述 25-26 3.3.2 问题语义块的分类 26-27 3.3.3 问点块的提取 27-28 3.3.4 事件语义块的提取 28-29 3.3.5 其他语义块的提取 29-30 3.3.6 问题语义块的分析过程 30-33 3.4 问题分类的特征选择 33-34 3.5 基于语义块的贝叶斯问题分类模型 34-37 3.6 问题的扩展 37-39 3.6.1 关键词抽取 37-38 3.6.2 关键词扩展 38 3.6.3 检索表达式的生成 38-39 3.7 本章小结 39-40 第四章 开放域问答系统答案抽取 40-50 4.1 答案抽取概述 40 4.2 基于知网的词语相似度计算 40-42 4.3 候选答案集的选取 42 4.4 事实性问题答案抽取 42-47 4.4.1 事实性问题答案抽取概述 42-43 4.4.2 语义角色分析 43-44 4.4.3 基于语义角色的句子相似度计算 44-45 4.4.4 基于问句关键词的句子相似度计算 45-47 4.5 定义性问题答案抽取 47-49 4.5.1 定义性问题概述 47 4.5.2 定义性问题答案抽取的方法 47-49 4.6 本章小结 49-50 第五章 开放域问答系统原型实现与实验结果分析 50-64 5.1 系统设计思想 50 5.2 系统的框架 50-51 5.3 系统的模块设计 51-59 5.3.1 问题分类模块设计 52-56 5.3.2 信息检索模块设计 56-57 5.3.3 答案抽取模块设计 57-59 5.4 实验结果分析 59-63 5.4.1 问题分类模块 59-62 5.4.2 答案抽取模块 62-63 5.5 本章小结 63-64 结论 64-65 参考文献 65-69 攻读硕士学位期间取得的研究成果 69-70 致谢 70
|
相似论文
- 基于词义及语义分析的问答技术研究,TP391.1
- 多传感器信息融合及其在可穿戴计算机上的应用,TP202
- 黄磷储罐区安全评价方法研究,TQ126.317
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 黑麦草(Lolium perenne L.)代谢QTL定位与代谢网络构建,S543.6
- WordNet和《中国分类主题词表》的映射研究,G254
- 语音信号的压缩感知研究及其在语音编码中的应用,TN912.3
- 有序Probit模型的非参贝叶斯统计,O212.8
- 基于压缩感知的认知无线电频谱检测技术及其研究,TN925
- 认知无线电系统合作频谱感知中感知数据错误化攻击防御技术,TN925
- 基于改进的非参数回归交通流量预测方法,F570
- 基于双目立体视觉的水下三维重建,TP391.41
- 基于无线传感器网络的智能家居安全监测系统的研究与应用,TP273.5
- 重构算法在OFDM信道估计中的应用研究,TN919.3
- 基于贝叶斯网络的电机故障诊断方法研究,TM307.1
- 面向工程监理的多Agent信息智能检索机制研究,TP391.3
- 核电站小样本数据贝叶斯处理方法研究,TL329
- 基于非线性滤波的小卫星姿态确定及控制研究,V448.2
- 基于概念集合的网页内容过滤方法的研究,TP393.092
- 基于朴素贝叶斯的中文文本情感倾向分类研究,TP391.1
- 领域知识对领域问答系统答案抽取影响研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|