学位论文 > 优秀研究生学位论文题录展示
基于策略学习的多引擎中文问答系统的研究
作 者: 白莲花
导 师: 刘辉林
学 校: 东北大学
专 业: 计算机系统结构
关键词: 策略学习 问答系统 QA引擎 答案来源
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 18次
引 用: 0次
阅 读: 论文下载
内容摘要
“问答系统”是对用户以自然语言形式提出的问题给出一个明确的答案。问答技术是自然语言处理领域的一个研究热点,近年来受到了越来越多研究者们的关注。随着互联网的快速发展,人们面对的信息越来越多,而且还可能存在大量的重复、错误信息,信息的正确抽取越来越困难。因此,问答系统的研究变得越来越重要。长期以来,“如何提高问答系统的性能”,一直是人们努力探索的一个问题。在以往的研究中,已经有过采用多引擎技术提高问答系统性能的例子。一种传统的方法就是把查询问题通过系统中所有的QA引擎,类似于元搜索中采取的技术。然而,这种方法的一个显著的缺点就是系统资源利用率太低,特别是对于具有大量QA引擎的问答系统。另一种方法是为系统中的多个QA引擎人工编写一种组合策略。然而,这种“通过预定义策略组合多个QA引擎返回结果”的QA方法的弊端不仅体现在人工建立组合策略的花销上,这样的QA系统还明显缺乏灵活性和可扩展性。与以上两种方法不同,本文提出了一种自动策略学习的QA方法,并使用该QA方法建立了一种基于策略学习的问答系统模型,用以提高问答系统检索答案的准确率和效率。系统中使用了多个独立的采用不同答案检索技术的QA引擎,本文提出的QA方法实际上是选择、整合、应用学习技巧的一套操作过程。在本文设计的“基于策略学习的多引擎中文问答系统”中,“策略”通过“策略学习”的过程获得。“策略学习”算法包括两个主要步骤:确定系统中QA引擎的调用顺序,以及停止调用其它QA引擎的条件。对于一个给定的查询问题,本文通过“策略学习”得到的“策略”调用了系统中最适合其检索答案的QA引擎,并且通过其它QA引擎来验证答案,直到返回答案的置信度达到一定阈值为止。在本文进行的实验中,“基于策略学习的QA”方法相比较“简单路由QA”方法而言,系统性能有显著的提高。即使与“人工组合QA”方法相比,本文提出的“基于策略学习的多引擎QA”方法在系统检索答案的准确率和时间效率方面也都取得了更好的效果。
|
全文目录
摘要 5-6 Abstract 6-9 第1章 绪论 9-17 1.1 研究背景与意义 9-11 1.2 国内外研究现状 11-15 1.3 本文主要工作 15-16 1.4 论文的组织结构 16-17 第2章 相关工作 17-23 2.1 问答系统相关技术 17-21 2.1.1 问题分析 18-19 2.1.2 信息检索 19-20 2.1.3 答案抽取 20-21 2.2 问答系统评测 21-23 第3章 基于策略学习的问答系统总体设计 23-33 3.1 设计动机 23-25 3.1.1 策略学习方法的特点 23-24 3.1.2 引入策略学习方法的意义 24-25 3.2 系统架构 25-29 3.2.1 问句理解 26-27 3.2.2 策略学习 27-28 3.2.3 策略选择和执行 28 3.2.4 答案生成 28-29 3.3 QA引擎 29-33 第4章 主要模块的详细设计与实现 33-51 4.1 问句理解模块 33-40 4.1.1 问句预处理 34-35 4.1.2 ELM分类模型 35-37 4.1.3 分类特征选取 37-40 4.2 策略选择和执行模块 40-44 4.2.1 策略的定义和表示 40-42 4.2.2 选择和执行算法 42-44 4.3 策略学习算法 44-51 4.3.1 预处理 45-46 4.3.2 QA排序 46-47 4.3.3 生成阈值 47-51 第5章 实验结果分析 51-61 5.1 实验设置 51-53 5.1.1 实验环境 51 5.1.2 实验数据集 51-52 5.1.3 对比方法 52-53 5.2 实验结果及分析 53-61 5.2.1 问题的预期AS分类 54 5.2.2 训练集的选取 54-55 5.2.3 不同QA方法对比分析 55-61 第6章 结论与展望 61-63 6.1 结论 61-62 6.2 进一步工作 62-63 参考文献 63-67 致谢 67-69 攻读硕士期间参加的项目 69
|
相似论文
- 词汇自主学习训练对高中生英语词汇能力的影响,G633.41
- 学习策略训练对初中生英语词汇习得的影响,G633.41
- 面向农民的问答系统设计与实现,G353.1
- 策略培训教学在中学英语听力中的有效性研究,G633.41
- 高中英语教师阅读教学策略对学生英语阅读学习策略的影响,G633.41
- 高中英语学困生学习策略的调查研究,G633.41
- 运用试卷分析策略提高英语学困生学习成效的探索研究,G633.41
- 面向军事知识的自动问答系统的设计与实现,TP311.52
- 面向销售服务的自动问答系统的设计与实现,TP311.52
- 中学生化学学习动机、学习策略与学习成绩的相关研究,G633.8
- 基于知网的受限域问答系统原型的设计与实现,TP391.1
- 基于多Agent及元搜索技术的中文问答系统的研究和应用,TP391.1
- 事实型中文问答系统中片段检索方法的研究,TP391.1
- 中文问答系统中问题分析关键技术的研究,TP391.1
- 基于意义理解的问答系统设计与实现,TP311.52
- 针对教育视频的虚拟学习社区设计与实现,G434
- 大学生混合学习需求分析及支持策略研究,G434
- 新课程下创建高中物理高效课堂策略的探索,G633.7
- 基于贝叶斯分类方法的中文问句分类研究,TP391.1
- 初中生物学学习策略的行动研究,G633.91
- 自我调节学习策略在学习价值观与学习适应性间的中介效应研究,G442
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|