学位论文 > 优秀研究生学位论文题录展示

基于词义及语义分析的问答技术研究

作 者: 刘桂平
导 师: 刘挺
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 自动问答 问题分类 句段检索 答案抽取
分类号: TP391.1
类 型: 硕士论文
年 份: 2008年
下 载: 107次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息技术的发展,人们可用的数据资源呈爆炸式增长。在面对这些海量数据时,用户需要有强大的检索工具来帮助自己找到所需的信息。开放域问答(Question Answering,QA)研究的目标是给人提供比现有搜索引擎更自然、更直接的信息访问交互界面,用户可以用提问的形式提出信息查询需求,系统能直接将答案和支持信息一起返回给用户。本文对开放域问答系统的最重要的三个部分:问题分析、句段检索和答案抽取进行了分别研究。在第二章提出了一种新的基于疑问词和焦点词词义的中文问题分类方法,首先利用CRF模型自动识别问题中的疑问词和焦点词,通过对疑问词和焦点词的词义消歧,获得它们在《同义词词林(扩展版)》上的三层到五层的词义,结合问题中的其它全部非停用词和词性,训练得到SVM模型来分类。实验表明,疑问词和焦点词特征的使用,显著提高了问题分类性能。在本文的第三章,对句段检索进行了研究,探索了一种新的基于词义分析的句段检索方法,取得了不错的实验效果。本文的第四章对问答系统中难度最大的一部分答案抽取和生成进行了研究。提出了一种新的基于语义角色标注的答案抽取技术,相关实验结果表明,利用语义角色标注的结果,同时结合词袋方法来选择答案句,能够显著提高系统的性能。最后,本文在第五章设计并实现了一个自动问答系统,并对这个自动问答系统进行了基本的性能评测。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-25
  1.1 课题背景  8-9
  1.2 开放域问答系统通用的体系结构  9-10
  1.3 问题分析  10-12
  1.4 相关文档和文档句段检索  12-17
    1.4.1 简单事实型和列举型问题的相关文档检索  12-14
    1.4.2 简单事实型与列举型问题的相关文档句段检索  14-16
    1.4.3 定义型问题的相关文档检索  16-17
  1.5 答案的抽取和生成  17-22
    1.5.1 事实型与列举型问题的答案抽取排序  17-20
    1.5.2 定义型问题的答案抽取和生成  20-22
  1.6 中文开放域问答技术研究现状  22
  1.7 TREC自动问答评测  22-23
  1.8 本文的主要工作  23-25
第2章 基于疑问词和焦点词词义的中文问题分类  25-32
  2.1 引言  25-27
  2.2 基于CRF模型的问句疑问词和焦点词自动识别  27-29
  2.3 基于疑问词和焦点词词义的中文问题分类  29
  2.4 实验结果与分析  29-31
    2.4.1 实验数据与评价方法  29-30
    2.4.2 问句疑问词和焦点词自动识别的实验结果  30-31
    2.4.3 选择不同特征时的SVM分类实验结果  31
  2.5 本章小结  31-32
第3章 基于词义分析的句段检索技术  32-41
  3.1 基于向量空间模型的tf-idf方法  32-33
  3.2 基于同义词词典的词义表示  33-36
  3.3 基于词义的向量空间模型(WSVSM)及模型融合  36-38
  3.4 实验及分析  38-40
  3.5 本章小结  40-41
第4章 基于语义角色标注的答案抽取技术  41-53
  4.1 引言  41-42
  4.2 相关研究工作  42-43
  4.3 问题与候选句间浅层语义树kernel的计算  43-49
    4.3.1 问句到陈述句形式的转换  43-44
    4.3.2 浅层语义结构的树状表示  44-46
    4.3.3 基于树kernel的浅层语义树状结构相似度计算  46-47
    4.3.4 浅层语义树kernel中结点产生式的相似性判断  47-49
  4.4 实验  49-52
    4.4.1 实验设置  49-50
    4.4.2 实验结果与分析  50-52
  4.5 本章小结  52-53
第5章 自动问答系统的实现及评价  53-59
  5.1 问答系统一般核心构架  53-54
  5.2 具体系统实现框架  54-55
  5.3 问答系统在Internet的发布  55-57
  5.4 实验结果及系统评价  57-58
  5.5 本章小结  58-59
结论  59-60
参考文献  60-70
攻读学位期间发表的学术论文  70-72
致谢  72

相似论文

  1. 领域知识对领域问答系统答案抽取影响研究,TP391.3
  2. 旅游本体知识库的构建及推理应用研究,TP391.1
  3. 基于搜索引擎的自动问答系统,TP391.3
  4. 段落检索系统及其应用的研究,TP391.3
  5. 改进的语句相似度算法在问答系统中的应用研究,TP391.1
  6. 中文问答系统中问题分析关键技术的研究,TP391.1
  7. 基于本体的金融问答系统选股模块的设计与实现,TP311.52
  8. 限定领域内问答系统的设计与实现,TP391.3
  9. 基于支持向量机的中文问题分类研究,TP18
  10. 中文问答系统中多策略答案抽取技术的研究,TP391.3
  11. 中—英文跨语言问答式信息检索技术研究,TP391.3
  12. 城市流浪乞讨群体分类管理模式的探讨,D632
  13. 领域本体在自动问答系统中的应用研究,TP391.3
  14. 基于开放域问答系统的问题分类技术研究与实现,TP391.1
  15. 高校校园景观存在问题研究,TU984.14
  16. 面向软件测试领域的自动问答系统,TP311.53
  17. 相似度计算在基于本体的自动问答系统中的应用,TP391.1
  18. 基于中文带权关键词树的受限领域问答系统研究,TP391.1
  19. 中文问答系统的问句分类研究,TP391.1
  20. 句子相似度计算理论及应用研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com