学位论文 > 优秀研究生学位论文题录展示

中文问答系统中问题分析关键技术的研究

作 者: 许莉
导 师: 王大玲
学 校: 东北大学
专 业: 计算机软件与理论
关键词: 中文问答系统 问题分析 依存句法分析 语义信息 问题分类 查询词扩展
分类号: TP391.1
类 型: 硕士论文
年 份: 2008年
下 载: 66次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着网络的飞速发展,对某一个问题,如何从海量的非结构化信息中找到合适的答案已越来越受到人们的关注,问答系统因此应运而生。人们期望它将来能够完全或者部分取代现在基于字符串匹配的信息检索技术,为人们提供一个更易使用的信息获取的人机接口。问答系统需要用户输入自然语言形式的问句,系统对问句进行分析处理,在网络上或其他信息源上搜索候选答案信息,然后对这些答案信息进行评定,生成自然语言形式答案。问答系统的最终目标是从信息源中抽取问题的答案,就需要通过对问句进行分析,分析要搜索什么内容,答案可能需要满足什么条件等。因此如何分析问句、从中了解问句包含的信息,成为问句处理乃至问答系统的重要任务。本文分析了目前的中文问答系统中问句分析技术,并结合自然语言处理技术,提出了一种基于句法结构和语义信息问题分析方法。在问题分析过程中,实现了基于改进贝叶斯算法的问题分类查询词扩展的功能,其中应用了依存句法分析和语义信息自然语言处理技术。本文详细论述了问题分析系统的相关算法、实现过程和关键技术。本文通过实验对问题分析系统进行评测,证明了本文采用的方法提高了问题分类的准确性,使问答系统能更好地理解问句,提高问答系统的检索效率。

全文目录


摘要  6-7
Abstract  7-12
第一章 引言  12-18
  1.1 问答系统介绍  12-14
  1.2 问答系统的分类  14-16
  1.3 问题提出  16
  1.4 本文研究的主要内容  16
  1.5 本文的组织结构  16-18
第二章 相关概念、技术与研究背景  18-26
  2.1 问答系统的相关概念  18
  2.2 问答系统的关键技术  18-21
  2.3 问题分析的研究现状及相关技术  21-24
  2.4 本章小结  24-26
第三章 基于句法结构和语义信息的中文问题分析系统结构  26-36
  3.1 系统总体结构  26-28
  3.2 问题分析的框架及流程  28-29
  3.3 问题分析的主要技术  29-30
  3.4 主要资源  30-35
    3.4.1 中科院分词工具ICTCLAS  30-31
    3.4.2 哈工大依存句法分析器  31-33
    3.4.3 知网  33-35
  3.5 本章小结  35-36
第四章 问题分析系统中问题分类技术研究  36-50
  4.1 问题类型学  36
  4.2 句法结构分析  36-38
  4.3 特征项的选择  38-44
    4.3.1 疑问词以及附属成分提取  38-40
    4.3.2 句子的主干提取  40-41
    4.3.3 句子主干成分上位词的获取  41-44
  4.4 问题类型计算  44-48
    4.4.1 贝叶斯模型  44-45
    4.4.2 改进的贝叶斯分类方法  45-48
  4.5 本章小结  48-50
第五章 问题分析系统中的关键词生成技术研究  50-58
  5.1 句法结构分析  50-51
  5.2 句子的预处理  51-53
    5.2.1 词汇的合并  51-52
    5.2.2 停用词剔除  52-53
  5.3 关键词的扩展  53-56
    5.3.1 检索模块  53-54
    5.3.2 对检索结果的snippet分词、提取  54
    5.3.3 查询词的同义词获取  54-56
  5.4 本章小结  56-58
第六章 问题分析系统分析与评价  58-68
  6.1 问题类型分类技术评价与分析  58-61
    6.1.1 测试数据集及评测标准  58-59
    6.1.2 实验结果及分析  59-61
  6.2 关键词生成技术分析与评价  61-66
    6.2.1 评价标准  61-62
    6.2.2 实验设计  62
    6.2.3 实验结果及分析  62-66
  6.3 本章小结  66-68
第七章 总结和展望  68-70
  7.1 本文的工作总结  68-69
  7.2 下一步的研究工作  69-70
参考文献  70-74
致谢  74-76
攻读硕士期间参加的项目及发表的论文  76

相似论文

  1. 基于词义及语义分析的问答技术研究,TP391.1
  2. 国有大型企业所属职业学校办学问题研究,G719.2
  3. 太原市电视台法制栏目发展策略研究,G222
  4. 中学生自我意识问题分析,G632.4
  5. 中学语文教师课堂教学语言探微,G633.3
  6. 黑龙江垦区红兴隆分局植物保护创新体系建设,S4
  7. 辽海出版社薪金结构研究,F272.92
  8. 汉语功能块的自动识别研究,TP391.1
  9. iOS平台的软件安全性分析,TP309
  10. 智能移动机器人地图描述和导航方法研究,TP242.6
  11. 面向自主角色行为规划的虚拟环境层次建模技术研究,TP391.9
  12. 基于语义Web的信息检索技术研究,TP391.3
  13. 告诉才处理基本问题研究,D924.3
  14. 论我国行政复议制度存在问题的分析及完善,D922.1
  15. 论我国城市房屋拆迁补偿制度的完善,D922.181
  16. 新世纪都市类报纸女性报道现状研究,G212
  17. 局部描述特征结合概率潜在语义模型的场景分类技术研究,TP391.41
  18. 基于本体的语义查询扩展研究,TP391.3
  19. 通辽市农村牧区人力资源存在问题及对策研究,F323.6
  20. 基于CityGML的城市三维信息描述方法研究,P208
  21. 城市污水处理厂曝气系统节能降耗影响因素及控制模式研究,X703.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com