学位论文 > 优秀研究生学位论文题录展示

限定领域内基于web的智能问答系统

作　者: 李晓丹
导　师: 高光来
学　校: 内蒙古大学
专　业: 计算机应用技术
关键词: 自动问答问题分类信息检索语言模型依存关系查询扩充
分类号: TP393.092
类　型: 硕士论文
年　份: 2005年
下　载: 255次
引　用: 3次
阅　读: 论文下载

内容摘要

20世纪90年代以来,Internet在世界范围内得到了迅猛的发展。网上的信息越来越多,极大地推动了自然语言处理技术的发展。同时也对自然语言处理技术提出了更高地要求:人们希望在杂乱无章的网络世界中快速、准确地获得自己想要的信息。自动问答技术正是为了满足人们的这种愿望而发展起来的。人们可以用普通的问句对自动问答系统提问,自动问答系统到语料库中搜索相应的答案,然后把答案直接返回给用户。这样用户就可以通过自动问答系统方便地获得自己想要的信息。然而,现今大多数的自动问答系统都是根据用户的输入对题库中的问题进行简单的关键词匹配,仅用关键词来表示问题的语义显然存在着许多不足。为解决这一缺陷,本文对问答系统的相关技术进行了探讨,提出如何在限定领域下建立一个有效的检索模型,并结合对问题类别进行判别、对问题关键词进行扩展等方法,使系统对用户的问题都能找到正确的解答,真正实现问答系统的智能性。本系统结合了信息检索、计算语言学、数据挖掘等方面的知识与技术进行研究,实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的问答系统可以大幅度提高系统智能性。将该系统应用于远程教育中,为广大用户提供了一个基于WWW的先进的答疑环境,可以使学生获得及时准确的解答,消除学习障碍。

全文目录

目录  3-6
图表目录  6-7
摘要  7-8
ABSTRACT  8-9
第一章引言  9-12
  1．1 问答系统简介  9-10
    1．1．1 研究问答系统的目的  9
    1．1．2 问答系统的含义  9
    1．1．3 远程教育中的智能问答系统  9-10
  1．2 国内外问答系统的研究  10-11
    1．2．1 国内研究现状及动态  10
    1．2．2 国外研究现状及动态  10-11
  1．3 本文的研究内容  11-12
第二章相关理论与技术  12-19
  2．1 传统的检索模型  12-14
    2．1．1 布尔模型(Boolean Model)  12
    2．1．2 模糊逻辑模型(Fuzzy Logic Model)  12
    2．1．3 向量模型阶(Vector-Based Model)  12-14
    2．1．4 概率模式(Probability Model)  14
  2．2 自动查询扩展  14-15
    2．2．1 查询扩展的全局分析方法  15
    2．2．2 查询扩展的局部分析方法  15
    2．2．3 局部上下文分析  15
  2．3 知识的表示  15-17
    2．3．1 逻辑表示法  16
    2．3．2 语义网络  16-17
    2．3．3 产生式系统  17
  2．4 信息检索系统的评价(Performance Evaluation)  17-19
    2．4．1 评价信息检索系统的困难  17-18
    2．4．2 查全率和查准率  18-19
第三章智能问答系统模型  19-21
  3．1 Browser/Server结构  19
  3．2 主要功能模块  19-20
    3．2．1 问题分析模块  19-20
    3．2．2 问题匹配模块  20
    3．2．3 知识库维护模块  20
  3．3 系统工作流程  20-21
第四章限定领域内基于web的智能问答系统的实现  21-41
  4．1 构建知识库  21
  4．2 知识库说明  21-23
  4．3 本体对问题的管理  23-26
    4．3．1 “以网对网”-智能检索之道  23-24
    4．3．2 基于 Innernet的Internet信息检索  24
    4．3．3 本体的概念  24
    4．3．4 本体对知识的管理  24-25
    4．3．5 XML对本体的表示  25-26
  4．4 基于依存语言模型的信息检索  26-34
    4．4．1 基于语言模型的信息检索  26-29
      4．4．1．1 统计语言模型  26-27
      4．4．1．2 语言模型中的平滑技术  27-28
      4．4．1．3 基于语言模型的IR模型的概念  28-29
    4．4．2 依存语言模型的信息检索  29-34
      4．4．2．1 依存语法  29-30
      4．4．2．2 基于语言模型的IR模型的改进  30
      4．4．2．3 依存语言模型的IR的应用  30-34
  4．5 基于用户行为挖掘的查询扩展  34-37
    4．5．1 基本思想  35
    4．5．2 模型实现  35-37
      4．5．2．1 会话识别  35-36
      4．5．2．2 挖掘关联规则  36-37
      4．5．2．3 选择扩展用词  37
  4．6 用户问题分类  37-39
  4．7 问题检索机制  39-41
第五章实验  41-46
  5．1 实验环境  41-42
    5．1．1 开发环境  41-42
  5．2 实验数据说明  42-43
  5．3 评估方法  43
  5．4 实验结果  43-46
第六章结论与未来研究方向  46-48
研究生期间发表论文  48-49
致谢  49-50
参考文献  50-51

相似论文

基于词义及语义分析的问答技术研究,TP391.1
统计机器翻译中结构转换技术的研究,TP391.2
词义消歧语料库自动获取方法研究,TP391.1
生物医学领域检索系统查询扩展技术研究,TP391.3
面向海量邮件的检索系统研究与实现,TP393.098
基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
面向主题的Web文档自动文摘生成方法研究,TP391.1
基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
基于稀疏非负矩阵分解的图像检索,TP391.41
跨语言文本分类的研究,TP391.1
基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
排序学习损失函数的研究,TP181
基于点击的用户聚类的研究,TP311.13
英汉跨语言问答系统中的文档语义检索,TP391.1
基于信息依存语言模型的英汉被动结构对比研究,H314.3
基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
基于Web的医学文献数据库的设计与实现,TP311.13
基于词典和概率统计的中文分词算法研究,TP391.1
基于语义Web的信息检索技术研究,TP391.3
基于OWL的地名本体构建与检索机制研究,P208
面向地名本体服务的空间信息检索研究,P208