学位论文 > 优秀研究生学位论文题录展示

相似度计算在基于本体的自动问答系统中的应用

作 者: 杨志国
导 师: 樊磊;何伟
学 校: 中央民族大学
专 业: 基础数学
关键词: 自动问答 语义相似度 本体
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 86次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着Internet的发展,一方面人们可以通过网络获得大量的信息资源,另一方面虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是网上的信息浩如烟海,增长和更新的速度越来越快,从海量信息中找到所需的内容是一项富挑战性的工作.而现有的搜索技术却存在很大的局限性,它仅提供了基于关键字的检索,而忽略了关键字本身所含的语义内容,无法满足用户个性化的需求也不能满足人们方便、快速、准确的获取信息的需要.在这种情况下,传统的基于关键字匹配的搜索引擎已经不能满足用户需求,人们期盼着新的,具有智能处理能力的、结果表示形式更为简洁的新一代搜索引擎的出现.在这种需求的推动之下,本文将自动问答处理技术和Web信息检索技术相结合,以提高现有搜索引擎对信息的智能处理能力,提供更加人性化的人机交互方式,用简洁、准确的答案,自动地回答用户用自然语言提出的问题,帮助人们快速而有效地找到所需的信息.语句相似度计算是自动问答系统的一个关键技术,本文将本体引入到系统中来,利用本体技术构建领域本体.领域本体能提供完整的关于某一特定领域中概念以及概念和概念之间的关系的描述.因此将领域本体作为基础资源,将其比较完整的领域知识和丰富的语义关系应用到自动问答系统中,帮助解决目前自动问答系统中语义理解不足的问题.本文在借鉴现有算法的基础上,提出使用基于本体的语义相似度计算方法,主要讨论并构造了概念之间和问句之间的语义相似度计算模型.概念间相似度算法主要通过对本体中不同概念之间的各个属性进行对比,判别它们在各个属性上的相同与否来得到概念间的语义相似度.在得到概念间相似度的基础上设计问句向量模型,借鉴向量空间计算方法来得到问句间的相似度.从而在自动问答系统中能使用户比较智能快捷的得到自己想要的信息.本论文主要工作可以概括为以下几点:1.研究了自动问答系统中的关键技术,介绍自动问答系统的功能模块.2.研究了本体的相关技术,对本体的概念和建模语言及建模方法进行了较为详细的阐述.3.对现有的词语相似度和句子相似度计算方法进行了研究分析,并指出其在自动问答系统应用领域的不足.将本体引入到自动问答系统中,提出了一种基于本体的自动问答系统的问句间的语义相似度计算方法.将基于本体的概念相似度和基于知网的概念语义相似度计算结合服务于语句相似度.构造了基于本体概念的属性的语义相似度计算方法.并通过测试结果分析所用算法的有效性和正确性.最后结合实际应用,通过构建一个医学领域的“鼻炎”本体模型,设计了一个简单的基于本体的自动问答原型系统.与传统的信息检索相比,给用户提供了更加简洁、方便、人性化的人机交换方式.

全文目录


摘要  2-4
Abstract  4-8
1 引言  8-11
  1.1 研究意义与背景  8
  1.2 国内外研究发展现状  8-11
2 自动应答系统相关技术  11-13
  2.1 自动问答系统的关键问题  11-13
    2.1.1 问题处理(Question Processing QP)  11-12
    2.1.2 信息检索(Information Retrieval,IR)  12-13
    2.1.3 答案抽取(Answer Extraction,AE)  13
3 本体相关技术  13-26
  3.1 语义Web的基本概念与体系结构  13-15
  3.2 Ontology的概述  15-26
    3.2.1 Ontology的定义  15-16
    3.2.2 Ontology的建模元语  16-17
    3.2.3 本体的分类  17-18
    3.2.4 Ontology描述语言  18-21
    3.2.5 领域本体建模方法及工具  21-26
4 相似度计算  26-34
  4.1 相似度定义  26
  4.2 概念相似度及相关计算方法  26-30
    4.2.1 基于语料统计的方法  27
    4.2.2 基于语义词典的方法  27-30
  4.3 句子相似度及其传统计算方法  30-34
    4.3.1 句子相似度的概念  30
    4.3.2 基于向量的句子相似度计算  30-32
    4.3.3 广义向量空间模型  32
    4.3.4 基于汉明距离的句子相似度计算  32-34
5 基于本体的相似度计算  34-41
  5.1 基于本体的问句向量表示  34
  5.2 基于本体的概念语义相似度计算  34-39
  5.3 基于本体的句子语义相似度计算  39-41
6 案例研究  41-47
  6.1 系统的总体分析设计  41-45
  6.2 算法性能分析  45-47
7 总结与展望  47-49
  7.1 本文主要工作  47-48
  7.2 需进一步研究的问题  48-49
参考文献  49-51
攻读学位期间发表的学术论文目录  51-53
致谢  53

相似论文

  1. 基于词义及语义分析的问答技术研究,TP391.1
  2. 哲学思想在指导中学数学教学中的作用,G633.6
  3. 基于本体的语义检索研究,TP391.3
  4. 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
  5. 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
  6. 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
  7. WordNet和《中国分类主题词表》的映射研究,G254
  8. 拉图尔的行动者网络理论研究,N02
  9. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  10. 220kV输电线路除冰机器人机械本体研究,TP242
  11. 基于本体的食品投诉文档文本聚类研究,TP391.1
  12. 关系数据库到RDF(S)映射方法的研究,TP311.13
  13. 基于语义的Web服务发现研究,TP393.09
  14. 本体在智能小区中的应用研究,TP391.1
  15. 基于领域本体的海洋环境数据仓库设计,TP311.13
  16. 数据空间中数据资源之间关联关系发现模型研究,TP311.13
  17. 普适计算下智能空间的哲学探究,N02
  18. 企业级软件组件质量保障与快速部团策略的研究,TP311.53
  19. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  20. 基于本体的医学命名实体识别技术研究,TP391.1
  21. 基于本体的方剂推荐系统模型研究与应用,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com