学位论文 > 优秀研究生学位论文题录展示

基于术语相似度的贝叶斯网络检索模型扩展研究

作 者: 白彦霞
导 师: 徐建民
学 校: 河北大学
专 业: 计算机应用技术
关键词: 贝叶斯网络 术语相似度 信息检索 同义词
分类号: TP391.3
类 型: 硕士论文
年 份: 2007年
下 载: 16次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着网络技术的迅速发展,传统的基于关键词匹配的信息检索技术已不能满足用户准确、全面定位信息的要求。因此,许多研究者开始关注基于语义的信息检索,将语义上相同、相近、相包含的术语进行匹配,以此来提高检索性能。利用同义词扩展查询可以扩大相关信息的检索,即提高查全率。但是盲目的扩展查询就会以牺牲查准率为代价,因为这些同义词之间的相似程度存在着区别,究竟使用哪些同义词来扩展查询直接影响着检索结果的质量。术语相似度可以从一定程度上辨别这些同义词间的近似程度,从而可以更准确的确定用于扩展查询的同义词,即可以在不降低查准率的条件下提高查全率。论文利用术语相似度量化术语间的相似关系,并将这种量化的术语关系应用于基于贝叶斯网络的信息检索,构造基于这种量化术语关系的扩展的贝叶斯网络检索模型。文中给出了扩展模型的拓扑结构,各层节点详尽的概率估计以及完整的文档检索与推理过程。最后对扩展模型进行评估,结果表明该模型不仅可以有效地提高检索性能,而且相关文档的排序也更加合理,在一定程度上实现了基于语义的信息检索,这正是目前信息检索发展的必然趋势。

全文目录


摘要  4-5
Abstract  5-8
第1章 引言  8-11
  1.1 研究背景  8
  1.2 国内外研究现状  8-10
  1.3 本文工作  10
  1.4 论文组织结构  10-11
第2章 信息检索概述  11-20
  2.1 信息检索定义  11-12
  2.2 信息检索中的文档表示  12-14
  2.3 信息检索经典模型  14-16
    2.3.1 布尔模型  14-15
    2.3.2 向量模型  15-16
    2.3.3 概率模型  16
  2.4 检索性能评测指标  16-18
  2.5 语义检索  18-20
第3章 基于贝叶斯网络的信息检索模型  20-29
  3.1 贝叶斯网络  20-22
  3.2 用于信息检索的贝叶斯网络模型  22-29
    3.2.1 推理网络模型  23-24
    3.2.2 信念网络模型  24-25
    3.2.3 贝叶斯网络检索模型  25-29
第4章 基于术语相似度的贝叶斯网络检索模型扩展  29-40
  4.1 挖掘术语关系  29-33
    4.1.1 术语相似度  29
    4.1.2 信息检索中的同义词  29-31
    4.1.3 量化同义词间的相似性  31-33
  4.2 利用术语相似度扩展贝叶斯网络检索模型  33-35
  4.3 概率估计  35-37
    4.3.1 根术语节点  35
    4.3.2 非根术语节点  35-36
    4.3.3 文档节点  36-37
  4.4 推理与检索机制  37-40
第5章 模型性能评测  40-46
  5.1 测试参考集合  40-43
  5.2 模型性能评测与分析  43-44
  5.3 模型性能评测小结  44-46
第6章 总结与展望  46-48
参考文献  48-51
攻读硕士学位期间发表论文情况  51-52
致谢  52

相似论文

  1. 生物医学领域检索系统查询扩展技术研究,TP391.3
  2. 面向海量邮件的检索系统研究与实现,TP393.098
  3. 多传感器信息融合及其在可穿戴计算机上的应用,TP202
  4. 黄磷储罐区安全评价方法研究,TQ126.317
  5. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  6. FPSO在石油卸载过程中的风险评估,U698
  7. 俄语同义词的性质、功能与分布研究,H35
  8. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  9. 基于贝叶斯网络的软件风险管理模型研究与实现,TP311.52
  10. 基于稀疏非负矩阵分解的图像检索,TP391.41
  11. 跨语言文本分类的研究,TP391.1
  12. 浅埋偏压隧道施工力学效应与风险评估,U451
  13. 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
  14. 数据驱动模式视角下的英语专业学生搭配习得研究,H319
  15. 基于语料库的同义词辨析研究,H313
  16. 汉韩同形词与对韩汉语词语教学,H195.3
  17. J2EE集成开发框架及其应用,TP311.52
  18. 基于Agent的自适应信息检索系统技术研究,TP391.3
  19. 基于信息匹对及二维检索模式的三农信息化服务系统,TP311.52
  20. Bayesian网络在制动系统故障诊断中的应用及系统开发,U472.9
  21. 个性化搜索引擎的研究与设计,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com