学位论文 > 优秀研究生学位论文题录展示

全文信息检索的快速索引文件结构及系统的设计与实现

作 者: 王泽胤
导 师: 刘衍珩;刘雪洁
学 校: 吉林大学
专 业: 软件工程
关键词: 索引文件结构 信息检索 全文索引 存储优化
分类号: TP391.3
类 型: 硕士论文
年 份: 2009年
下 载: 165次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在全球信息化大潮趋势的推动下,以文本信息为最基本和最常用形式的多元信息随着时代的发展无限地增加。为了能在大量的信息中找到自己所需要的文本信息,人们需付出了大量的精力,因此研发一个高效的对非结构化的文本数据进行有效管理和检索的工具已经迫在眉睫。全文信息检索是以文本信息为检索对象,根据资料内容来实现信息检索的一种手段。本文主要从以下几个部分进行分析和研究:1、研究了传统的全文信息检索方法、倒排文件、混合索引技术等,对其原理和索引文件结构进行了介绍,肯定了其优点,但同时也指出其索引速度和对目前海量信息建立索引时存在一定差距的事实,从而提出了需要建立一种索引速度更快的索引文件结构的必要。2、描述了全文信息检索系统的索引基本流程,然后有设计了本系统中索引文件的结构和索引原理,建立索引文件时采用的动态平衡树和增量索引优化合并策略。3、设计并开发了全文信息检索系统,设计了系统的功能模型,并对系统进行分模块分层次开发设计,达到理论与实践相结合的学习目的。

全文目录


相似论文

  1. 生物医学领域检索系统查询扩展技术研究,TP391.3
  2. 面向海量邮件的检索系统研究与实现,TP393.098
  3. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  4. 基于策略Agent的个性化信息检索系统的研究与实现,TP391.3
  5. 基于稀疏非负矩阵分解的图像检索,TP391.41
  6. 跨语言文本分类的研究,TP391.1
  7. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  8. 排序学习损失函数的研究,TP181
  9. 基于点击的用户聚类的研究,TP311.13
  10. 英汉跨语言问答系统中的文档语义检索,TP391.1
  11. 基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究,TP391.1
  12. 基于Web的医学文献数据库的设计与实现,TP311.13
  13. 基于语义Web的信息检索技术研究,TP391.3
  14. 海量数据存储与全文检索,TP333
  15. 基于OWL的地名本体构建与检索机制研究,P208
  16. 面向地名本体服务的空间信息检索研究,P208
  17. 基于内容与链接的页面价值算法研究,TP393.092
  18. 基于对等网络的搜索引擎关键技术研究,TP391.3
  19. J2EE集成开发框架及其应用,TP311.52
  20. 基于迁移学习理论的Markov检索模型,TP391.3
  21. 基于聚类分析的搜索引擎自动性能评价研究,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com