学位论文 > 优秀研究生学位论文题录展示

适用于大规模构件库的高效检索方法研究

作 者: 张雷
导 师: 陈立潮
学 校: 太原科技大学
专 业: 计算机应用技术
关键词: 软件构件 构件检索 刻面分类 倒排索引 标识自动提取 向量空间模型
分类号: TP311.52
类 型: 硕士论文
年 份: 2012年
下 载: 34次
引 用: 0次
阅 读: 论文下载
 

内容摘要


软件构件技术作为实现软件复用的关键因素,在软件开发中起着举足轻重的作用。基于构件的软件开发能够显著提高软件开发效率,降低软件开发成本。这种软件复用的思想在Web Services、Active Services等软件服务方式中也得到了很好的体现。随着服务为主的软件理念不断加深,人们对服务的效率提出更高的要求。快速准确的提供所需服务需要依赖构件库中高效的构件存储与检索系统,随着构件库中构件规模的急剧扩大,传统的检索方法在检索效率上已经不能很好满足动态按需服务的要求。如何使构件检索在保证查全率、查准率等检索效果的同时大幅提高检索速度是一个急需解决的问题。通过分析构件刻面分类方法以及全文检索方法的优点,本文提出了一种基于功能倒排索引与描述文档全文检索的构件检索方法。首先使用功能刻面倒排索引快速排除功能上不相关的构件,然后应用改进的向量空间模型(VSM)相似度算法对这些构件的描述文档进行全文检索。对构件描述文档全文检索可以有效消除刻面分类方法在建立和维护术语空间时的主观性因素影响,提高了查全率;在功能倒排索引高效的基础上,使用改进的VSM相似度算法,有效地提升了构件检索的查准率,显著减少了检索时间。为了进一步提高在大规模构件库中的构件检索效率,本文提出一种基于标识自动提取的ATE构件检索方法,通过对构件描述文档中应用领域术语、高频词、高权重词以及刻面术语进行取舍,自动提取构件的标识,使用VSM的相似度计算方法针对构件标识进行检索。同时,设计了由功能倒排索引与标识正向索引组成的双向组合索引加快了检索速度,并针对标识检索特点进一步改进VSM相似度算法使查准率获得一定提高。ATE检索方法可以保证较好的检索效果,同时具有很高的灵活性,对构件库规模不断增大的适应性更好。最后通过与其他常用的四种构件检索方法进行对比实验,对本文提出方法的可行性和有效性进行了验证。为了考察本文提出方法在构件库规模快速增加时的适应能力,构建了不同规模的模拟构件库,并对本文方法在构件库规模增加时的检索时间增加趋势以及ATE预处理的时空开销进行了验证分析,实验结果表明本文提出的方法具有很高的检索效率以及良好的综合检索效果,能够很好的满足大规模构件库的检索要求。

全文目录


中文摘要  3-4
ABSTRACT  4-9
第一章 绪论  9-17
  1.1 研究背景  9-10
  1.2 国内外研究现状  10-13
    1.2.1 构件分类表示与检索  10
    1.2.2 基于刻面的构件描述与检索方法研究现状  10-13
  1.3 研究内容与意义  13-15
    1.3.1 主要研究内容  13-15
    1.3.2 创新之处  15
  1.4 论文组织结构  15-17
第二章 构件分类与构件检索综述  17-29
  2.1 构件技术  17-19
    2.1.1 构件的定义  17
    2.1.2 构件的特点与种类  17-18
    2.1.3 构件库系统  18-19
  2.2 构件分类表示  19-24
    2.2.1 构件分类机制  19
    2.2.2 构件分类方法  19-21
    2.2.3 刻面分类方法  21-24
  2.3 构件检索  24-28
    2.3.1 构件检索定义  24-25
    2.3.2 构件检索方法  25-27
    2.3.3 构件检索方法评价  27-28
  2.4 本章小结  28-29
第三章 基于功能倒排索引与全文检索的构件检索方法  29-41
  3.1 构件刻面分类方案设计  29-31
    3.1.1 刻面分类方案  29
    3.1.2 构件信息的存储方案  29-31
  3.2 功能倒排索引设计  31-34
    3.2.1 功能倒排索引表  31-32
    3.2.2 尝试跨步优化机制  32-33
    3.2.3 最佳跨步值推导  33-34
  3.3 构件相似度公式推导  34-36
  3.4 基于功能倒排索引与全文检索的构件检索过程  36-37
  3.5 实验结果与分析  37-40
    3.5.1 实验说明  37-38
    3.5.2 实验结果及分析  38-40
  3.6 本章小结  40-41
第四章 基于 ATE 的构件检索方法  41-53
  4.1 刻面分类方案  41-42
  4.2 复合索引说明  42-45
    4.2.1 描述文档索引  42-44
    4.2.2 功能倒排索引  44
    4.2.3 构件标识索引  44-45
  4.3 标识自动提取(ATE)过程  45-47
    4.3.1 标识集合说明  45-47
    4.3.2 标识自动提取算法  47
  4.4 改进的 VSM 相似度公式  47-48
  4.5 基于 ATE 的构件检索过程  48-49
  4.6 实验结果分析  49-52
    4.6.1 与常用方法对比实验结果分析  49-50
    4.6.2 ATE 算法中主要参数对检索的影响分析  50-51
    4.6.3 ATE 检索对构件库规模增长的适应性分析  51-52
  4.7 本章小结  52-53
第五章 总结与展望  53-56
  5.1 全文总结  53-54
  5.2 展望  54-56
参考文献  56-60
致谢  60-61
攻读学位期间发表的学术论文目录  61-62
个人简介  62-63

相似论文

  1. 基于停用词处理的汉语语音检索方法,TP391.1
  2. 动态可配置WSN通用测控系统的应用研究,TN929.5
  3. 全文检索及相关技术研究,TP391.3
  4. 数据库中基于多索引段的全文索引研究,TP311.13
  5. 基于局部特征的图像拷贝检测研究,TP391.41
  6. Web新闻热点发现系统的设计与实现,TP393.09
  7. 基于Hadoop的倒排索引技术的研究,TP391.3
  8. 基于接口匹配的语义Web服务发现方法研究,TP391.1
  9. 基于软构件复用技术的ERP系统研究,TP311.52
  10. 实时系统构件库的设计与实现,TP311.52
  11. 可重构路由交换平台构件检索技术研究,TP391.3
  12. 基于多Agent及元搜索技术的中文问答系统的研究和应用,TP391.1
  13. 基于倒排索引的压缩算法性能研究,TP391.3
  14. 基于构件的软件复用技术的研究与应用,TP311.52
  15. 基于Lucene的网页抓取与检索系统,TP393.092
  16. 移动垂直搜索系统的研究,TP391.3
  17. 基于语义的构件检索系统研究与实现,TP311.52
  18. 基于内容的快速音频检索,TP391.3
  19. 设计模式库构建研究与应用,TP311.52
  20. 基于Android的桌面搜索引擎的研究与实现,TP391.3
  21. 一种基于语义标注的个性化搜索技术的研究与实现,TP391.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com