学位论文 > 优秀研究生学位论文题录展示

基于WEB代理的访问控制网关系统研究与实现

作 者: 张鑫
导 师: 杨武
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: Web代理 缓存替换 Greedy Dual-Size算法 URL字符串匹配 Hash-WB-Like算法
分类号: TP393.07
类 型: 硕士论文
年 份: 2013年
下 载: 10次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网爆炸式的发展,越来越多的人开始使用互联网,并且互联网中信息量变得越来越大,导致网络拥堵日益严重,降低了网络服务质量。另一方面,互联网中充斥的暴力、反社会、色情等大量不良信息不仅败坏社会风气,还严重影响未成年人身心的健康成长。处于内外网出入口位置的Web代理服务器不仅能通过使用缓存技术来加速用户访问,还能通过使用黑白名单控制用户访问的URL,从而能够很好的解决以上两个问题。因此,如何提升Web缓存替换算法和URL字符串匹配算法的性能变得越来越重要。首先,本文提出了一种基于Web对象的空间局部性和流行度改进的GreedyDual-Size缓存替换算法。Greedy Dual-Size算法综合考虑了Web对象的大小、时间局部性以及获取该Web对象耗费的代价,并以此来计算Web对象的缓存价值。但是,当多个Web对象的缓存价值一样时,Greedy Dual-Size算法可能会将用户访问频率高、联系紧密的Web对象替换出缓存。针对这种情况,本文使用Web对象的空间局部性和流行度来改进Greedy Dual-Size算法。实验结果表明改进的Greedy Dual-Size算法在Web对象命中率和字节命中率方面有明显的提升,并且还降低了访问延迟率。其次,本文提出了一种基于用户访问行为分布特点改进的Hash-WB-Like URL字符串匹配算法。针对用户访问的大部分URL都在黑名单中匹配失败的情况,本文首先使用位图法改进Hash-WB-Like算法,从而避免大部分URL在桶链表上的匹配操作;然后使用小部分内存存储合法并且用户访问概率高的URL用于白名单匹配,从而减少在数据量巨大的黑名单中匹配的次数。实验结果表明改进的Hash-WB-Like算法在URL字符串匹配性能表现方面有明显的提升。最后,本文综合上述两种改进算法设计并实现了基于Web代理的访问控制网关系统。本文对该系统的模块设计与实现做了简要说明,同时给出了该系统的功能和性能测试结果。

全文目录


摘要  5-6
Abstract  6-11
第1章 绪论  11-15
  1.1 课题研究背景及意义  11-13
  1.2 论文研究内容  13
  1.3 论文组织结构  13-15
第2章 相关技术与现状  15-27
  2.1 Web代理服务器  15-17
    2.1.1 Web 代理服务器类型  15-17
    2.1.2 相关协议  17
  2.2 Web缓存替换技术  17-23
    2.2.1 Web 缓存部署位置  17-18
    2.2.2 Web 对象缓存价值  18-20
    2.2.3 Web 缓存工作流程  20-21
    2.2.4 缓存替换算法  21-23
  2.3 基于URL过滤的Web访问控制技术  23-26
    2.3.1 Web 访问控制的类型  23-24
    2.3.2 URL 过滤技术  24-26
  2.4 本章小结  26-27
第3章 基于Web对象空间局部性和流行度的GDS算法研究  27-43
  3.1 缓存替换算法概述  27
  3.2 Web对象缓存价值影响因素  27-31
    3.2.1 Web 对象流行度  28-29
    3.2.2 Web 对象的大小  29-30
    3.2.3 Web 对象局部性  30-31
  3.3 Web缓存性能评价指标  31-32
    3.3.1 Web 对象命中率  31
    3.3.2 字节命中率  31-32
    3.3.3 访问延迟率  32
  3.4 改进GDS算法  32-38
    3.4.1 GDS 算法  32-33
    3.4.2 GDS 算法存在的问题  33-35
    3.4.3 GDS 算法改进  35-38
  3.5 对比实验与分析  38-42
    3.5.1 实验环境  38-39
    3.5.2 实验步骤  39
    3.5.3 实验结果与分析  39-42
  3.6 本章小结  42-43
第4章 基于位图法和动态白名单改进的Hash_WB_Like算法  43-58
  4.1 基于URL过滤的访问控制  43-44
  4.2 URL字符串特点分析  44-45
    4.2.1 URL 大小写不敏感  44
    4.2.2 URL 存储问题  44
    4.2.3 用户访问 URL 分布  44-45
  4.3 Hash_WB_Like算法  45-48
    4.3.1 URL 预处理  45-47
    4.3.2 Wu-Manber-like 匹配  47-48
    4.3.3 Hash_WB_Like 算法  48
  4.4 Hash_WB_Like 算法的改进  48-54
    4.4.1 Hash_WB_Like 算法存在的问题  48-49
    4.4.2 基于位图法的 Wu-Manber-like 算法的改进  49-50
    4.4.3 动态 URL 白名单算法  50-52
    4.4.4 基于位图法和动态白名单改进 Hash_WB_Like 算法  52-54
  4.5 对比实验与分析  54-57
    4.5.1 实验环境  54
    4.5.2 实验步骤  54
    4.5.3 实验结果与分析  54-57
  4.6 本章小结  57-58
第5章 基于WEB代理的访问控制网关设计与实现  58-67
  5.1 系统实现目标  58
  5.2 系统总体设计  58-60
    5.2.1 系统的网络结构  58
    5.2.2 系统的模块设计  58-60
  5.3 系统具体实现  60-63
    5.3.1 系统主进程  60-62
    5.3.2 系统子进程  62-63
  5.4 功能及性能测试  63-66
    5.4.1 功能测试  63-65
    5.4.2 性能测试  65-66
  5.5 本章小结  66-67
结论  67-68
参考文献  68-72
致谢  72

相似论文

  1. 数据缓存技术在Mashup中的应用研究,TP333
  2. 流媒体分类播放技术研究与设计,TN919.8
  3. 基于前缀缓存和指数分段的代理缓存算法研究,TN919.8
  4. 基于WEB访问特性的代理缓存机制的研究,TP393.06
  5. 引入flash的多层次存储结构研究与实现,TP333
  6. 下一代网络安全态势评估系统中数据缓存子系统的设计与实现,TN915.08
  7. 多媒体资源缓存服务器的设计与实现,F626
  8. 图的控制集问题的近似算法研究,O157.5
  9. 协同地面等待策略研究,V355
  10. Web代理服务器的研究与实现,TP393.073
  11. 异步单进程事件驱动代理服务器,TP393.05
  12. 基于重用距离预测与流检测的高速缓存替换算法研究,TP333
  13. 磁盘阵列高容错模式及重构技术研究,TP333.35
  14. 移动计算中语义缓存技术研究,TP311.13
  15. 虚拟光盘库系统技术研究与实现,TP333
  16. 失效盘优先的高速缓存替换方案的设计与实现,TP333
  17. 基于不定长拼接单元的维吾尔语文语转换系统的研究与实现,TP391.1
  18. 基于Web挖掘的Proxy端预取技术的研究与实现,TP393.09
  19. P2P网络缓存协作的研究,TP393.02
  20. 多媒体彩像系统的流媒体缓存代理服务器的研究与实现,TN919.82

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络管理
© 2012 www.xueweilunwen.com