学位论文 > 优秀研究生学位论文题录展示

分治加权增量SVM在P2P流量检测中的应用

作 者: 张立新
导 师: 孙名松
学 校: 哈尔滨理工大学
专 业: 计算应用技术
关键词: P2P技术 支持向量机 增量训练 中心距离比值 加权算法
分类号: TP393.06
类 型: 硕士论文
年 份: 2011年
下 载: 8次
引 用: 0次
阅 读: 论文下载
 

内容摘要


P2P技术自1999年发布以来,作为一种全新的互联网应用模式开始风靡全球,被财富杂志评为影响互联网的四大科技之一,主导着互联网的发展方向。P2P流量也成为当前网络流量的主要成分。P2P技术的主要应用领域为文件共享、音视频在线、搜索引擎、网络游戏、流媒体、科学计算与协作、即时通讯等。给我们的生活带来巨大便利的同时,也带来了一系列的问题。P2P业务已占据了互联网业务总量的60%-80%,成为杀手级宽带互联网应用。造成了网络带宽的巨大消耗,甚至引起网络拥塞。P2P网络缺少必要的安全机制,给学校网络安全防护打开一扇后门。P2P应用的监管存在技术和管理上的困难,因而在教育网内有些P2P用户就利用此漏洞传播淫秽和反动信息,造成了非常不好的影响。因此,我们必须有效识别及控制P2P流量。SVM具有针对有限样本、泛化性能和推广能力好以及分类精度高的优点,但传统的SVM算法不支持增量学习,随着新增样本的不断加入,致使训练集规模不断扩大,消耗大量计算资源,寻优速度缓慢。在深入研究了支持向量分布的特点的基础上提出了分治加权增量SVM算法。本文主要工作如下:第一,介绍P2P的网络结构和特点及研究现状,介绍了当前P2P流量识别的几种方案,分析了这几种方案在检测过程中的特点及存在的问题。第二,详细讲述SVM的知识,提出了增量SVM的改进算法——分治加权增量SVM。该算法利用广义KKT条件和中心距离比值,舍弃对后续训练影响不大的样本,得到边界支持向量集,对训练样本进行有效的淘汰;将所剩样本合并,进行加权处理,解决某些样本严重偏离所属的类别,对正常分布的样本不公平的问题,分治加权增量SVM算法适合于分类问题。第三,将分治加权增量SVM算法应用到P2P流量检测问题当中。设计并实现了P2P流量检测的模型,通过合理的核函数参数,从检测时间和检测精度两个方面评价了模型的分类效果。实践证明分类器分类效果良好。最后,对论文所做的工作进行了总结,并提出下一步工作研究的重点。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-15
  1.1 课题研究的目的和意义  10-12
  1.2 国内外研究现状  12
  1.3 SVM 的研究现状  12-13
  1.4 论文的主要工作  13
  1.5 本文的章节安排  13-15
第2章 P2P 技术及其流量检测方法综述  15-23
  2.1 P2P 技术综述  15-19
    2.1.1 P2P 定义  15-16
    2.1.2 P2P 网络结构  16-18
    2.1.3 P2P 模式和C/S 模式对比  18
    2.1.4 P2P 技术的应用  18-19
  2.2 P2P 流量检测  19-22
    2.2.1 基于固定端口的检测技术  20
    2.2.2 基于深层数据包的检测技术  20-21
    2.2.3 基于传输层行为的检测技术  21-22
    2.2.4 几种识别方法的比较  22
  2.3 本章小结  22-23
第3章 SVM 理论概述  23-33
  3.1 引言  23
  3.2 统计学习理论的核心内容  23-26
    3.2.1 期望风险  23-24
    3.2.2 VC 维  24
    3.2.3 泛化误差界  24-25
    3.2.4 结构风险最小化原则  25-26
  3.3 SVM 原始构造思想  26-32
    3.3.1 广义最优分类面与线性可分  26-29
    3.3.2 核函数  29-31
    3.3.3 增量SVM 原理  31-32
  3.4 本章小结  32-33
第4章 分治加权增量SVM 算法  33-41
  4.1 引言  33
  4.2 边界向量条件分析  33-36
    4.2.1 KKT 条件分析  34-35
    4.2.2 支持向量变化情况分析  35-36
  4.3 分治加权淘汰算法  36-40
    4.3.1 淘汰算法  36-37
    4.3.2 加权思想  37-39
    4.3.3 分治加权增量训练算法  39-40
  4.4 本章小结  40-41
第5章 基于分治加权增量SVM 的P2P 流量检测方法  41-53
  5.1 引言  41
  5.2 建立检测模型  41-42
  5.3 网格数据捕捉模块  42-44
    5.3.1 数据采集软件  42-44
    5.3.2 实验数据信息  44
  5.4 数据预处理模块  44-48
    5.4.1 网格流量样本特征提取依据  44-47
    5.4.2 数据特征提取  47
    5.4.3 数据预处理  47-48
    5.4.4 核函数的选取  48
  5.5 SVM 识别模块的设计实现  48-49
  5.6 实验结果及分析  49-52
  5.7 本章小结  52-53
结论  53-55
参考文献  55-59
攻读硕士期间发表的论文  59-60
致谢  60

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络测试、运行
© 2012 www.xueweilunwen.com