学位论文 > 优秀研究生学位论文题录展示

基于机器学习算法的P2P流量分类研究

作 者: 刘永定
导 师: 阳爱民
学 校: 湖南工业大学
专 业: 计算机应用技术
关键词: P2P 流量分类 特征选择 机器学习
分类号: TP393.02
类 型: 硕士论文
年 份: 2009年
下 载: 93次
引 用: 0次
阅 读: 论文下载
 

内容摘要


P2P应用的快速增长,带来网络拥塞、大量消费网络带宽等诸多问题,而传统的基于端口与有效载荷的网络流量分类方法存在着很多缺陷,研究按照5元组(源IP、源Port、目的IP、目的Prot及IP协议)的定义,将P2P报文分成双向TCP或UDP流,抽取独立于端口、协议和有效载荷的原始数据报文的信息作为P2P流的特征,形成特征向量,用特征向量表示流,流的分类类别为P2P的协议类型。用提出的基于ReliefF-CFS的方法选择流的特征子集,该方法结合ReliefF和基于相关性(CFS)两种特征选择方法,产生适合于分类P2P流的特征子集。首先利用ReliefF特征选择方法把候选特征按与类别相关性的大小排序,通过设定的阈值选择与类别相关性大的特征子集作为CFS选择方法的初始集,然后利用CFS结合正向搜索得到最终的较优特征子集。研究使用C4.5决策树、支持向量机(SVM)、K近邻(KNN)三种机器学习算法构建P2P流量分类器,利用获取的原始数据寻找分类器的最优分类参数,主要采用分类准确率和分类时间标准进行评估;并研究统计原始数据报文的部分信息分类P2P流,实验中分别统计流的双向50、100、150、200个报文信息,结果显示不仅减少了特征统计计算的复杂度和分类的时间,而且有更高的分类准确率。为了让研究的成果能有实际的应用价值,通过构建相应的硬件、软件环境,对P2P流量的在线实时分类作了初步的研究。设计并实现了基于机器学习算法的P2P流量分类原型系统,系统分类分类器构建和分类两个阶段,每个阶段有数据采集、数据解析、流的合成以及分类四个模块。

全文目录


相似论文

  1. 基于NS2的PeerCast模拟平台设计与实现,TP311.52
  2. 基于仿生模式识别的文本分类技术研究,TP391.1
  3. 唇读中的特征提取、选择与融合,TP391.41
  4. 面向Gnutella和eMule网络拓扑测量和安全性分析,TP393.08
  5. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  6. 语音情感识别的特征选择与特征产生,TP18
  7. P2P视频点播系统中服务节点数据调度策略研究,TN948.64
  8. 英汉命名实体翻译方法研究,TP391.2
  9. 基于JXTA的校园虚拟社区研究与实现,TP393.09
  10. 基于特征选择的入侵检测研究,TP393.08
  11. P2P数据副本问题的研究与实现,TP393.02
  12. 生物医学缩略语消歧,R-5
  13. 基于数据分布特征的文本分类研究,TP391.1
  14. 音像广播远程教育系统中直播服务器的设计与实现,TP311.52
  15. 基于P2P的流媒体视频点播系统的研究与实现,TN948.64
  16. 呼伦贝尔大学教务管理信息系统设计与实现,TP311.52
  17. 人类抗原肽载体结合力预测,R392.1
  18. 数据流特征选择策略的研究,TP311.13
  19. 领域间适应性情感分类方法研究,TP391.1
  20. 基于改进的SVM模型的肝癌识别方法的研究与实现,TP391.41
  21. 基于明文特征的P2P协议识别系统的研究与设计,TP393.02

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络结构与设计
© 2012 www.xueweilunwen.com