学位论文 > 优秀研究生学位论文题录展示

网络处理器的同步优化

作 者: 陈俊朴
导 师: 朱传琪
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 网络处理器 临界区 同步优化 程序划分 编程模型 编译器 流水线 网络程序 多处理机系统 关键路径
分类号: TP332
类 型: 硕士论文
年 份: 2008年
下 载: 30次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着英特网的爆炸性增长,网络系统必须在满足不断增长的网络链接速度的同时,能够灵活的应对网络的不断演化。对速度和灵活性的双重需求催生了新一代的网络硬件——网络处理器。为了适应新情况,网络处理器往往被设计成为并行多处理机系统。如果底层的体系结构的细节被原样暴露给程序员,编写这样的系统就意味着程序员必须进行直接的资源管理,分配和协调,这会使得编程成为一件不仅十分麻烦,而且非常容易犯错的工作。为了让程序员关心的焦点从这些细节转移到程序本身上面,高级语言和编程模型则隐藏了底层细节,并且用串行语义来描述程序,正如传统的C程序一样。如果采用高级语言编写程序,编译器就需要对程序进行自动并行化,把串行程序转换为并行程序,从而使得生成的代码能够正确的运行于多个处理器上。当针对多处理机系统对源程序进行自动并行化时,被高级语言和编程模型隐藏的细节必须得到正确的处理。其中,编译器必须保证引入了适当的同步代码,从而保持原来程序的串行语义。从网络程序的角度来看,需要进行同步的变量往往都是在处理不同的包时共享的程序内部状态。而另一方面,随着网络的爆炸和复杂化,不少网络程序变得拥有越来越多的状态,尤其是对网络协议栈中第四层以上的程序来说。其中的一个例子就是上层协议的网络程序中的会话状态。在这样的程序中,有更多的共享变量以及更多的数据相关。因此,编译器面临着的问题就是生成复杂的同步代码来保护程序中大量的内部状态在并行处理时不受到破坏。为了对编译器生成的同步进行优化,我们研究了针对Intel IXPauto-partitioning C编程模型的并行编译器,提出了一个全新的编译优化框架。在这个框架中,我们采用程序划分的方法来解决同步不同的线程时面临的各种困难和议题。实验给出了一个很好的性能结果,证明了我们的方法提升程序的并行性方面获得了可观的效果。

全文目录


摘要  6-7
Abstract  7-8
图目  8
表目  8-9
第1章 绪论  9-20
  1.1 网络处理器概论  9-11
  1.2 体系结构  11-13
  1.3 编程模型  13-20
    1.3.1 两种常见的模式:多处理和流水线  13-14
    1.3.2 两种模式的比较  14-15
    1.3.3 IXP Auto-Partitioning C编程模型和编译器  15-20
第2章 同步问题概述  20-24
  2.1 IXP Auto-partitioning C编译器的同步机制  20-21
  2.2 同步带来的问题  21-24
第3章 优化算法框架  24-27
  1. 相关性分析  24-25
  2. 计算临界区信息  25
  3. 条件分支合并  25-27
第4章 程序划分  27-37
  4.1 概述  27
  4.2 启发策略  27-30
  4.3 程序划分算法  30-37
    4.3.1 候选Cut的选择  31-32
    4.3.2 扩展候选Cut  32-34
    4.3.3 构造新的PPS  34-37
第5章 实验结果  37-42
  5.1 实验环境  37-39
  5.2 实验用例  39-40
  5.3 实验结果  40-42
第6章 结束语  42-44
  6.1 相关工作  42
  6.2 结语与展望  42-44
参考文献  44-47
后记  47-48

相似论文

  1. 处理器TI DSP VC33虚拟核的设计与实现,TP332
  2. NBZC公司生产计划系统优化设计,F426.4
  3. 高速网络环境下的入侵检测系统的研究,TP393.08
  4. 面向混合流水线的任务智能调度系统的研究与实现,TH186
  5. 抗内部存储单元失效的32位微处理器的研究与实现,TP333
  6. 高效能嵌入式处理器IP核,TP332
  7. 基于MIPS无线通讯设备驱动实现技术,TP368.1
  8. 多通道NANDFlash控制器的设计,TP333
  9. 基于VHDL的可编程逻辑器件虚拟实验平台的设计与实现,TP311.52
  10. 基于TOC的混合流水线调度方法,F273
  11. 区域造船的管理模式研究,U673.2
  12. 群组密钥协商协议编译器研究,TN918.2
  13. 基于TilePro64多核处理器的H.264高清视频解码软件设计,TN919.81
  14. 分布式文件系统客户端的设计与实现,TP338.8
  15. 14比特100兆采样/秒流水线模数转换器研究与设计,TN792
  16. 面向高性能DSP Matrix向量化编译器的设计与实现,TP314
  17. 基于网络处理器的Web用户体验测量研究,TP393.09
  18. 基于关键链技术的项目进度管理的研究,TH186
  19. 基于关键路径法求解车间调度问题的研究,F273
  20. 乘法器复用的多路FFT处理器研究与设计,TN919.3
  21. 云计算中MapReduce性能优化及应用,TP3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com