学位论文 > 优秀研究生学位论文题录展示
基于SMP的线程轻化相关研究
作 者: 张文力
导 师: 樊建平
学 校: 中国科学院研究生院(计算技术研究所)
专 业: 计算机系统结构
关键词: SMP 线程 轻化 调度 并行模拟器 Web服务器 Linpack
分类号: TP338.6
类 型: 硕士论文
年 份: 2005年
下 载: 102次
引 用: 1次
阅 读: 论文下载
内容摘要
约50年的并行计算历程中,从处理机内部指令集并行到集群尺度上的并行,都在现有计算能力的基础上,极大的开发了计算的潜能。随着线程应用日益广泛,体系结构、编译技术、编程模型、线程库等层面都在朝向更高并行度、更细并行粒度方向发展。同时,对网络信息服务类海量并发细粒度应用而言,利用传统线程不能如期获得SMP上的加速,而随着CMP和SMT的进展,线程开销的优化更是提上了日程。为此,本文围绕优于传统Posix线程的合适的调度粒度和相应高效低开销的调度切换技术展开讨论,以提高细粒度并行下资源的有效利用率。主要工作如下:基于pthread线程全面分析与开销测试,实验定量分析出pthread线程微秒级开销下同步粒度与多处理机上性能加速的关系:在相当于线程切换开销十倍量级的同步粒度下,执行流在多处理机上很难获得有效的性能提高,进而指出细粒度并行性能一定程度上受制于线程自身开销的问题。针对细粒度并行线程开销敏感问题,提出了资源自封闭体和主动调度机制,设计并开发了独立于操作系统的高效低开销调度模块。该调度模块兼顾核心级线程真正并行、用户级线程开销小的优点,可根据应用特征进行用户级调度,有效地减少了调度和切换开销,可高效实现每秒十万次级别的切换频度。初步达成线程粒度和切换开销的轻化,克服了细粒度并行应用在多处理机上利用标准线程无法有效获得加速的弊端。此外,该调度模块实现不改变操作系统核心的情况下有效利用多处理机,可广泛适用于此类相关度不大的细粒度并行应用。进一步,利用资源自封闭体的构造和该调度模块成功改善了并行模拟器SandFox的实际性能,获得了较标准线程库pthread实现而言几倍的提高。对于建立的高密度访问Web服务器模型,由于在微秒级同步粒度情况下,有至少30%以上的开销浪费于调度切换,应用轻化手段后如期获得CPU有效利用率的大幅提高。从而为网络信息服务类海量并发细粒度应用的性能提高研究提供了新的解决思路。另外,本文还分析了Linpack、NPB等常用并行应用,试图为线程轻化作应用特征准备。作为辅助分析,编写了误差精度在5%以内的Linpack仿真模型。利用该模型获得的详细开销数据表明,Linpack等常用高性能应用不适于轻化,文末给出总结以备后续轻化工作参考。
|
全文目录
摘 要 3-4 Abstract 4-10 第一章 引言 10-20 1.1 基于SMP 的并行研究现状 10-14 1.1.1 内核并行运行多进程、多线程存在的问题 10-11 1.1.2 对上述问题已有的解决思路及方法 11-14 1.2 国际前沿细粒度并行处理技术跟踪 14-16 1.3 细粒度并行研究的意义 16-18 1.4 本文的贡献 18-19 1.5 论文的组织 19-20 第二章 线程分析与测试 20-30 2.1 线程的由来 20-21 2.2 线程的优势与缺陷 21-24 2.3 线程流程分析 24-27 2.4 线程开销测试 27-29 2.5 本章小结 29-30 第三章 并行模拟器上的线程轻化研究 30-46 3.1 并行模拟器概述 30-32 3.2 问题分析及解决尝试 32-38 3.2.1 问题分析 32-35 3.2.2 相应的优化尝试 35-38 3.3 轻线程调度框架 38-41 3.4 改进测试与评估 41-45 3.5 本章小结 45-46 第四章 线程轻化在服务器访问模型上的扩展研究 46-58 4.1 Web 服务器概述 46-52 4.1.1 Web 服务器简介 46-47 4.1.2 Web 服务器的工作原理 47-49 4.1.3 Web 测试工具及性能指标 49-50 4.1.4 Web 服务器现状与主要问题 50-52 4.2 Web 服务器访问模型介绍 52-56 4.2.1 SpecWe699 概览 52 4.2.2 Web 服务器模型介绍 52-56 4.3 轻线程调度框架的应用 56 4.4 测试评估 56 4.5 本章小结 56-58 第五章 高性能应用线程轻化研究 58-66 5.1 线程轻化不适合HPL 58-62 5.1.1 HPL 简介 58-59 5.1.2 HPL 主要流程 59-61 5.1.3 HPL 仿真模型及验证 61-62 5.1.4 各部分开销参照 62 5.2 以NPB 为例的其他高性能应用分析 62-65 5.3 本章小结 65-66 第六章 总结与展望 66-72 6.1 线程轻化小结 66-68 6.2 本文工作总结 68-69 6.3 问题与下一步研究工作 69-72 附录A Linux 进程简介 72-78 A.1 Linux 进程状态说明 72-73 A.2 do_fork 具体流程及源码分析 73-75 A.3 schedule 具体流程及源码分析 75-78 附录B Pthread 简介 78-82 附录C 精确计时程序 82-84 参考文献 84-88 致谢 88-89 作者简历 89-90
|
相似论文
- 基于差分进化算法的JSP环境下成套订单研究,F273
- AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
- BioLab面向生物计算服务的网格系统,TP399-C8
- 无线传感器网络上的数据聚集调度算法,TP212.9
- 超声速巡航导弹姿态控制系统增益调度设计的参数化方法,TJ765.23
- 车载FlexRay主干网的构建与性能分析,TP273
- 车载CAN网络的网关设计方法研究,TP273
- 基于比对技术的非法网站探测系统的实现与研究,TP393.08
- 极端气象灾害下考虑不确定断线故障的电力系统随机优化调度,TM73
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 基于遗传—牛顿算法的公交优化调度,TP18
- 遥感数据处理网格平台的设计与初步实现,TP79
- 基于嵌入式Web服务器的监控系统研究,TP393.05
- 基于遗传算法的矿山资源优化调度模型的研究,O224
- 微粒群算法的改进与应用研究,TP18
- 船厂管加工车间生产计划仿真,U673.2
- 基于Map/Reduce框架的分布式日志分析系统的研究及应用,TP311.52
- 基于无线传输的公交车载媒体节目管理系统研究与开发,TP311.52
- 基于Click的模块化软件路由器的包调度算法研究,TP393.05
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|