学位论文 > 优秀研究生学位论文题录展示

多核平台上的并行程序性能调优技术与工具

作 者: 闫洁
导 师: 安虹;韩文廷
学 校: 中国科学技术大学
专 业: 计算机系统结构
关键词: PMU 硬件性能计数器 多线程分析 性能调优
分类号: TP332
类 型: 硕士论文
年 份: 2010年
下 载: 89次
引 用: 0次
阅 读: 论文下载
 

内容摘要


片上多核已经成为当今处理器设计的主流。在多核时代,为了将不断增长的片上资源转变为程序性能提升,必须充分利用其硬件多线程并行执行的优势。但是,并行程序的设计是困难的,设计不好的并行程序将不能有效利用硬件资源。从最初的串行算法到可以充分发挥硬件平台优势的高效的并行程序是一个不断调优的过程,必须从理解程序的算法行为和硬件行为两方面入手。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,使得在以极小的额外开销和极少的对目标程序的干扰的情况下在线记录程序运行时的微体系事件特征成为可能。基于PMU,我们在Linux系统中实现SMART(Sampling Monitoring Analyzing and ReTuning)性能调优工具;其功能包括(1)支持全系统范围或者针对特定进程以事件直接计数或者抽样的方法采集程序运行时的硬件行为特征数据,(2)借助编译技术,将采集到的性能事件数据与程序代码位置对应起来,(3)以命令行或图形窗口形式提供用户界面。本文的工作作为SMART项目的一部分,主要工作和成果包括以下几个方面。(1)设计了SAMRT的整体技术方案,划分并定义了SMART软件的功能模块;将其分为运行于用户层的前端与内核态的后端,前者负责数据后期处理与显示,后者负责底层数据采集。其中,后端进一步细分为以系统调用方式提供底层控制的Pview内核核心扩展和负责大规模数据抽样的PEngine驱动模块。(2)对SMART的实现原理进行了探讨,总结业内同类工具的工作机制,制定了SMART的技术策略。(3)实现了SMART后端中的Pview内核核心扩展部分;在内核核心中,为进程扩展了用于记录性能事件数据的pview上下文,提供了针对特定进程性能监测需要的进程控制机制,实现了一个新的系统调用pview。其中,许多技术是同类工作中首次采用的。

全文目录


摘要  4-5
ABSTRACT  5-13
第1章 绪论  13-22
  1.1 研究背景  13-17
    1.1.1 多核处理器平台的发展  13-15
    1.1.2 多核平台上的并行编程  15-16
    1.1.3 并行程序剖析与性能调优技术  16-17
  1.2 论文的研究目标和主要工作  17-18
  1.3 相关工作  18-20
    1.3.1 基于算法行为的程序性能分析  18-19
    1.3.2 基于运行时处理器微体系事件特征的性能分析  19-20
  1.4 论文的结构  20-22
第2章 基于硬件性能计数器的性能分析技术  22-36
  2.1 PMU 基础知识  22-31
    2.1.1 龙芯2F 的PMU 简介  22-24
    2.1.2 Intel 处理器的PMU 简介  24-31
  2.2 PMU 底层操作  31-32
    2.2.1 龙芯2F  31-32
    2.2.2 Intel 处理器  32
  2.3 基于硬件PMU 的性能分析方法  32-35
    2.3.1 对事件直接计数  32-33
    2.3.2 基于事件的抽样  33-35
  2.4 评价  35
  2.5 本章小结  35-36
第3章 SMART 软件结构与功能设计  36-44
  3.1 SMART 软件架构  36
  3.2 模块功能划分  36-42
    3.2.1 SMART 后端数据采集  37-38
    3.2.2 SMART 前端用户接口  38-42
  3.3 SMART 的特点与优势  42-43
  3.4 本章小结  43-44
第4章 Pview 内核扩展  44-68
  4.1 Pview 内核扩展概述  44-46
    4.1.1 内核扩展的必要性论证  44-45
    4.1.2 内核扩展的目标  45
    4.1.3 术语解释  45-46
  4.2 Pview 内核扩展关键技术  46-58
    4.2.1 Viewer-Viewee 机制  47-52
    4.2.2 进程上下文扩展  52-57
    4.2.3 全系统分析中的pview 上下文  57-58
  4.3 Pview 系统调用  58-67
    4.3.1 功能介绍  59-60
    4.3.2 Pview 处理流程  60-62
    4.3.3 Pview 部分功能的实现原理分析  62-67
  4.4 本章小结  67-68
第5章 PEgine 驱动模块  68-73
  5.1 概述  68-69
  5.2 PEinge 工作原理  69-72
    5.2.1 抽样数据类型  69
    5.2.2 基于事件的抽样过程  69-71
    5.2.3 抽样处理过程中的数据流  71-72
  5.3 本章小结  72-73
第6章 Pview 使用模式  73-78
  6.1 全系统范围的性能监测  73-75
  6.2 针对特定进程的性能监测  75-77
    6.2.1 View 模式  75-76
    6.2.2 Self-view 模式  76-77
  6.3 本章小结  77-78
第7章 全文总结  78-80
  7.1 研究工作和成果  78-79
  7.2 未来工作的展望  79-80
参考文献  80-82
在读期间发表的学术论文与取得的研究成果  82-83
在读期间参与的科研项目  83-84
致谢  84

相似论文

  1. 分布式同步相量测量技术的研究,TM935
  2. I2C总线、JTAG总线在电源管理类芯片测试中的应用,TN407
  3. 低频低压减载及其协调方法的研究,TM712
  4. 配电网中PMU的应用前景及优化配置的研究,TM769
  5. 基于PMU测量技术的连锁故障预防控制研究,TM732
  6. 电力系统同步相量测量新算法研究及装置设计,TM76
  7. PMU电网观测系统中新息图法参数估计研究,TM76
  8. 电网智能报警研究,TM76
  9. 贵州220KV电网PMU装置最优点配置设计,TM76
  10. 基于田口法的PSS参数优化以及PMU优化配置研究,TM76
  11. 基于DB2关系型数据库的查询性能调优,TP311.13
  12. WAMS/PMU数据处理及其在负荷建模中的应用,TM714
  13. 配电网电能质量监测点优化选址的研究,TM764
  14. 基于MapReduce的全文索引模块的设计与实现,TP391.3
  15. 基于同步相量技术的并网风电场静态电压稳定性评估,TM712
  16. 银行个人业务7x24服务系统的设计与实现,F832.2
  17. 基于PMU信息的快速网络拓扑分析,TM711
  18. 实时数据集市的设计与实现,TP311.13
  19. 基于PMU的同调机群识别及电网暂态稳定性预测新方法,TM712
  20. 基于PMU数据的励磁控制器参数辨识,TM76

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com