学位论文 > 优秀研究生学位论文题录展示
非对称多核体系下的阿姆达尔定律性能模型研究
作 者: 冯叶
导 师: 邓倩妮
学 校: 上海交通大学
专 业: 计算机系统结构
关键词: 阿姆达尔定律 非对称多核体系架构 并行计算模型 multi2sim
分类号: TP338.6
类 型: 硕士论文
年 份: 2012年
下 载: 34次
引 用: 1次
阅 读: 论文下载
内容摘要
阿姆达尔定律已经成为了并行计算性能模型中最为重要的定理之一,它简明清晰地论述了多核体系所带来的性能提升,以及在并行环境下应用程序的性能瓶颈所在,影响了后续一系列计算机理论的发展。并行理论一般基于对称多核体系进行研究,即所有的核都拥有同样的运算能力。但根据阿姆达尔定律的推导,此体系的并行任务性能最终会受限于串行部分所占的比例。为了寻求突破这瓶颈的方法,处理器领域中出现了非对称多核体系的新研究方向。但从对称架构转到非对称架构时,应该如何设计使得非对称架构的效果最佳,却缺少一定的理论分析、指导和实验。本文基于非对称多核体系架构,提出了一种将任务的串并行比例、底层核的具体配置等因素加入阿姆达尔定律的建模方法,通过量化两架构各自核的性能,分析架构之间的性能差异,进一步肯定了非对称体系的任务加速比优势。该理论模型同时发现当对称架构转化为非对称架构之时,应符合一定的设计转换原则才能最优化整个系统。模型在综合考虑加速比性能、硬件平台转换的开销以及上层任务串并行比例后,给出了架构转换的指导思想。本文的实验平台是multi2sim多核模拟器,通过修改源代码后使其支持了非对称多核的体系架构,并在该实验环境下运行相关的基准程序,验证了理论模型的部分结论,为后续的非对称架构发展和研究打下基础。
|
全文目录
摘要 5-6 ABSTRACT 6-11 第一章 绪论 11-20 1.1 研究背景与意义 11-12 1.2 相关研究 12-18 1.2.1 多核发展现状和趋势研究 13-14 1.2.2 阿姆达尔(Amdahl)定律理论研究 14-15 1.2.3 非对称多核总体性介绍 15-16 1.2.4 非对称多核单一指令集研究 16-18 1.3 本文组织结构 18-20 第二章 阿姆达尔定律及其改进 20-24 2.1 原始阿姆达尔定律介绍 20-21 2.2 基于硬件资源的阿姆达尔定律 21-23 2.2.1 相关名词介绍 21-22 2.2.2 公式与推论 22-23 2.3 非对称体系下最大化并行度的阿姆达尔定律 23-24 第三章 非对称多核架构下阿姆达尔定律的新模型分析 24-41 3.1 条件与假设 24-25 3.2 基本公式 25-26 3.3 对称架构与非对称架构之间的纵向分析 26-36 3.3.1 对称架构的单核性能与非对称架构大核性能相同的情况 27-29 3.3.2 非对称架构大核性能大于对称架构的单核性能的情况 29-33 3.3.3 非对称架构大核性能小于对称架构的单核性能的况 33-36 3.4 非对称架构体系下的横向分析 36-39 3.4.1 比较与分析 36-39 3.4.2 结论 39 3.5 总体结论 39-41 第四章 模型的限制 41-44 4.1 理论限制 41 4.2 实际应用中的限制 41-42 4.3 可行的解决方法 42-44 4.3.1 理论限制的解决方法探讨 42-43 4.3.2 实际应用中限制的解决方案探讨 43-44 第五章 实验平台与仿真测试 44-61 5.1 实验平台 44-54 5.1.1 硬件平台 44-45 5.1.2 仿真程序平台介绍 45 5.1.3 multi2sim 概况与模拟器具体介绍 45-49 5.1.4 支持对称多核体系的multi2sim 架构 49-52 5.1.5 改进的非对称多核体系multi2sim 架构 52-54 5.2 仿真测试的基准程序 54-58 5.2.1 基准测试程序的设计思想 54-55 5.2.2 基准测试程序集 55-58 5.3 实验分析 58-59 5.3.1 模拟器参数设置 58 5.3.2 实验结果 58-59 5.4 实验数据分析与对比 59-60 5.5 实验总结 60-61 第六章 总结与展望 61-63 参考文献 63-66 致谢 66-67 攻读硕士学位期间已发表或录用的论文 67
|
相似论文
- 基于异构Beowulf机群的并行计算模型的研究,TP338.6
- 异构环境中并行计算模型与任务调度的研究,TP338.6
- 高效并行计算系统中的计算模型与通信网络,TP338.6
- 可扩展数据驱动并行算法研究及应用,O246
- 面向数据通信优化的并行程序执行模型,TP338.6
- 分区管理模式给水管网的水力分析与模拟技术研究,TU991.33
- NHBL并行计算模型的扩展及其性能验证,TP316.4
- 并行微粒群算法研究,TP301.6
- 基于集群的并行Splatting算法关键技术的研究,TP316.4
- 一种改进的NHBL并行计算模型及其性能评测,TP338.6
- 基于局域网的并行计算负载平衡,TP393.1
- 分布式并行计算模型(DPCM)的设计与实现,TP311.52
- 基于Web Service的森林分布信息并行处理技术研究,TP311.52
- 分布式存储环境下并行计算可扩展性的研究与应用,TP338.6
- 面向共享存储系统的计算模型及性能优化,TP333
- 基于新兴古典经济学的资源分配方法研究,TP338.8
- 异构环境中并行计算模型与任务调度的研究,TP338.6
- 基于可用性的异构系统任务调度算法研究,TP338.8
- 异构计算环境下任务调度算法的研究,TP338.6
- 可扩展桌面PSE计算加速系统的设计与实现,TP338.6
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 各种电子数字计算机 > 并行计算机
© 2012 www.xueweilunwen.com
|