学位论文 > 优秀研究生学位论文题录展示
面向多核微处理器芯片的高效能I/O体系结构及其实现技术
作 者: 郭御风
导 师: 杨学军
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 多核处理器 高效能I/O体系结构 存储一致性模型 I/O一致性处理 Cache划分 I/O虚拟化 功耗优化 容错设计
分类号: TP332
类 型: 博士论文
年 份: 2010年
下 载: 63次
引 用: 0次
阅 读: 论文下载
内容摘要
人类对计算能力的需求、新体系结构和新工艺这三驾马车推动着作为现代高端计算机系统核心和引擎的高性能微处理器性能的不断提升。并行片上系统PSoC(Parallel System on Chip)的多核结构成为当前高性能微处理器的主要形态。随着计算机技术的不断发展,高端微处理器已经从追求单一的高性能转向追求综合的高效能,以求解决当前高性能计算领域所面临的实用性能、可编程性与成本、可移植性、鲁棒性等方面的问题。本文着重研究了多核微处理器中高效能I/O体系结构及其实现技术,从涵盖I/O的存储一致性模型、I/O性能优化方法、I/O虚拟化技术、I/O功耗优化方法和容错设计方法等方面展开研究,在体系结构一级探索解决多核处理器I/O系统的易编程、高性能、易用性、低功耗和可靠性等问题。论文的研究工作和创新点主要有以下几点:1、提出了面向多核结构的扩展I/O广义存储一致性模型本文针对多核结构中I/O相关的存储一致性问题展开研究。采用生产者和消费者模型,从时间和空间角度对多核处理器芯片内I/O一致性问题产生的原因进行分析,并提出了解决策略;针对多个处理器芯片直连构成的SMP系统中远程I/O访问带来的一致性问题,分析了其产生的本质原因,并提出了解决策略;把I/O一致性问题纳入多核结构中存储一致性问题的统一框架内,从处理器核、I/O和存储器相互关系的角度描述数据一致性问题,提出了面向多核结构的扩展I/O广义存储一致性模型,实验表明该存储一致性模型不仅可以为软件提供一个简单、高效的编程接口,而且显著提高了I/O访问的性能。2、提出了一种多核处理器I/O一致性处理优化方法本文针对多核处理器I/O一致性处理优化方法展开研究。分析了I/O数据的访问特性,对I/O数据访问特性进行了多角度刻画,提出了I/O访问的八大特性,并分析了不同的访问特性对I/O一致性处理方法的影响,为优化I/O一致性处理方法提供了理论指导;采用Cache划分方法对I/O Cache进行组织和管理,基于Cache划分的组织结构对I/O性能进行优化;提出了动态自选择混合I/O一致性处理优化方法对本地I/O访问和远程I/O访问进行性能优化,实验结果表明该方法对多种复杂I/O应用均能显著提高性能;针对传统工作模式下的I/O应用和面向用户级通信的I/O应用两种情况,分别提出了增强同步操作的I/O一致性维护方法和边界切割的I/O一致性维护方法,对远程I/O访问的一致性处理性能进行优化,实验结果表明,这些方法显著改善了远程I/O访问性能。3、从两个方面提出了多核处理器中硬件支持的I/O虚拟化优化方法本文针对多核处理器中硬件支持的I/O虚拟化优化方法展开研究,研究了硬件支持I/O虚拟化的两大关键技术—DMA重映射和中断重定向的优化方法。提出了基于Hint的高效IOTSB Cache的管理策略IOTCMBH和基于失效队列的失效策略IMBINQ,对DMA重映射方法进行优化;提出了多层可操控的中断处理模型和灵活可控的中断重定向方法对中断重定向进行优化;实验结果表明这些优化方法为I/O虚拟化提供了很好的硬件支持,同时显著降低了硬件支持虚拟化的性能开销和实现开销,几乎可以获得不支持I/O虚拟化情况下的I/O性能。4、从多个层次提出了多核处理器中I/O系统功耗优化方法和容错设计方法本文针对多核处理器中I/O系统的功耗问题和可靠性问题展开研究,从多个方面降低I/O功耗、增强I/O可靠性。在体系结构级对多核I/O系统提出了功耗优化和容错设计原则,指导功耗优化和容错设计;提出了增强多位纠错的数据驱动刷新的功耗优化方法,对基于eDRAM实现的I/O Cache功耗进行优化,实验结果表明该方法在不影响性能的同时,显著降低了eDRAM的刷新功耗;提出了基于Cache组织和混合低功耗模式的功耗优化方法,对基于SRAM实现的I/O Cache功耗进行优化,实验结果表明该方法显著降低了I/O Cache的静态功耗和读写访问的动态功耗;提出了前瞻预测的细粒度门控时钟方法,对I/O控制逻辑的动态功耗进行优化,实验结果表明该方法在不降低I/O性能的同时,显著降低了I/O控制逻辑的动态功耗;提出了基于多核处理器的软件Scrub容错方法对I/O系统的软错误进行容错设计,实验结果表明该方法能够较好地对I/O系统进行容错加固;提出了基于重发的I/O一致性处理方法,对I/O一致性协议进行容错设计,实验结果表明该方法以很小的性能开销显著提高了I/O一致性协议的可靠性。
|
全文目录
摘要 11-13 Abstract 13-15 第一章 绪论 15-33 1.1 课题研究背景 16-22 1.1.1 高性能微处理器的研究现状和发展趋势 16-18 1.1.2 多核处理器高效能I/O 系统面临的挑战 18-22 1.2 多核处理器高效能I/O 系统支撑技术及相关研究 22-28 1.2.1 存储一致性模型研究 22-23 1.2.2 I/O 性能优化方法研究 23-24 1.2.3 I/O 虚拟化技术研究 24-26 1.2.4 功耗优化方法研究 26-28 1.2.5 系统容错方法研究 28 1.3 本文主要研究内容和论文主要创新 28-31 1.3.1 本文主要研究内容 28-30 1.3.2 论文主要创新 30-31 1.4 论文结构 31-33 第二章 易编程:面向多核结构扩展I/O 广义存储一致性模型 33-62 2.1 多核处理器体系结构模型 33-36 2.2 多核结构I/O 一致性问题引入 36-42 2.2.1 概念和定义 36-38 2.2.2 I/O 一致性问题的产生 38-42 2.3 I/O 一致性问题处理策略 42-46 2.3.1 数据访问时机引起的一致性问题 42-44 2.3.2 数据访问位置引起的一致性问题 44-46 2.4 多芯片直连SMP 系统I/O 一致性问题 46-51 2.3.1 多芯片直连SMP 体系结构 46-47 2.4.2 片间I/O 一致性问题引入 47-50 2.4.3 片间I/O 一致性处理策略 50-51 2.5 面向多核结构扩展I/O 的广义存储一致性模型 51-60 2.5.1 GIOTSO 模型 55-56 2.5.2 GIOPSO 模型 56-57 2.5.3 理论分析和性能评测 57-60 2.6 本章小结 60-62 第三章 高性能:多核处理器I/O 一致性处理优化方法 62-98 3.1 I/O 事务定义及访问特性分析 62-65 3.2 基于Cache 划分的I/O Cache 组织结构 65-69 3.3 动态自选择混合I/O 一致性处理优化方法DSHIOCM 69-90 3.3.1 DSHIOCM 实现思想和算法 69-71 3.3.2 DSHIOCM 硬件实现技术 71-79 3.3.3 增强同步操作的片间 I/O 一致性处理方法 ESIOCM 79-84 3.3.4 边界切割的片间 I/O 一致性处理方法 BSIOCM 84-90 3.4 性能分析和评测 90-97 3.4.1 片内I/O 一致性处理方法性能比较 90-91 3.4.2 ESIOCM 方法和BSIOCM 方法性能评测 91-95 3.4.3 DSHIOCM 性能评测 95-97 3.4.4 实现开销分析 97 3.5 本章小结 97-98 第四章 易用性:多核处理器硬件支持I/O 虚拟化的优化方法 98-120 4.1 微处理器硬件支持的I/O 虚拟化方法 98-101 4.2 DMA 重映射优化方法研究 101-109 4.2.1 高效IOMMU 实现技术 101-105 4.2.2 基于Hint 的高效IOTSB Cache 管理策略IOTCMBH 105-108 4.2.3 基于失效队列的失效处理策略IMBINQ 108-109 4.3 灵活可控的中断重定向技术研究 109-113 4.3.1 多层可操控的中断处理模型 109-111 4.3.2 灵活可控的中断重定向方法 111-113 4.4 实验结果 113-119 4.4.1 测试环境 113-114 4.4.2 测试结果 114-119 4.5 本章小结 119-120 第五章 低功耗和容错:多核处理器体系结构级I/O 低功耗和容错设计 120-146 5.1 体系结构级低功耗和容错设计原则 121-122 5.2 I/O Cache 的功耗优化策略 122-131 5.2.1 基于eDRAM 的I/O Cache 功耗优化方法DDREMC 122-127 5.2.2 基于SRAM 的I/O Cache 功耗优化方法 127-131 5.3 前瞻预测的细粒度门控时钟策略PDFSCG 131-135 5.3.1 PDFSCG 方法实现思想和实现方法 131-134 5.3.2 实验结果 134-135 5.4 软错误加固的I/O 系统容错设计方法 135-139 5.4.1 基于多核处理器的软件Scrub 方法 135-138 5.4.2 实验结果 138-139 5.5 I/O 一致性协议容错设计 139-144 5.5.1 Cache 一致性协议 140-141 5.5.2 基于重发的I/O 一致性协议容错技术 141-143 5.5.3 实验结果 143-144 5.6 本章小结 144-146 第六章 结束语 146-150 6.1 本文主要工作和创新 146-147 6.2 研究展望 147-150 致谢 150-152 参考文献 152-172 作者在学期间取得的学术成果 172-174 作者在学期间取得的科技成果 174 作者在学期间参加的科研项目 174
|
相似论文
- TD-SCDMA无线链路控制协议实现研究,TN929.533
- 虚拟桌面系统中应用服务的管理与协同,TP316.7
- 基于Xen的声音设备虚拟化的研究,TP391.9
- 多核系统中基于温度限制的节能调度算法研究,TP332
- 基于逻辑卷的分级存储系统设计与实现,TP333
- 基于硬件计数器虚拟化的多虚拟机性能评测研究,TP302
- 分布式内存多核处理器流程序虚拟机研究,TP333.1
- 轻量级虚拟机管理器及其安全应用研究,TP302
- 基于锁感知的多处理机VCPU调度系统,TP332
- 轻量级虚拟机的多平台扩展,TP391.9
- 虚拟计算环境中CPU开销的测量系统,TP332
- 虚拟域内访问控制系统的保护机制研究,TP309.2
- 面向移动平台的桌面虚拟化机制研究,TP316.7
- 面向逻辑虚拟域的多级访问控制系统,TP309
- 基于虚拟机内存模板的云计算服务系统,TP393.09
- 基于硬件虚拟化的文件保护系统的研究,TP309
- 基于虚拟机的安全监测研究,TP274
- 基于TILE Pro64多核处理器的3G服务器视频转码软件设计,TP393.05
- 基于TilePro64多核处理器的H.264高清视频解码软件设计,TN919.81
- 虚拟桌面管理的研究及应用,TP316.7
- 基于Linux的分布式交换机设备虚拟化技术研究,TP393.05
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|