学位论文 > 优秀研究生学位论文题录展示
流处理器相变存储器主存的性能优化
作 者: 郝秀蕊
导 师: 安虹
学 校: 中国科学技术大学
专 业: 计算机系统结构
关键词: 相变存储器 流处理器 避免冗余位写 非易失性 访存调度算法
分类号: TP333
类 型: 硕士论文
年 份: 2011年
下 载: 66次
引 用: 0次
阅 读: 论文下载
内容摘要
单芯片多处理器的发展和应用不断增加的性能和精度要求,需要计算机的主存系统增加容量以保存更大的工作集。DRAM是过去的几十年里计算机主存系统采用的主流技术。但DRAM的工作原理决定了其可扩放性较差,且随着主存容量的扩展,DRAM的漏电流功耗在主存系统能耗中所占的比例逐渐和动态功耗持平。随着CMOS工艺不断向16nm的极限尺寸发展,处理器片上存储层次也需要新的存储技术代替存储密度较低而能耗较高的SRAM。以PCRAM和STT-RAM为代表的新型存储技术成为存储器系统方面的研究热点。PCRAM是非易失性的存储器,具有很低的漏电流功耗,PCRAM具有接近完美的可扩放性和数倍于DRAM的存储密度。虽然PCRAM在存储密度和漏电流功耗控制方面具备了代替DRAM的能力,但是要用PCRAM完全代替DRAM目前还需要在降低读写延时,扩展生命周期,控制动态功耗等关键技术方面进行改进。本文主要从三个方面进行研究:利用避免冗余位写技术延长PCRAM的生命周期,利用避免行缓存写回技术降低读写延时和动态功耗,并评估了访存调度算法对PCRAM性能的影响。主要研究内容和成果包括:(1)研究了PCRAM的工作原理,为PCRAM建立了抽象的性能模型,并将该模型用于模拟流处理器的主存系统。(2)研究了PCRAM的非易失性,并提出了利用该特性对PCRAM性能进行优化的新技术。采用避免冗余位写技术优化了PCRAM的可写次数,从而延长了PCRAM主存系统的生命周期;利用避免行缓存写回技术减少了无效写操作的次数,有效的弥补了避免冗余位写技术带来的性能损失,提高了PCRAM主存的性能同时降低了动态功耗。实验评测了以上两种技术的优化效果:避免冗余位写技术平均使PCRAM生命周期延长3.2倍,优化后的写操作能耗是原系统写操作能耗的42%。(3)通过对PCRAM存储技术特点和流处理器访存特征的分析,评测了不同访存调度策略对PCRAM主存性能的影响。对测试程序实验结果的分析显示,选择适合PCRAM技术特点的访存调度算法对程序性能有显著影响。
|
全文目录
摘要 4-5 ABSTRACT 5-10 图片目录 10-11 表目录 11-12 第1章 绪论 12-22 1.1 研究背景 12-19 1.1.1 计算机系统主存的发展趋势 12-13 1.1.2 CMOS 工艺的发展 13-14 1.1.3 DRAM 的结构 14-16 1.1.4 DRAM 的发展趋势 16-17 1.1.5 磁随机存储器 17-18 1.1.6 相变存储器 18-19 1.2 PCRAM 用作流处理器主存的研究意义 19-20 1.3 论文的研究目标和主要工作 20-21 1.4 论文的结构 21-22 第2章 相关工作 22-38 2.1 对DRAM 结构的重新思考 22-26 2.2 PCRAM 的背景知识 26-30 2.2.1 PCRAM 的结构和工作原理 26-27 2.2.2 MLC-PCRAM 27-29 2.2.3 工艺偏差对PCRAM 的影响 29-30 2.3 使用新型存储技术的混合Cache 30-33 2.4 PCRAM 用作主存系统 33-37 2.4.1 高性能PCRAM 主存的构建 33-34 2.4.2 使PCRAM 成为可行的DRAM 替代品 34-35 2.4.3 DRAM 和PCRAM 组成的高性能主存系统 35-37 2.5 小结 37-38 第3章 流处理器的 PCRAM 主存系统 38-54 3.1 流处理器的编程模型和总体结构 38-40 3.1.1 流的结构和StreamC/KernelC 的编程模型 38-39 3.1.2 流处理器的总体结构 39-40 3.2 流处理器的访存系统 40-49 3.2.1 AG 模块及实现 42-43 3.2.2 bank 控制器及其实现 43-45 3.2.3 MSHR 的结构及实现 45-48 3.2.4 Bank buffer 体缓存 48 3.2.5 DRAM 的结构和存储体的状态转换图 48-49 3.3 PCRAM 功能模型及主存系统 49-52 3.3.1 PCRAM 的建模方法 49-51 3.3.2 Isim 中PCRAM 建模方法 51-52 3.3.3 PCRAM 的主存系统 52 3.4 小结 52-54 第4章 流处理器的 PCRAM 主存优化技术 54-69 4.1 测试程序简介 54-58 4.1.1 快速傅里叶变换 54-55 4.1.2 JPEG 编码算法 55 4.1.3 MPEG 编码算法 55-56 4.1.4 Depth extration 算法 56 4.1.5 STAP 算法 56 4.1.6 小结 56-58 4.2 优化技术的采用及性能评测 58-67 4.2.1 未优化的PCRAM 主存和DRAM 主存性能比较 58-59 4.2.2 优化PCRAM 的可写次数:避免冗余位写的应用 59-60 4.2.3 RBWR 对PCRAM 生命周期的影响 60-62 4.2.4 优化PCRAM 主存的访存性能:避免行缓存写回技术 62 4.2.5 RBWBR 的优化效果 62-63 4.2.6 访存调度算法的影响 63-65 4.2.7 适合PCRAM 的访存调度算法 65-67 4.3 优化后的 PCRAM 主存系统 67 4.4 小结 67-69 第5章 全文总结 69-71 5.1 研究工作和成果 69-70 5.2 未来工作的展望 70-71 参考文献 71-74 在读期间发表的学术论文与取得的研究成果 74-75 在读期间参与的科研项目 75-76 致谢 76
|
相似论文
- 相变存储器测试方法及测试系统的研究,TP333
- NAND Flash文件系统研究与实现,TP333
- 基于PCIE接口混合存储系统的设计与实现,TP333
- 用于相变存储器的SnTe-Ge2Sb2Te5和Bi2Te3基相变材料研究,TP333
- 全功能相变存储器芯片设计及后集成工艺研究,TP333
- 基于M5的混合型内存系统仿真及其应用,TP333
- SiN_x掺杂SbTe相变存储材料研究,TP333
- 基于共享前端的流多核体系结构关键技术研究,TP332
- 微纳米阻变存储阵列的制备与机理研究,TP333
- 基于流处理器的采摘机器人图像加速系统研究,S24
- 流处理器和FPGA异构计算技术研究与实现,TN791
- 基于钛氧化物的纳米存储阵列制备和机理研究,TP333
- 相变存储器低功耗优化研究及其在多态存储中的应用,TP333
- 相变随机存储器电特性测试方法研究,TP333
- 相变存储器存储单元结构与工艺研究,TP333
- 相变存储器的热分析以及结构设计,TP333
- 非易失性存储器IP的功能研究与设计,TP333
- 利用PCM实现操作系统快速唤醒的研究,TP316
- 基于嵌入式Linux的汽车行驶记录仪存储系统的设计与实现,TP216.2
- 用于新型相变存储器的锗锑碲薄膜的结构和电学性质,O484.42
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 存贮器
© 2012 www.xueweilunwen.com
|