学位论文 > 优秀研究生学位论文题录展示

面向程序访存特征的存储优化技术研究

作 者: 马萌
导 师: 窦勇
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 访存特征 存储优化 OLTP 矩阵 FFT GPU
分类号: TP333
类 型: 硕士论文
年 份: 2011年
下 载: 43次
引 用: 0次
阅 读: 论文下载
 

内容摘要


性能的提高一直是计算机研究人员孜孜不倦追求的目标。随着大规模集成电路的发展,处理器的计算能力飞速提高。计算机性能提高的瓶颈由计算转变为存储。存储性能是程序访存特征和特定的存储结构共同作用的结果。程序访存特征的研究一直伴随着处理器的发展,为存储结构提供发展方向。针对Cache结构不区分程序数据和主存物理实现一维连续的特征,本文选取具有典型访存特征的应用程序,通过分析访存特征给出合理的存储优化方案:1)在共享Cache存储体系结构中,利用Simics+GEMS体系结构模拟器,分析基于PostgreSQL数据库在线事务处理不同数据集的访存特征,建立数据分类模型,将数据集划分为放弃型、保护型和自由竞争型三类;然后提出一种软件协同的半透明共享Cache结构区分对待三类数据集,实验结果证明Cache失效率最高下降率为12%。2)针对矩阵行列访问二维连续的特征和DRAM存储一维连续的特性,提出一种针对行列交替访问的优化方案——窗口访问,并证明了最优窗口原理,利用可重构实验平台实现窗口访问存储控制器,实验证明矩阵行列交替访问的存储性能提高可达73.6%,一维FFT并行算法性能可提高45.1%。3)基于窗口访问原理,指导CPU和GPU上矩阵数据的布局,优化矩阵行列交替访问程序,实验证明CPU中矩阵行列交替访问的存储性能最大提高58.4%,并实现窗口访问和FFTW结合的一维FFT并行算法,与FFTW相比计算性能提高可达7%;分析CUDA编程框架和相应GPU的结构特点,将窗口原理应用到GPU中以warp为单位的访存过程上,实验表明矩阵行列交替访问的存储性能提高了1倍。

全文目录


相似论文

  1. 无尾飞翼式飞行器主动控制的参数化方法,V249.1
  2. LDPC码译码算法的研究,TN911.22
  3. 离散切换系统稳定性分析及控制器设计,TP13
  4. 离散copula和quasi-copula的研究,O211.6
  5. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  6. 啤酒瓶在线检测相关技术的研究,TS262.5
  7. 基于FPGA的电台接口设计,TN791
  8. 基于模糊区分矩阵的区间信息系统属性约简,O159
  9. 电力系统谐波分析算法研究,TM711
  10. 基于虚拟仪器技术的失真度测量系统的设计与实现,TP274
  11. 长时延不确定网络控制系统的保性能控制,TP273
  12. 手持式低频振动信号采集系统与技术的研究,TP274.2
  13. 基于T-S模糊系统的非线性网络控制系统建模与分析,O231
  14. 基于DSP与FPGA的谐波分析系统研究,TM711
  15. 大规模水的动画和实时渲染技术,TP391.41
  16. 短波ALE信号检测设备设计,TN911.23
  17. 高性能FFT处理器的研究与FPGA实现,TN919.3
  18. OFDM系统中基于导频的信道估计算法的研究,TN919.3
  19. 基于CUDA的粒子滤波并行算法研究,TP391.41
  20. 基于GPU的计算机断层成像技术研究,TP391.41
  21. 多跨输流管道的稳定性分析,TB126

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 存贮器
© 2012 www.xueweilunwen.com