学位论文 > 优秀研究生学位论文题录展示
GPU上散列算法库的研究与实现
作 者: 李凯
导 师: 陈虎; 荣霓
学 校: 华南理工大学
专 业: 软件工程
关键词: GPU CUDA 散列算法库 并行优化
分类号: TP311.52
类 型: 硕士论文
年 份: 2013年
下 载: 9次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,随着信息安全领域相关技术的不断发展,各种口令保护的技术也在不断提高,搜索空间和计算量也在不断增大。从理论上来讲,只要知道其中相关口令散列算法并且有足够的时间,任何口令都是可以搜索到的,但是如果口令长度很长、组合方式很多,相关的加密散列算法很复杂时,那么整个搜索的时间成本也会很高。从现实来看,仅仅依靠CPU的计算能力已经无法满足应用的需求。图形处理器GPU作为近年来新兴的高性能技术,在计算能力上相对CPU来说有着很明显的优势,并且其可编程性和功能都得到很大扩展,可以很好地弥补CPU这一方面的不足。因此,如何挖掘GPU的潜在硬件性能,提高处理大数据量散列算法计算能力俨然成为当前信息安全领域研究的方向之一。本文基于对常见散列算法的深入研究,根据GPU体系结构的特点,首先提出一种GPU上散列算法的统一处理流程,然后在此基础上设计并实现一种GPU版本的散列算法库,这样不仅可以极大提高处理大数据量散列算法计算能力,而且可以减少对常见散列算法的开发成本,对信息安全领域的发展具有深远的意义。本文主要研究GPU上散列算法库的优化与实现,提出了一种统一处理计算平台模型,并通过几种基本的散列算法验证了整个计算平台模型的可用性和实用性,但是随着散列算法方式的增多,会出现更多复杂的散列算法,本文只研究了一些基本的散列算法,这对于该计算平台模型的兼容性是不够的。接下来我们将考虑去研究其它复杂的散列算法,对散列算法库进一步扩充。对于我们已开发的一些散列算法库有可能存在未发挥出最大的GPU并行性能的情况,还有性能提升的空间,我们还会继续优化这部分并挖掘其潜在的性能。从总体看来,我们开发的GPU上的散列算法库还是非常有效的,对于未来散列算法的研究具有长远的意义。
|
全文目录
摘要 5-6 Abstract 6-9 第一章 绪论 9-11 1.1 研究的背景和意义 9 1.2 论文的主要工作 9-10 1.3 论文的研究内容和组织结构 10-11 第二章 GPU 体系结构与编程模型 11-18 2.1 GPU 体系结构 11-12 2.2 CUDA 编程模型 12-14 2.3 CUDA 优化的主要方法 14-17 2.4 本章小结 17-18 第三章 GPU 上散列算法的测试平台 18-24 3.1 GPU 上散列算法开发流程与测试平台 18-23 3.1.1 散列算法开发流程 18-19 3.1.2 测试平台 19-23 3.2 本章小结 23-24 第四章 GPU 上散列算法库的设计与实现 24-64 4.1 软件总体结构 24-25 4.2 CPU 和 GPU 上算法库的通用接口 25-26 4.3 公共接口库的设计与实现 26-40 4.3.1 明文的读取 27-29 4.3.2 字符的填充 29-31 4.3.3 基于树的批量结果匹配 31-34 4.3.4 单词的变换 34-39 4.3.5 结果返回 39-40 4.4 基础算法库的设计与实现 40-51 4.4.1 SHA-1 算法库的设计与实现 41-47 4.4.2 MD4 算法库的设计与实现 47-48 4.4.3 MD5 算法库的设计与实现 48-51 4.5 典型复杂算法 UNIX_MD5 的设计与实现 51-63 4.5.1 UNIX_MD5 算法描述 51-53 4.5.2 GPU 版本 UNIX_MD5 算法优化设计 53-63 4.5.3 GPU 版本算法正确性测试 63 4.6 本章小结 63-64 第五章 实验测试结果 64-67 5.1 测试环境 64 5.2 公共接口库的性能 64-65 5.2.1 明文读取的负载比例 64 5.2.2 树的批量结果匹配性能 64-65 5.3 UNIX_MD5 的性能 65-66 5.3.1 测试平台级测试 65-66 5.3.2 系统级测试 66 5.4 本章总结 66-67 总结与展望 67-69 总结 67-68 展望 68-69 参考文献 69-71 致谢 71-72 附件 72
|
相似论文
- 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
- 基于CUDA的图像数字水印技术的研究,TP309.7
- CUDA平台下数字图像认证方法的设计与实现,TP391.41
- 基于GPU并行加速的正射影像生成研究,TP391.41
- 基于GPU的水下环境的实时模拟,TP391.41
- 基于神经网络与GPU的手写数字识别及其试卷管理,TP391.43
- 基于GPU的BLAST程序的并行计算的研究,TP338.6
- 直接体绘制相关技术研究,TP391.41
- 基于GPU的医学图像体绘制算法的研究与实现,TP391.41
- 基于GPU的常见散列算法并行实现及优化,TP391.41
- 基于元胞自动机模型的硅各向异性腐蚀模拟,TB304
- CUDA技术在多节点超短期负荷预测上的应用,TM715
- GPU在车辆检测与跟踪系统中的应用研究,TP391.41
- 水稻分蘖断层图像重建加速研究,TP391.41
- 基于并行计算的立体影像密集匹配算法研究,TP391.41
- 基于原子分解的SAR成像及其GPU的实现技术,TN957.52
- 自然三维电视系统中深度获取算法研究,TN949.2
- 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
- 基于GPGPU的快速白光干涉测量系统研究,O439
- 基于多图形处理器的高效波动声学模拟器及其应用,TP391.41
- 群体仿真算法研究及疏散仿真系统开发,TP391.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|