学位论文 > 优秀研究生学位论文题录展示
专用视频处理器指令集研究与数据通路设计
作 者: 麻巍
导 师: 严晓浪
学 校: 浙江大学
专 业: 电路与系统
关键词: 专用指令集处理器 视频处理 指令集 变长编码 汇编器 数据通路
分类号: TP332
类 型: 硕士论文
年 份: 2008年
下 载: 50次
引 用: 3次
阅 读: 论文下载
内容摘要
指令集处理器 的学位论文">专用指令集处理器具备了专用集成电路的高效性与通用处理器的灵活性,在视频处理领域有着广阔的应用前景。本文围绕面向视频应用的专用指令集处理器,在指令集和体系结构方面进行了研究。通过对典型视频应用的研究与分析,提取并归纳出视频处理中复杂度集中关键函数。通过对关键函数的深入研究,发现其中存在着并行性高,指令组合运算丰富,数据精度低等特性。在此基础上,设计了一套SIMD/VLIW混合结构的专用指令集。专用指令集结合SIMD和VLIW指令体系的特点,支持指令条件执行、计算结果饱和处理,内置数据组织等扩展指令功能,并针对视频处理中复杂度集中的运算核心,设计了专用的加速指令。典型视频运算核心的测试表明,与MMX,SSE2等通用处理器媒体扩展相比,采用SIMD/VLIW混合结构指令集能显著减少时钟数和非计算开销,实现高效的视频处理。VLIW体系会造成代码长度膨胀,给嵌入式系统带来资源上的浪费。本文采用动态变长编码方法,采用添加取指控制码的形式,在编码时有效地消除了VLIW指令束中的空指令;采用双字和单字两种指令编码宽度,提高指令内部的编码效率。测试表明,对于典型的视频运算核心,动态变长编码的代码长度仅为VLIW定长指令束编码的20%~35%。为了能支持动态变长编码和特殊的指令格式,本文设计了混合结构指令集的汇编器。汇编器采用了两遍扫描结构来解决前向应用,通过词法扫描、语法解析、代码生成等步骤,将汇编代码转换成可执行的目标文件,并生成动态变长编码所需的取指控制码。在基于SIMD/VLIW混合结构指令集的专用指令集视频处理器设计中,完成了数据通路模块的微体系结构设计和实现。数据通路模块具有4级流水线结构,包含4路并行的算术逻辑,乘法,移位等27个功能单元。它能根据指令类型和数据精度的要求,进行1、2、4和8路的并行计算;能支持视频处理专用指令,实现对视频运算核心的加速。数据通路模块支持数据旁路和标志位产生,并能对运算结果进行多种方式的饱和处理。
|
全文目录
摘要 3-4 ABSTRACT 4-11 第1章 绪论 11-16 1.1 研究背景 11-13 1.1.1 视频编解码技术发展现状 11-12 1.1.2 指令集处理器 的学位论文">专用指令集处理器(ASIP) 12-13 1.2 课题研究的意义 13 1.3 相关研究的现状 13-14 1.4 本文研究的内容和文章结构 14-16 1.4.1 研究的主要内容 14-15 1.4.2 论文的组织结构 15-16 第2章 视频标准的特性分析 16-28 2.1 视频压缩标准的定性分析 16-19 2.1.1 MPEG-2 17 2.1.2 H.263 17-18 2.1.3 MPEG-4 18 2.1.4 H.264 18-19 2.2 视频压缩标准的定量分析 19-27 2.2.1 Mediabench Ⅱ Video&Image基准测试集 19-20 2.2.2 视频典型应用的复杂度分析 20-26 2.2.2.1 测试工具 20-22 2.2.2.2 复杂度分析结果 22-24 2.2.2.3 对关键函数的分析 24-26 2.2.3 视频典型应用的指令和数据类型 26-27 2.3 本章小结 27-28 第3章 面向视频应用的指令集设计 28-44 3.1 加速视频处理的指令集设计策略 28-39 3.1.1 采用并行处理技术 28-30 3.1.1.1 采用SIMD技术实现数据级并行 28-29 3.1.1.2 采用VLIW技术实现指令级并行 29-30 3.1.2 扩展指令功能 30-34 3.1.2.1 计算结果饱和处理 30-32 3.1.2.2 指令条件执行 32-33 3.1.2.3 内置数据组织 33-34 3.1.3 设计专用指令 34-39 3.1.3.1 运动估计加速指令 35-36 3.1.3.2 DCT/IDCT变换加速指令 36-37 3.1.3.3 插值和滤波加速指令 37-39 3.2 面向视频应用的专用指令集 39-41 3.3 专用指令集性能评估 41-44 第4章 变长指令编码研究和汇编器设计 44-59 4.1 变长编码研究 44-51 4.1.1 VLIW技术的瓶颈 44-45 4.1.2 解决代码膨胀的方法 45 4.1.3 动态变长指令编码 45-50 4.1.4 动态变长编码性能分析 50-51 4.2 指令集汇编器设计 51-59 4.2.1 汇编器总体结构设计 51-53 4.2.2 汇编器具体实现 53-59 4.2.2.1 词法分析 53-54 4.2.2.2 语法分析 54-56 4.2.2.3 计算标签地址 56-57 4.2.2.4 产生目标代码 57-59 第5章 专用指令集视频处理器数据通路设计 59-73 5.1 专用指令集视频处理器SCHUBERT 59-62 5.1.1 Schubert概述 59-61 5.1.2 Schubert的流水线结构 61-62 5.2 处理器数据通路设计 62-72 5.2.1 Schubert数据通路的主要特点 62-63 5.2.2 数据通路的总体结构 63-65 5.2.3 数据通路功能单元设计 65-72 5.2.3.1 EX0级功能单元 65-68 5.2.3.2 EX1级功能单元 68-69 5.2.3.3 EX2级功能单元 69-70 5.2.3.4 EX3级功能单元 70-71 5.2.3.5 计算结果饱和处理 71-72 5.3 本章小结 72-73 第6章 总结和展望 73-75 6.1 结论 73 6.2 未来展望 73-75 参考文献 75-78 攻读硕士学位期间发表/录用的学术论文 78-79 致谢 79
|
相似论文
- 基于嵌入式系统钻孔成像装置的研究,P634.3
- 基于Davinci技术的车辆检测与跟踪算法的研究与实现,TP301.6
- 基于Cortex-A8平台的H.264解码器优化,TN919.81
- 多DSP目标检测软件设计与优化,TP368.1
- 基于DM368的高清IP Camera的软件系统设计与实现,TP391.41
- 基于DM368处理器的单通道视频编码器系统软件设计,TN919.81
- 基于蓝牙通信的汽车音响软件设计与实现,TN925
- 高性能低功耗多核处理器研究,TP332
- 虚拟机平台的设计与关键模块的实现,TP302
- 机器人图形化编程系统的设计与实现,TP242
- 实时随机SQL注入攻击检测方法的研究与应用,TP393.08
- 多目标指令集模拟器的设计与实现,TP391.9
- DRRAD系统研究与实现,TP309.7
- 基于显式通信指令集的分片式处理器模拟器开发,TP332
- 基于TTA可配置处理器的指令集仿真器及集成开发环境的设计,TP337
- FT-Matrix处理器指令集与指令派发设计,TP332
- ECC协处理器专用指令与可重构单元设计技术研究,TN918.2
- 基于FPGA的USB、Flash控制器设计,TN791
- 基于DSP技术广播/电视执行终端的研制,TP277
- 视频监控系统中的多目标检测与跟踪技术研究,TP391.41
- ARM体系结构虚拟化技术的研究与实现,TP368.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 电子数字计算机(不连续作用电子计算机) > 运算器和控制器(CPU)
© 2012 www.xueweilunwen.com
|