学位论文 > 优秀研究生学位论文题录展示
多语种—多媒体电子词典资源平台和大型英汉维电子词典的研究和实现
作 者: 艾山·吾买尔
导 师: 吐尔根·依布拉音
学 校: 新疆大学
专 业: 计算机应用技术
关键词: 数据压缩 PPMD算法 维吾尔文排序 快速查找 二分查找 屏幕取词 语音朗读
分类号: TP311.52
类 型: 硕士论文
年 份: 2007年
下 载: 122次
引 用: 0次
阅 读: 论文下载
内容摘要
目前市场上已经存在很多电子词典软件,可是还没有提供用于电子词典软件资源收集和整理的系统。在本文中主要介绍电子词典资源生成系统的结构及数据压缩等核心技术的实现方法。另外介绍,在使用此电子词典资源生成收集和整理资源开发出的英汉维电子词典软件的总体设计,功能特点和核心技术的研究方法。电子词典资源生成系统部分主要介绍词典开发所需资源的组织方式,数据的压缩方法,文件结构的定义,各种形式的文件的关联方法等题目上进行了理论论述和研方法。在本重点介绍了数据压缩,多媒体文件的合并处理,文件结构的定义,维吾尔文文本的排序方法等题目上进行了详细的介绍和算法设计。英汉维电子词典部分主要介绍词典功能的设计和实现方法。在本文中重点介绍了快速检索,屏幕取词,语音朗读等三个主要功能的技术难点,算法设计,流程图。其一,详细讨论了各种查找算法,算法选择依据和算法的实现等环节的详细内容;其二,给出了维吾尔文屏幕取词技术的算法和算法的流程图。其三,在微软公司的TTS语音合成的基础上,自主开发了维吾尔文语音朗读功能。
|
全文目录
摘要 2-3 Abstract 3-7 第一章 绪论 7-12 1.1 课题概述 7-8 1.1.1 课题来源 7 1.1.2 课题提出背景 7-8 1.1.3 课题成果和完成情况 8 1.2 电子词典编纂技术的发展现状和趋势 8-10 1.2.1 国内外电子词典编纂技术的发展现状和趋势 8 1.2.2 电子词典的发展现状和趋势 8-10 1.3 应用前景 10-11 1.4 本文的工作 11 1.5 本文的组织结构 11-12 第二章 电子词典开发和资源加工技术相关概念 12-16 2.1 电子词典工程 12 2.2 编码统一处理 12 2.3 词库整理 12 2.4 资源格式统一 12-13 2.5 资源库的结构及资源存储 13 2.6 数据压缩技术和简史 13-14 2.7 查找算法 14-15 2.8 屏幕取词 15 2.9 语音朗读 15-16 第三章 电子词典资源生成系统的总体设计 16-23 3.1 需求概述 16 3.2 系统特点和功能 16-17 3.3 系统功能结构 17-18 3.4 数据库结构 18-20 3.4.1 词库数据表 18-19 3.4.2 单词属性标志符信息表 19 3.4.3 图像图片信息存储数据表 19-20 3.4.4 语音信息存储数据表 20 3.5 资源库文件结构 20-22 3.5.1 词库文件(DIC) 20-21 3.5.2 图库文件(BFD) 21-22 3.5.3 语音库文件(SFD) 22 3.6 本章小结 22-23 第四章 电子词典资源生成系统核心技术概念和实现 23-35 4.1 排序算法介绍和比较 23-24 4.2 维吾尔文的Unicode 编码排序算法的设计和实现 24-27 4.3 常用数据压缩算法 27-32 4.3.1 Huffman 编码 27-28 4.3.2 LZW 压缩算法 28-30 4.3.3 算数编码 30-31 4.3.4 PPM 数据解压缩算法 31-32 4.4 词库压缩程序的设计和实现 32-34 4.4.1 选择PPMD 算法为词库解压缩算法的依据 32-33 4.4.2 词库压缩程序的设计 33-34 4.5 本章小结 34-35 第五章 电子词典软件的总体设计 35-40 5.1 系统特点和功能 35 5.2 系统功能结构 35-36 5.3 系统文件结构 36-38 5.4 系统运行机制 38-39 5.5 本章小结 39-40 第六章 电子词典软件核心技术的算法设计和实现 40-62 6.1 常用查找算法 40-41 6.1.1 顺序查找 40 6.1.2 二分查找 40-41 6.1.3 分块查找 41 6.2 英汉维吾尔文二分查找算法的实现 41-46 6.2.1 二分查找算法的选择依据 41-42 6.2.2 英汉维吾尔文二分查找算法的实现 42-46 6.3 屏幕取词相关技术概念 46-55 Windows 系统内存结构 46 6.3.1 HOOK 技术简介 46-52 6.3.2 PE 文件 52-55 6.4 英汉维屏幕取词技术的实现 55-59 6.4.1 实现屏幕取词的原理词 55-56 6.4.2 英汉维屏幕取词技术的比较 56 6.4.3 英汉维屏幕取词技术的实现方法 56-57 6.4.4 字符输出函数拦截过程的设计和实现 57-59 6.5 文本朗读 59-61 6.5.1 Microsoft Speech SDK 简介 59 6.5.2 如何使用 Microsoft Speech SDK 59-60 6.5.3 英汉维语音朗读功能设计和实现 60-61 6.6 本章小结 61-62 第七章 电子词典资源生成系统和电子词典软件的功能介绍 62-66 7.1 基于Unicode 多语种-多媒体电子词典生成系统 62-63 7.2 碧黎库特英汉维电子词典软件 63-66 第八章 结论 66-67 参考文献 67-70 致谢 70-71
|
相似论文
- 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
- 广域网数据压缩算法的研究与实现,TP391.41
- 中文XML压缩技术研究,TP311.11
- 卫星任务规划分布式协同平台流程设计及算法研究,TP751
- DNA序列数据压缩算法研究,TP311.13
- 移动GIS中矢量数据压缩及传输问题研究,P208
- Huffman编码在环保实时监测系统中的研究与应用,TP274.4
- 基于RFID标签的商品防伪技术研究,TP391.44
- 基于DICOM标准的动态文件分析与处理,TP391.41
- 基于GSM和Google Earth的GPS远程定位技术研究,TN967.1
- 基于压缩感知技术的SAR原始回波数据压缩方法研究,TN958
- 任意波形发生器波形输入接口装置及算法的设计和实现,TN741
- 质谱数据结构化存储及压缩问题研究,Q51
- 小波分析在机车信号记录数据压缩存储中的应用,U284.4
- 基于数据压缩处理算法的数据采集与监控系统的研究,TP274.2
- 国家级互联网域间路由安全监测系统的设计与优化,TP393.08
- 监控组态软件实时数据库系统的设计与实现,TP311.13
- 嵌入式地理信息系统的研究与实现,TP368.12
- 并行小波高速计算研究及其在电力系统中的应用,TP338
- 面向智能电网的PMU测量数据传输的研究,TM73
- Walsh权函数神经网络研究及其应用,TP183
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|