学位论文 > 优秀研究生学位论文题录展示

汉字键盘输入和非键盘输入若干问题研究

作 者: 张建勋
导 师: 吴建国
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 汉字输入法 键盘输入 联机手写汉字输入 模糊匹配 字符串匹配 笔划特征点
分类号: TP391.43
类 型: 硕士论文
年 份: 2003年
下 载: 155次
引 用: 3次
阅 读: 论文下载
 

内容摘要


本篇论文主要研究了自然输入汉字方法(包括键盘输入和联机手写汉字输入)的实现,致力于解决实现汉字自然输入过程中出现的若干问题。这里所谓的自然输入汉字的方法,是指无需经过太多的学习和训练便能掌握的方法。本文从汉字结构出发,将汉字笔划分类,并将国标二级字库中的汉字用笔划进行编码,制定了笔划编码字典,统计了笔划信息的各种数据。根据笔划编码字典和笔划统计信息,设计了笔划编码汉字输入的方法和实现该方法的键盘。 由于汉字的平均笔划数过多,在用笔划编码方法输入汉字时,如果完整的输入汉字笔划就会使得码长过长。为了实现汉字输入码的不完整输入,解决带有模糊输入符的字符串模式与一个字符串集合之间的匹配问题,论文在第三章提出一种海量字符串集合的模式匹配算法,给出了算法的具体实现和复杂度分析,并且提出一种优化的检索树结构来存储字符串集合以节省内存空间。为了提高算法的运行速度,算法还引入了KMP模式匹配和有限自动机匹配的思想。 为了在键盘上实现汉字的自然输入,论文提出一种“模拟笔划”的汉字输入新方法,这种方法特别适用在目前信息产品上广泛使用的数字小键盘上,它不直接在键盘上输入汉字笔划,而是根据笔划的形状特征和运笔方向输入汉字笔划的起点、折点和落点等笔划特征点。这种方法可以连续在键盘上输入汉字笔划,中间不需分割键,并且可以在输入错误时向前删除笔划,它可以看作是键盘输入向联机手写汉字输入的过渡方法。 本文在上述工作的基础上最后给出联机手写汉字输入方法的初步实现,其方法是在笔划编码字典的基础上,根据“模拟笔划”的输入汉字的思想先识别汉字笔划、再识别汉字。笔划的识别思想是通过笔迹上的坐标点抽取笔划的特征点,由特征点形成笔段,由笔段组成笔划,最后由笔划序列来识别汉字。

全文目录


中文摘要  3-4
英文摘要  4-5
目录  5-8
图表目录  8-10
第1章 绪论  10-16
  1.1 研究动机与目的  10
  1.2 相关背景  10-14
    1.2.1 汉字输入方式  10-11
    1.2.2 汉字键盘编码输入  11-13
      1.2.2.1 汉字编码输入原理  11-12
      1.2.2.2 汉字编码研究  12
      1.2.2.3 数字键盘汉字输入的研究  12-13
    1.2.3 在线手写汉字识别(OLCCR)的研究  13-14
  1.3 论文架构  14-16
第2章 汉字笔划统计信息及应用  16-34
  2.1 汉字及其结构  16-19
    2.1.1 信息交换用汉字编码字符集基本集(GB2312-80)  16-17
    2.1.2 汉字结构描述  17
    2.1.3 笔划归类  17-19
  2.2 国标二级字库中的汉字笔划统计信息  19-27
    2.2.1 统计方法  19
    2.2.2 平均每个汉字的笔划数  19
    2.2.3 按使用频度加权的平均每个汉字的笔划数  19-21
    2.2.4 最多及最少笔划的汉字  21
    2.2.5 以各种笔划起笔的汉字的数目  21
    2.2.6 各种笔划在所建编码字典中出现频度  21-22
    2.2.7 重码列表  22-23
    2.2.8 能与其它字区分开的前若干笔划数的平均数  23-24
    2.2.9 能与其它字区分开的前若干笔划数的加权平均数  24
    2.2.10 相邻笔划频度列表  24-27
  2.3 统计数据的应用  27-33
    2.3.1 汉字键盘输入法的设计概论  27
    2.3.2 将笔划序列作为汉字输入码的可行性分析  27-28
    2.3.3 键位设计  28-33
  2.4 小结  33-34
第3章 一种高效海量字符串集合的模式匹配算法  34-52
  3.1 简介  34
  3.2 利用KMP算法的有限自动机串匹配  34-37
  3.3 字符串集合的模式匹配  37-42
    3.3.1 传统算法及其不足  37-38
    3.3.2 字符串集合的表示  38-41
      3.3.2.1 逻辑表示  38
      3.3.2.2 存储结构  38-39
      3.3.2.3 检索树的生成、插入和删除  39-41
    3.3.3 基于检索树的字符串集合匹配算法  41-42
  3.4 检索树的优化  42-44
  3.5 基于优化检索树的字符串集合模糊匹配  44-51
    3.5.1 定义  44-45
    3.5.2 模式预处理(pattern preprocessing)  45-48
    3.5.3 模式预处理的正确性  48-49
    3.5.4 在优化的检索树上进行模式匹配  49-51
  3.6 小结  51-52
第4章 一种“模拟笔划”的汉字键盘输入方法  52-64
  4.1 笔划输入法  52
  4.2 在数字键盘上“模拟”笔划  52-53
  4.3 “模拟笔划”输入法的实现  53-63
    4.3.1 用有限自动机实现从键序列到单个笔划的转换  53-55
    4.3.2 从键序列到笔划序列的转换  55-61
      4.3.2.1 实现方法  55
      4.3.2.2 逻辑结构  55-56
      4.3.2.3 存储结构  56-58
      4.3.2.4 键序列中含有模糊输入符  58-59
      4.3.2.5 遍历转换图形成笔划序列的算法  59-61
    4.3.3 删除笔划  61-63
  4.4 小结  63-64
第5章 联机手写汉字输入研究  64-72
  5.1 引言  64
  5.2 联机手写汉字的结构识别法  64-65
  5.3 我们的方法  65-71
    5.3.1 预处理  65-68
      5.3.1.1 获取手写笔划坐标点  65-66
      5.3.1.2 规范化  66-67
      5.3.1.3 笔段的抽取  67-68
    5.3.2 笔划和汉字的识别  68-71
      5.3.2.1 由笔段序列识别笔划  68-70
      5.3.2.2 由笔划序列识别汉字  70-71
  5.4 小结  71-72
第6章 结论及未来的工作  72-73
参考文献  73-75
致谢  75

相似论文

  1. 基于CUDA的正则表达式匹配系统的设计与实现,TP311.52
  2. 基于CPU+GPU异构平台的字符串匹配算法研究与实现,TP301.6
  3. 基于Android平台的智能手机输入法研究与设计,TP391.14
  4. 学习设计中学习任务的研究与应用,TP391.6
  5. 相似字符串匹配过滤算法研究,TP391.1
  6. 汽车覆盖件模具报价系统的研究,TP311.52
  7. 商函封发投递系统的研究与实现,TP311.52
  8. 大型广场视频的人流密度估计技术研究,TP391.41
  9. 针对大规模URL关键字的多模匹配算法的性能优化,TP309
  10. 基于串匹配和文本分类的中文网页过滤系统设计,TP393.092
  11. 音字转换评测体系的研究与实现,TP391.1
  12. 出版物审读系统的设计与实现,G231
  13. 基于短消息平台的智能交通信息发布系统的研究与设计,U495
  14. 基于Android的语句级智能汉字输入法研究,TP391.14
  15. 基于Windows API的VB编程题自动评分系统的研究与实现,TP311.52
  16. 基于DBAAS模型的关系型数据密文检索研究与实现,TP311.13
  17. 基于后缀语法树的代码抄袭检测研究,TP311.11
  18. 常用数字信号调制方式识别研究,TN911.3
  19. 网络安全隔离设备高速匹配算法的研究与实现,TP393.08
  20. 基于内容的音乐检索研究,TP391.3
  21. 智能手持式抄表机的设计与研发,TM764

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com