学位论文 > 优秀研究生学位论文题录展示

基于认知机理的汉字智能造字之汉字基元研究

作 者: 丘志文
导 师: 皮佑国
学 校: 华南理工大学
专 业: 控制理论与控制工程
关键词: 拼形 字库 认知机理 汉字智能造字 汉字基元
分类号: TP391.43
类 型: 硕士论文
年 份: 2008年
下 载: 223次
引 用: 9次
阅 读: 论文下载
 

内容摘要


现有的中文信息处理系统都采用字库,基于字库的中文处理平台虽然为我国的中文信息化做出了不可磨灭的贡献,但由于其不是造字而是选字的特点而带有许多不足:不能建立长期稳定的信息化标准、不能很好地传承汉字文化、不符合汉字认知机理、与汉字教育脱节、信息熵高等。本文在对汉字的认知机理进行分析研究的基础上,将汉字文化和认知科学的成果相结合,对汉字智能造字的基础——汉字基元进行了深入的研究和探讨。主要研究内容和研究结果如下:(1)在对汉字字库相关中文信息处理流程进行深入分析和述评的基础上,在认知心理学原型理论的指导下,深入研究了人对汉字的认知机理,并将这种认知机理应用于计算机,在计算机进行汉字智能造字的实现原理方面进行了理论分析和实验研究。(2)本文着重研究作为造字基石的汉字基元。深入分析了与汉字基元相关的研究,得出汉字部首和汉字部件可作为汉字基元的主要来源但不能直接采用的结论。在此基础上,兼顾传承文化、方便使用和方便计算机处理的原则,提出了汉字基元的提取流程。(3)依据上述流程开展大量的实验研究,探索了以工程实验方法研究文化问题的途径。本文选取GB18030收录的27484个汉字作为实验样本集,以独体字和《辞海》的250个部首作为初始基元进行大量的实验研究,通过实验和分析,提取获得了877个汉字基元。(4)利用计算机技术设计开发了汉字基元计算机研究平台。研究平台对相关信息进行查询以便研究分析;对汉字基元进行字频统计,表明提取得到的汉字基元集符合汉字的认知规律且能够完全覆盖27484个汉字;对汉字基元字形信息的分类统计可为汉字基元映射知识提供前期研究的实验数据;对汉字编码的识别解析为智能造字的输入提供了可能的解决途径。

全文目录


摘要  5-6
ABSTRACT  6-10
第一章 绪论  10-21
  1.1 研究背景  10-19
    1.1.1 汉字的性质  10-11
    1.1.2 汉字造字的历史演变  11-13
    1.1.3 中文信息处理的发展  13-18
    1.1.4 基于认知机理汉字智能造字  18-19
  1.2 本文目的和意义  19-20
  1.3 本文主要工作  20
  1.4 本文结构安排  20-21
第二章 汉字的认知机理  21-27
  2.1 引言  21
  2.2 汉字的认知机理  21-25
    2.2.1 汉字的教学认知  21-25
    2.2.2 汉字的认知  25
  2.3 本章小结  25-27
第三章 汉字基元研究  27-43
  3.1 引言  27
  3.2 汉字智能造字的体系结构  27-29
  3.3 汉字智能造字之汉字基元研究  29-35
  3.4 汉字基元的提取实验研究  35-42
    3.4.1 汉字基元的提取原则  35-37
    3.4.2 汉字基元的提取方案  37-42
  3.5 本章小结  42-43
第四章 汉字基元计算机辅助研究  43-68
  4.1 相关概念  43-46
  4.2 功能需求  46-48
  4.3 模块详细设计  48-64
    4.3.1 汉字基元信息管理  49-58
    4.3.2 汉字结构信息管理  58-59
    4.3.3 汉字编码信息管理  59-64
  4.4 数据库设计  64-67
    4.4.1 创建数据库  64
    4.4.2 数据库连接  64-66
    4.4.3 存储过程设计  66-67
  4.5 本章小结  67-68
第五章 实验研究  68-75
  5.1 实验设计  68
    5.1.1 原始输入数据  68
    5.1.2 自动处理生成的数据  68
    5.1.3 基本功能及结果输出  68
  5.2 实验结果及其分析  68-74
  5.3 本章小结  74-75
结论  75-77
参考文献  77-81
附录汉字基元  81-83
攻读硕士学位期间取得的研究成果  83-84
致谢  84

相似论文

  1. 论计算机字体的著作权保护,D923.41
  2. 四川字库塔的文化遗产价值与保护修复研究,TU-87
  3. 无字库智能造字系统在计算机上的实现,TP391.1
  4. 基于认知机理的智能造字之结构描述研究,TP391.41
  5. 基于拓扑学和统计学的无字库汉字智能造字研究,TP391.43
  6. Web文本分类关键技术研究,TP393.092
  7. 手持式示波器若干软件技术研究,TM935.3
  8. 开放式地图出版数据模型的研究,P28
  9. 基于全局仿射变换的分级动态汉字字库,TP391.1
  10. Windows CE.Net嵌入式操作系统本地化研究及实现,TP316.2
  11. 工业色谱仪上开发的PC104嵌入式测控系统,TP273
  12. 阵列式在线激光打标机的研制,TN249
  13. DVB-C机顶盒应用软件的开发,TP311.52
  14. 基于矢量字库的数控雕刻走刀轨迹规划算法的研究,TP273.5
  15. 气动打标机系统及字库优化研究,TH69
  16. 蒙古文信息处理系统基础研究,TP391.1
  17. Pangolin激光演示系统中汉字的演示及其失真校正研究,TN249
  18. IPTV机顶盒GUI设计,TN948.55
  19. 基于字库修改的文本信息隐藏,TP309.7
  20. 互联网汉字字型设计研究,J524

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 文字识别及其装置
© 2012 www.xueweilunwen.com