学位论文 > 优秀研究生学位论文题录展示

基于多语种平行语料库的机器辅助翻译系统

作 者: 刘小军
导 师: 赵栋
学 校: 北京信息控制研究所
专 业: 计算机应用技术
关键词: 语料库 翻译记忆库 机器辅助翻译软件
分类号: TP391.2
类 型: 硕士论文
年 份: 2007年
下 载: 296次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着国际交流的日益频繁,翻译行业蓬勃发展,在翻译行业中进行了越来越多的信息化建设,其中最为突出的是引入了机器翻译和机器辅助翻译产品,以及将翻译流程管理信息化,用于替代或者辅助人的活动,这些工作已经可以在一定程度上提高翻译行业的效率。同时在国内有许多的大学、研究机构从事机器翻译或者机器辅助翻译的研究,取得了丰硕的研究成果,但是成果产品化不够,特别是辅助翻译产品,由于需要大量的语料资源,其软件不能在大规模真实语料下进行测试,因而限制了整个软件的质量。通过与中国对外翻译出版公司合作,在其30多年来不断积累的文献的基础上,该文构建出了一个大型的多语种平行语料库,通过规范构建过程以及操作过程,既保证了语料库的规模,也确保了语料的质量。在已有资源的基础之上,将开发一个机器辅助翻译软件,用来提高翻译人员的工作效率。本文阐述了构建一个语料库的流程和用到的关键算法,设计了一个辅助翻译软件,实现了关键的算法。其中关于中文文本查重的算法综合了汉语语言学的研究成果,提出了一种提取中文文本特征串的方法。在辅助翻译软件的设计过程中,将基于翻译记忆库技术的辅助翻译引擎看成一个基于全文索引的搜索引擎,以便提供相同或者相似的句子的译文给译员参考,通过对中文句子进行“分字”的方法,扩展了关于中文处理中“分词”的概念,从而可以按照统一的方式处理中文和其它字符体系语种的索引问题,保证了辅助翻译软件对于语种的可扩充性。

全文目录


摘要  5-6
Abstract  6-9
第1章 绪论  9-17
  1.1 课题背景  9-10
  1.2 课题来源  10-11
  1.3 相关技术简介  11-15
    1.3.1 机器翻译简介  11-12
    1.3.2 机器辅助翻译系统  12-13
    1.3.3 语料库和语料库语言学简介  13-15
  1.4 本文主要研究内容  15-16
  1.5 本文结构安排  16-17
第2章 构建多语种平行语料库  17-41
  2.1 文件预处理  18-27
    2.1.1 中文文本查重的双因子相似度算法  19-27
  2.2 文件对齐  27-33
  2.3 语料对齐  33-34
  2.4 语汇提取  34-36
  2.5 语料和语汇操作规范  36-40
    2.5.1 多语种翻译资源库对译语料库操作规范  37-39
    2.5.2 多语种翻译资源库语汇库操作规范  39-40
  2.6 本章小结  40-41
第3章 构建计算机辅助翻译系统  41-57
  3.1 一个辅助翻译软件应该提供的功能  41-42
    3.1.1 翻译过程  41
    3.1.2 自动建库  41-42
    3.1.3 术语管理  42
    3.1.4 多语种间双向互译  42
    3.1.5 自动排版  42
  3.2 整体框架图  42-53
    3.2.1 资源导入/导出工具  43-47
    3.2.2 建立索引工具  47-53
  3.3 基于翻译记忆库技术的辅助翻译引擎的关键算法  53-56
    3.3.1 查找相同或者相似的句子  53-55
    3.3.2 查找已有的语汇  55-56
  3.4 本章小结  56-57
结论  57-58
参考文献  58-61
攻读硕士学位期间发表的论文  61-62
致谢  62

相似论文

  1. 基于中介语语料库的汉语递进复句习得研究,H195
  2. 基于语料库的上海世博会新闻报道的互文性分析,H052
  3. 现代汉语功能句型及其语料库建设,H146
  4. 英语学术论文标题的短语学特征研究,H313
  5. 基于语料库的中美经济语篇批评分析,H052
  6. 基于语料库的英语专业学习者书面语中心理使役动词使用研究,H319
  7. 中美语言学硕士论文中因果标记语的对比研究,H313
  8. 中国政府文件中国特色英语词丛研究,H313
  9. 基于语料库的英国媒体关于中国制造报道的话语分析,H315
  10. 中国英语学习者与本族语者认识可能性显性表达研究,H319
  11. 基于可比较语料库双语多词表达式对抽取,TP391.1
  12. 汉字/非汉字文化圈HSK甲级心理动词搭配的语料库研究,H195
  13. 基于语料库的中国英语学习者原因状语从句引导词习得研究,H319
  14. 基于语料库的莎士比亚戏剧汉译本中Lord人际意义显化研究,H315.9
  15. 基于语料库对中国军力报告的语义韵研究,H315
  16. 基于模糊神经网络构建英语情态动词can的语义推理模型,H313
  17. 对外汉语教学的惯用语研究,H195
  18. 《现代蒙古语语料库管理平台》建设,H212
  19. 基于语料库的诗歌翻译标准研究,I046
  20. 中国学生英语口语中情态动词语用研究,H313
  21. A Corpus-based Study of the Collocation Use of the English Verb--get,H319

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 翻译机
© 2012 www.xueweilunwen.com