学位论文 > 优秀研究生学位论文题录展示
计算语言学领域英文辅助写作系统
作 者: 占飞
导 师: 刘挺
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 句子检索 机器翻译 词语相似度 搭配
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 60次
引 用: 0次
阅 读: 论文下载
内容摘要
随着全球一体化的不断发展,学术研究不能闭门造车,需要与国外的学术界互相交流。但作为非英语为母语的英文学术论文写作者,经常会遇到一个英文句子该怎样表达才能让国外同行真正理解自己的研究成果的情况,归根结底是怎样写出地道的英文学术领域句子。目前的机器翻译的质量还远远不能达到实际应用的程度,更不可能帮助用户写出地道的英文句子。英汉双语例句检索系统让用户输入中文查找所需的英文例句,虽然检索到的句子未必和用户所需要的句子完全相同,但用户可以通过借鉴和学习系统检索到的例句,结合自己的经验组合出所需的英文表达。本文尝试整合句子检索、机器翻译、词语相似度、词语搭配等自然语言处理技术,研究与实现一个针对写作计算语言学领域的英文论文用户的辅助写作系统。本文第二章调研英文辅助写作系统的两个主要技术机器翻译和句子检索的相关研究状况,分析各种方法的优缺点,选择了基于短语的统计机器翻译方法和基于距离的句子检索方法作为系统的机器翻译和例句检索模块的实现方法。本文的第三章研究在英文辅助写作系统基础上的用户查询相关提示词生成方法,这里的相关提示词主要包括有序同义词推荐和常用短语搭配推荐。首先调研词语相似度的计算方法,提出一种特定语境下的词语相似度计算方法并结合语义词典WordNet完成有序同义词推荐。然后利用单语词对齐方法进行常用搭配库的抽取,并研究统计和语义相结合的词语相似度计算方法,实现单个词输入的常用搭配推荐和两个词输入的相似搭配推荐生成。在本文第四章,介绍了英文辅助写作系统的系统结构、先期的语料处理和系统主要模块的实现方法。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第1章 绪论 8-13 1.1 课题背景与意义 8-9 1.2 相关研究现状 9-11 1.2.1 机器翻译 9-10 1.2.2 句子检索 10-11 1.3 本文的主要研究内容 11 1.4 本文的组织结构 11-12 1.5 本章小结 12-13 第2章 系统主要技术的相关研究 13-22 2.1 机器翻译的相关研究 13-18 2.1.1 机器翻译基本方法和技术 13-16 2.1.2 基于短语的统计机器翻译方法 16-18 2.2 句子检索的相关研究 18-21 2.2.1 句子检索模型概述 18-20 2.2.2 句子相似度计算方法研究 20-21 2.3 本章小结 21-22 第3章 相关提示词生成方法研究 22-37 3.1 词语相似度的研究及其在同义词推荐生成的应用 22-31 3.1.1 相关研究和介绍 22-25 3.1.2 同义词推荐生成方法 25-29 3.1.3 实验结果与分析 29-31 3.2 基于词语搭配的搭配推荐生成 31-36 3.2.1 搭配 31-32 3.2.2 基于单语词对齐方法的常用搭配库抽取 32-34 3.2.3 搭配推荐生成 34-35 3.2.4 实验结果与分析 35-36 3.3 本章小结 36-37 第4章 英文辅助写作系统的设计与实现 37-50 4.1 八维翻译-写作助手系统介绍 37-38 4.2 系统流程及设计 38-48 4.2.1 系统总体框架 38 4.2.2 系统核心模块分析 38-39 4.2.3 系统的基本功能和语料预处理 39-46 4.2.4 系统的高级功能 46-48 4.3 八维翻译-写作助手系统主要功能和演示 48-49 4.4 本章小结 49-50 结论 50-51 参考文献 51-54 攻读硕士学位期间发表的论文及其它成果 54-56 致谢 56
|
相似论文
- 统计机器翻译中结构转换技术的研究,TP391.2
- 面向统计机器翻译的解码算法的研究,TP391.2
- CT机造型设计研究,R197.39
- 动态助词“过”研究综述,H146
- 中国大学生英语作文中SO使用情况的语料库分析,H319
- 基于语料库的中外学术语篇中立场副词对比研究,H314
- 机器翻译中的高级对齐技术和开发集选择策略研究,TP391.2
- 汉字/非汉字文化圈HSK甲级心理动词搭配的语料库研究,H195
- 城市旅游电子地图交互式设计研究,P208
- 首饰与时装的“联姻”,F426.86
- 楚雄彝族服饰特点及应用研究,J523.5
- 高中学生英语写作中的词汇搭配错误分析,G633.41
- 基于语料库的中国英语学习者和本族语者高频动词搭配及具体语义关系下句型对比研究,H319
- 基于语料库对中国军力报告的语义韵研究,H315
- 文学作品中汉语量词名词超常搭配的认知分析,H146
- 关于层次短语翻译模型调序问题的研究,TP391.2
- 中国经济内外均衡的政策体系研究,F124
- 基于语料库的中国非英语专业学生Have用法研究,H319
- A Corpus-based Study of the Collocation Use of the English Verb--get,H319
- 韵律对并列结构歧义的消解影响,B841
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|