学位论文 > 优秀研究生学位论文题录展示
面向汉语拼音自动标注的现代汉语多音字词研究
作 者: 张艳青
导 师: 张莉
学 校: 河北大学
专 业: 汉语言文字学
关键词: 现代汉语 多音字 多音字词 拼音标注 语料
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 18次
引 用: 0次
阅 读: 论文下载
内容摘要
在现代汉语中,包含多音成分的现代汉语词语经常被误读,在人们的学习和工作中会造成一定的影响。多音成分之所以称为“多音”,实质上是就作为书写单位的字而言的。它对应记录的语言单位可能是自由语素,也可能是粘着语素或者是非语素的音节。本文中为方便称说,以“现代汉语多音字词”来指代关涉多音成分的现代汉语语词。当今社会里,计算机以及互联网的应用差不多已经遍及各个角落。对现代汉语多音字词进行拼音标注的软件也应运而生,当前的汉语拼音自动标注软件针对多音字词的特殊性,分别从不同的方面采取了措施,使多音字词的标音问题不同程度地得到了解决。这也给当今人们快节奏的生活提供了便捷的学习方式。但是,由于种种原因拼音标注软件并不能对现代汉语多音字词的读音完全正确识别,存在这样那样的问题。文章以《现代汉语词典》(第五版)中的九百多个多音字为基础,并参考《现代汉语常用词表》,在北京大学现代汉语语料库中进行搜集,得出一定数目的语料。然后再以此为依据选取其中高频的50个多音字的语料,逐条放入汉语拼音标注软件中测查,对结果进行描述和分析。文章分为三个部分,首先对多音字和多音字词这两个概念进行界定,统计确定了多音字的数量,并对多音字词进一步分类。其次,对关涉多音字词的语料在汉语拼音标注软件中的测查情况进行量的统计,把不同读音的正确标注和错误标注的语料数量具体列出。最后,对出现问题的语料具体逐条观察,描述其特征,总结其规律。
|
全文目录
摘要 5-6 Abstract 6-11 第1章 绪论 11-16 1.1 研究对象 11 1.2 研究现状 11-13 1.2.1 关于多音字词自动处理问题的理论探索 11-13 1.2.2 目前汉语拼音自动标注软件对涉多音字词语的处理 13 1.3 研究方法 13-16 第2章 多音字词的界定 16-20 2.1 多音字 16-17 2.2 多音字词 17-20 第3章 多音字词的测查 20-24 3.1 北京大学现代汉语语料库介绍 20 3.2 汉语自动标注软件情况 20 3.3 多音字词标注软件标音测查结果 20-24 第4章 多音字词标注问题分析 24-53 4.1 配给多音字词读音错误 24-25 4.1.1 “正”的多音字词问题分析 24 4.1.2 “场”的多音字词问题分析 24-25 4.1.3 “么”的多音字词问题分析 25 4.1.4 “地”的多音字词问题分析 25 4.1.5 “只”的多音字词问题分析 25 4.2 错误分词 25-29 4.2.1 “体”的多音字词问题分析 25-26 4.2.2 “家”的多音字词问题分析 26 4.2.3 “其”的多音字词问题分析 26 4.2.4 “说”的多音字词问题分析 26-27 4.2.5 “个”的多音字词问题分析 27 4.2.6 “把”的多音字词问题分析 27 4.2.7 “好”的多音字词问题分析 27-28 4.2.8 “的”的多音字词问题分析 28-29 4.3 受相邻字影响但未组合成词 29-31 4.3.1 “会”的多音字词问题分析 29 4.3.2 “化”的多音字词问题分析 29-30 4.3.3 “间”的多音字词问题分析 30-31 4.4 配给多音字词读音错误、误分词和固定搭配问题 31-33 4.4.1 “看”的多音字词问题分析 31-32 4.4.2 “得”的多音字词问题分析 32-33 4.5 配给多音字词读音错误、误分词和繁简字问题 33-35 4.6 口语音书面音混淆、受相邻字影响或误分词或未组合成词 35-36 4.6.1 “作”的多音字词问题分析 35-36 4.6.2 “那”的多音字词问题分析 36 4.7 受相邻字影响或误分词或未组合成词 36-39 4.7.1 “要”的多音字词问题分析 36-37 4.7.2 “没”的多音字词问题分析 37-38 4.7.3 “行”的多音字词问题分析 38 4.7.4 “分”的多音字词问题分析 38-39 4.8 一词多音、误分词、古今读音混淆 39-41 4.9 一词多音、配给多音字词读音错误 41-42 4.10 误分词、配给多音字词读音错误 42-48 4.10.1 “种”的多音字词问题分析 42-43 4.10.2 “将”的多音字词问题分析 43-44 4.10.3 “中”的多音字词问题分析 44 4.10.4 “和”的多音字词问题分析 44-45 4.10.5 “都”的多音字词问题分析 45-46 4.10.6 “为”的多音字词问题分析 46-47 4.10.7 “长”的多音字词问题分析 47 4.10.8 “着”的多音字词问题分析 47-48 4.11 古今读音混淆、配给多音字词读音错误、受相邻字影响或误分词或未组合成词 48-49 4.12 古今读音混淆、误分词、一词多音 49-50 4.13 误分词、一词多音 50-51 4.14 一词多音、配给多音字词读音错误、受相邻字影响或误分词或未组合成词 51-53 结语 53-54 参考文献 54-56 附录 56-90 致谢 90
|
相似论文
- 基于数据分布特征的文本分类研究,TP391.1
- 基于中介语语料库的汉语递进复句习得研究,H195
- 现代汉语招呼语研究,H136
- 基于语料库的上海世博会新闻报道的互文性分析,H052
- 基于语料库对TAKE用法的比较研究,H319
- 现代汉语中的日语词汇研究,H136.5
- 现代汉语语境的解释功能与对外汉语教学,H195
- 汉英一价动词对比研究,H314
- 中国大学生英语作文中SO使用情况的语料库分析,H319
- 基于语料库的中外学术语篇中立场副词对比研究,H314
- 基于语料库的中国英语经济新闻报道中概念隐喻的研究,H315
- 中外英文学术语篇中词块的结构和功能对比研究,H315
- 现代汉语功能句型及其语料库建设,H146
- 英语学术论文标题的短语学特征研究,H313
- 基于语料库的中美经济语篇批评分析,H052
- 基于物流专业词汇联想测试的心理词库研究,H319
- 基于语料库的英语专业学习者书面语中心理使役动词使用研究,H319
- 中美语言学硕士论文中因果标记语的对比研究,H313
- 中国政府文件中国特色英语词丛研究,H313
- 专业领域可比语料的构建与评价研究,TP391.1
- 基于语料库对科技英语次技术词用法的研究,H314
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|