学位论文 > 优秀研究生学位论文题录展示
元代笔记分词理论与实践
作 者: 刘婧一
导 师: 卞成林
学 校: 广西师范学院
专 业: 语言学及应用语言学
关键词: 元代笔记 分词 词频 词表
分类号: H134
类 型: 硕士论文
年 份: 2010年
下 载: 54次
引 用: 0次
阅 读: 论文下载
内容摘要
元代是中国历史上由少数民族建立起来的封建王朝,虽然统治中国的时间不长,但却是文学、语言发展史上一个重要的时期。对元代汉语语料进行分词及词频统计的研究,不仅可以作为现代汉语中文信息处理研究的补充,也为研究近代汉语分词标准及开发自动分词软件提供参考。本文在前人辑录整理的研究成果上,选取了12篇元代的笔记,以这个时期笔记中的词语为研究对象,借助网络资源,建立了元代笔记词汇的封闭式语料库,通过确定分词标准、进行分词实践、进行词频统计等步骤,对语料进行分词和词语标引,在此基础上,采取科学的计量方法对词语进行分析和解释,得到了元代笔记词频统计表,为研究元代笔记的词语提供了可靠的材料;对元代笔记词频表中的词语进行共时描写,以勾勒出元代笔记中词语的基本特征;最后再将元代笔记词频表与《现代汉语频率词典》中常用的8000词的频率作历时比较,以寻找汉语词汇从元代到当代的基本发展规律。
|
全文目录
摘要 3-4 ABSTRACT 4-7 第一章 绪论 7-16 1.1 选题的源起和意义 7-8 1.2 选题的研究现状 8-13 1.3 研究的理论与方法 13-14 1.4 文本选取 14-15 1.5 选题的研究重点、难点及创新点 15-16 第二章 元代笔记语言分词实践 16-29 2.1 什么是词 16-17 2.2 分词原则 17-18 2.3 分词中需要注意的问题 18-19 2.4 分词实践 19-28 2.5 元代笔记词汇表 28-29 第三章 元代笔记词频统计及统计结果 29-39 3.1 词频统计相关概念及意义 29 3.2 词频统计的过程和方法 29-30 3.3 词频统计结果 30-34 3.4 统计结果与《现代汉语频率词典》的比较 34-39 第四章 元代笔记词语结构分析 39-55 4.1 双音词 39-47 4.2 三音词 47-48 4.3 四音词 48-55 第五章 元代笔记词汇概貌 55-68 5.1 外来词 55-57 5.2 佛教词、道教词 57-61 5.3 数字词 61-63 5.4 同义词、反义词 63-68 第六章 结语 68-69 参考文献 69-71 附录 71-72 后记 72
|
相似论文
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 主观题自动评分技术研究,TP391.1
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
- 中文XML压缩技术研究,TP311.11
- 基于字词联合解码的中文分词研究,TP391.1
- 企业邮件监管系统的设计与实现,TP393.098
- 《元朝秘史》词频研究,H134
- 基于词频统计的《徐霞客游记·粤西游日记》词汇研究,H134
- 麻城方言调查报告,H17
- 基于WEB的社区智能医疗服务系统的研究,TP311.52
- 基于过滤技术的投诉信息智能分析与实现,TP391.1
- 基于词典和概率统计的中文分词算法研究,TP391.1
- 基于云计算的海量数据存储技术的研究及应用,TP333
- 建筑图中有限自然语言的分析与理解的研究,TU204
- 宁波市数字图书馆若干关键技术的研究与应用,G250.76
- 基于Ajax/Lucene的站内搜索技术研究与实现,TP393.092
- 中文网页热门主题获取系统的研究与实现,TP393.092
- 基于统计NLP技术的甲骨卜辞的分析研究,TP391.1
- 基于J2EE的网络考试系统的研究与实现,TP311.52
- SOM算法的改进及其在中文文本聚类的应用,TP391.1
中图分类: > 语言、文字 > 汉语 > 语义、词汇、词义(训诂学) > 近代词汇
© 2012 www.xueweilunwen.com
|