学位论文 > 优秀研究生学位论文题录展示

元代笔记分词理论与实践

作 者: 刘婧一
导 师: 卞成林
学 校: 广西师范学院
专 业: 语言学及应用语言学
关键词: 元代笔记 分词 词频 词表
分类号: H134
类 型: 硕士论文
年 份: 2010年
下 载: 54次
引 用: 0次
阅 读: 论文下载
 

内容摘要


元代是中国历史上由少数民族建立起来的封建王朝,虽然统治中国的时间不长,但却是文学、语言发展史上一个重要的时期。对元代汉语语料进行分词词频统计的研究,不仅可以作为现代汉语中文信息处理研究的补充,也为研究近代汉语分词标准及开发自动分词软件提供参考。本文在前人辑录整理的研究成果上,选取了12篇元代的笔记,以这个时期笔记中的词语为研究对象,借助网络资源,建立了元代笔记词汇的封闭式语料库,通过确定分词标准、进行分词实践、进行词频统计等步骤,对语料进行分词和词语标引,在此基础上,采取科学的计量方法对词语进行分析和解释,得到了元代笔记词频统计表,为研究元代笔记的词语提供了可靠的材料;对元代笔记词频表中的词语进行共时描写,以勾勒出元代笔记中词语的基本特征;最后再将元代笔记词频表与《现代汉语频率词典》中常用的8000词的频率作历时比较,以寻找汉语词汇从元代到当代的基本发展规律。

全文目录


摘要  3-4
ABSTRACT  4-7
第一章 绪论  7-16
  1.1 选题的源起和意义  7-8
  1.2 选题的研究现状  8-13
  1.3 研究的理论与方法  13-14
  1.4 文本选取  14-15
  1.5 选题的研究重点、难点及创新点  15-16
第二章 元代笔记语言分词实践  16-29
  2.1 什么是词  16-17
  2.2 分词原则  17-18
  2.3 分词中需要注意的问题  18-19
  2.4 分词实践  19-28
  2.5 元代笔记词汇表  28-29
第三章 元代笔记词频统计及统计结果  29-39
  3.1 词频统计相关概念及意义  29
  3.2 词频统计的过程和方法  29-30
  3.3 词频统计结果  30-34
  3.4 统计结果与《现代汉语频率词典》的比较  34-39
第四章 元代笔记词语结构分析  39-55
  4.1 双音词  39-47
  4.2 三音词  47-48
  4.3 四音词  48-55
第五章 元代笔记词汇概貌  55-68
  5.1 外来词  55-57
  5.2 佛教词、道教词  57-61
  5.3 数字词  61-63
  5.4 同义词、反义词  63-68
第六章 结语  68-69
参考文献  69-71
附录  71-72
后记  72

相似论文

  1. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  2. 主观题自动评分技术研究,TP391.1
  3. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  4. 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
  5. 中文XML压缩技术研究,TP311.11
  6. 基于字词联合解码的中文分词研究,TP391.1
  7. 企业邮件监管系统的设计与实现,TP393.098
  8. 《元朝秘史》词频研究,H134
  9. 基于词频统计的《徐霞客游记·粤西游日记》词汇研究,H134
  10. 麻城方言调查报告,H17
  11. 基于WEB的社区智能医疗服务系统的研究,TP311.52
  12. 基于过滤技术的投诉信息智能分析与实现,TP391.1
  13. 基于词典和概率统计的中文分词算法研究,TP391.1
  14. 基于云计算的海量数据存储技术的研究及应用,TP333
  15. 建筑图中有限自然语言的分析与理解的研究,TU204
  16. 宁波市数字图书馆若干关键技术的研究与应用,G250.76
  17. 基于Ajax/Lucene的站内搜索技术研究与实现,TP393.092
  18. 中文网页热门主题获取系统的研究与实现,TP393.092
  19. 基于统计NLP技术的甲骨卜辞的分析研究,TP391.1
  20. 基于J2EE的网络考试系统的研究与实现,TP311.52
  21. SOM算法的改进及其在中文文本聚类的应用,TP391.1

中图分类: > 语言、文字 > 汉语 > 语义、词汇、词义(训诂学) > 近代词汇
© 2012 www.xueweilunwen.com