学位论文 > 优秀研究生学位论文题录展示
汉语复合结构的概念图复合运算初探
作 者: 吴敬桐
导 师: 陈玉泉
学 校: 上海交通大学
专 业: 计算机软件与理论
关键词: 汉语内涵逻辑模型 复合结构 概念图 概念复合运算
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 20次
引 用: 0次
阅 读: 论文下载
内容摘要
随着信息时代的到来,网络在人们生活中的重要性越来越大。而不管网络中各种技术怎样革新,人们都需要从海量数据里面找到自己所需要的信息。由此可见无论技术怎样进步,搜索引擎的重要性都不会改变。目前传统的搜索引擎大多基于关键字查询,对于用户输入的复合结构会被视作离散的字符串集,把原本完整的复合结构打碎成孤立的单词。用户的需求也被割裂,从而导致准确率的下降。这是本文的应用背景及研究起始点。另一方面,在自然语言处理中复合结构也普遍出现,因此寻找适合对复合结构进行语义解释的理论和方法具有重要的理论研究意义和广阔的应用价值。目前对于汉语复合结构概念图的标引已经基本成熟,但大部分都是通过手工来完成,对于浩瀚的汉语复合结构而言,单纯采用手工标引基本无法完成。因此如果能够在复合结构原子概念图的基础上,探究到原子概念图的复合运算,那么对于真正实现通过汉语复合结构概念图的方式提高搜索精度会有一定的贡献。本文研究的是汉语复合结构的概念图复合运算,复合结构是由两个或两个以上的词直接组合而成。复合结构的概念图是指利用概念图的方式来表示汉语的整个复合结构。本文的研究从实例分析出发,尝试在内涵逻辑模型下探究复合结构词与词之间的可能存在的关系以及之间可能存在的操作,从而探究复合结构中词与词之间可能存在的概念图复合运算。本文的主要工作为:通过分析用户查询日志中的复合结构,为复合结构中原子概念建立原子概念图库,然后通过对于汉语复合结构的预处理,定义复合结构词与词之间概念图的复合运算。其中主要的运算方式有3种:填值运算,添加属性名和属性值对运算,抑制属性名和属性值对运算。从语义语法角度分为:修饰关系和联合关系。其中修饰关系包括:邻近词复合运算,跨词复合运算,未登录词运算,借代修辞运算。联合关系包括:多中心概念运算。本文的创新性工作主要有以下方面:1打开单个概念的内涵逻辑,用<E,A,V>的方法表示概念的内涵逻辑。从而从深层语义上挖据词语的内涵,达到深层次挖掘词语内涵逻辑的目的。2通过分析汉语复合结构词与词之间的各种关系,提出了汉语复合结构词之间的各种运算,从而在一定程度上可以达到自动生成汉语复合结构概念图的目的。对于搜索引擎的语义查询有一定的帮助,从而有可能提高搜索的精度。
|
全文目录
摘要 5-7 ABSTRACT 7-12 第一章 绪论 12-22 1.1 问题提出 12-15 1.1.1 传统搜索引擎的分析 12 1.1.2 汉语复合结构概念图运算的提出 12-14 1.1.3 在传统搜索的结果中采用概念图匹配框架 14-15 1.2 汉语复合结构的概念图复合运算研究现状 15-19 1.2.1 汉语复合结构 16-17 1.2.2 概念图 17-18 1.2.3 概念图复合运算 18-19 1.3 本文研究的内容及意义 19-20 1.4 本文内容安排 20-22 第二章 汉语复合结构的概念图标引及原子概念图库的建立 22-30 2.1 复合结构的概念分析 22 2.2 概念图的定义 22-23 2.3 基于概念图的标引 23-24 2.4 原子概念 24-26 2.5 原子概念图库的建立 26-30 第三章 复合结构的预处理 30-43 3.1 词语的切分 31-32 3.2 中心概念的查找 32-33 3.3 判断是否是多中心概念类型 33-34 3.4 原子概念属性的归类 34-40 3.4.1 是否为实体判断 34-36 3.4.2 属性集合的判断 36-40 3.4.3 原子概念归为两类 40 3.5 处理可能产生借代修辞的词 40-41 3.6 复合操作类型的判断 41 3.7 复合结构预处理总结 41-43 第四章 复合结构词之间的概念图复合运算 43-61 4.1 复合结构词之间的主要运算方式 44-48 4.1.1 填值运算 45-46 4.1.2 添加属性名和属性值对运算 46-47 4.1.3 抑制属性名和属性值运算 47-48 4.2 复合结构词之间运算的语义语法分类 48-60 4.2.1 修饰关系运算 48-57 4.2.1.1 邻近词复合运算 48-50 4.2.1.2 跨词复合运算 50-52 4.2.1.3 未登录词复合运算 52-55 4.2.1.4 借代修辞运算 55-57 4.2.2 联合关系运算 57-60 4.2.2.1 多中心概念运算 57-60 4.3 概念图复合运算总结 60-61 第五章 DEMO 框架及实验结果 61-67 5.1 DEMO 整体框架分析 61-63 5.1.1 原子概念图库建立模块分析 62 5.1.2 预处理模块分析 62 5.1.3 复合运算模块分析 62-63 5.2 采用复合运算概念图的方法匹配与传统搜索结果比较 63-67 5.2.1 测试词 63-64 5.2.2 复合运算概念图方法匹配与传统搜索比较结果 64-67 第六章 总结和展望 67-69 6.1 回顾与总结 67-68 6.2 研究展望 68-69 参考文献 69-71 致谢 71-72 攻读硕士学位期间已发表或录用的论文 72
|
相似论文
- 电动车用复合结构永磁同步电机系统的仿真研究,TM341
- 电动车用轴径向—轴向磁通复合结构永磁同步电机的研究,TM341
- 高中生物学课堂教学中概念图的应用研究,G633.91
- 概念图教学在高中生物教学中的有效性研究,G633.91
- 高中生物教学中运用概念图策略的初步研究,G633.91
- 概念图在高中生物教学中的应用研究,G633.91
- 概念图在高中生物教学中的应用研究,G633.91
- 超疏水涂层的制备及应用研究,TQ171.68
- 两种不同构型聚乳酸共混物的结晶性能研究,O631.3
- 混合动力车用径向—径向磁通复合结构永磁同步电机的优化研究,TM351
- 概念图/思维导图在计算机教学中的应用研究,TP3-4
- 泡沫铝复合结构声学性能分析与实验研究,TB383.4
- Yb:YAG及Yb:YAG/YAG多晶透明陶瓷的制备及性能研究,TQ174.6
- 元素化合物知识概念图教学实践研究,G633.8
- 基于汉语概念图的词汇语义相似度计算,TP391.1
- 氧化锌及其复合材料的制备与性能研究,TB383.1
- ZnO/CdS纳米复合结构的制备及其光电特性研究,TB383.1
- 一维碳纳米材料电子输运的调制,TB383.1
- 构建网站用于高一物理课外辅导的实践,G633.7
- 需求概念图导引下的网页检索结果分析,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|