学位论文 > 优秀研究生学位论文题录展示
相容关系粒计算模型在文章比对中的应用研究
作 者: 龚科华
导 师: 邱桃荣
学 校: 南昌大学
专 业: 计算机应用技术
关键词: 粗糙集 粒计算 相容粒 文章比对
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 66次
引 用: 3次
阅 读: 论文下载
内容摘要
随着信息技术的飞速发展,特别是互联网的发展,网络上的资源日渐丰富,获取信息也变得更加的方便和快捷,同时抄袭也变得更加的容易。使用文章比对系统能够实现对论文的自动比对,能够高效、快捷的帮助检测人员查找出存在抄袭嫌疑的文章。同时,在刊物审稿过程,实现文章比对能进一步提高编辑部的审稿速度与质量。并且文章比对还可以辅助鉴别文章内容的版权归属等问题。因此,对于文章比对的研究具有一定的实用价值和现实意义。本文以粗糙集和粒计算理论为核心,研究中文文章比对的方法。首先,介绍了粗糙集理论、粒计算理论等基本知识,尤其是基于相容关系粒计算模型理论。讨论了粒计算的相关概念、中文分词技术、文本特征值提取,以及中文词语相似度计算等关键问题;其次,研究了基于相容粒计算模型的文章比对方法和设计了相应算法。给出文章相容粒、段落相容粒和粒空间信息表的定义,粒空间信息表的构建方法。根据粒计算理论中相容粒之间的外延关系和复合关系来计算文章相容粒之间和段落相容粒之间的相似度,并给出了示例说明。描述了基于相容粒计算模型的文章比对流程和提出了相应的算法;再次,在真实数据集下对所提出的算法进行不同方面的测试,并对测试结果进行的分析。测试结果和分析评估表明所提出的基于相容粒计算模型的文章比对方法是有效的,它基本能满足用户对相似性文章的查找需求。最后,对所研究的工作进行了总结和展望。将粗糙集和粒计算理论应用于文章比对中不仅扩展了理论在新领域的应用,而且为实现文章比提供了新的技术。
|
全文目录
摘要 3-4 ABSTRACT 4-8 第1章 绪论 8-15 1.1 背景与意义 8-9 1.2 国内外研究现状 9-12 1.2.1 粗糙集研究现状 9-10 1.2.2 粒计算研究现状 10-11 1.2.3 文章比对技术研究现状 11-12 1.3 论文的主要研究工作 12-13 1.4 论文的组织结构 13-15 第2章 粗糙集与粒计算理论 15-29 2.1 粗糙集基本理论 15-19 2.1.1 知识 15-16 2.1.2 粗糙集的基本定义 16-19 2.2 经典粗糙集理论的扩展 19-23 2.2.1 变精度粗糙集模型 20-21 2.2.2 概率粗糙集模型 21-22 2.2.3 模糊粗糙集模型 22-23 2.2.4 基于随机集的粗糙集模型 23 2.3 基于相容关系粒计算模型 23-27 2.4 本章小结 27-29 第3章 文章比对中的几个关键技术 29-37 3.1 中文分词技术 29-32 3.1.1 中文分词方法 30-32 3.1.2 现有中文分词系统 32 3.2 文本特征值提取 32-33 3.3 中文词语相似度计算 33-36 3.3.1 词语词形距离 34 3.3.2 词语语义距离 34-36 3.3.3 词语相似度的合成 36 3.4 本章小结 36-37 第4章 基于相容粒计算模型的文章比对方法 37-48 4.1 段落相容粒和文章相容粒 37 4.2 相容粒知识库与粒空间信息表 37-41 4.2.1 相容粒知识库 37-38 4.2.2 粒空间信息表 38-41 4.3 相容粒相似度计算 41 4.4 粗糙相似矩阵 41-42 4.5 相似度向量表达式 42-44 4.6 基于相容粒计算模型的文章比对流程和算法 44-47 4.6.1 基于相容粒计算模型的文章比对流程 44-45 4.6.2 基于相容粒计算模型的文章比对算法 45-47 4.7 本章小结 47-48 第5章 算法测试与结果分析 48-54 5.1 测试平台与测试数据集 48 5.2 测试一:变精度β值对上、下近似集内元素的影响 48-49 5.3 测试二:词语语义判断对上、下近似集内元素的影响 49-50 5.4 测试三:上、下近似集准确率与召回率分析 50-52 5.5 测试四:词语语义判断对上、下近似集准确率与召回率的影响 52-53 5.6 本章小结 53-54 第6章 总结与展望 54-56 6.1 总结 54-55 6.2 展望 55-56 致谢 56-57 参考文献 57-60 攻读学位期间的研究成果 60
|
相似论文
- 基于支持向量机的故障诊断方法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 粗糙集理论和Flex技术在中长期径流预报中的应用,P338
- 基于核心示例集的属性约简方法研究,O159
- 基于粗集模糊逻辑的洗衣机模糊控制系统的应用研究,TP273.4
- 建筑工程项目施工阶段隐性成本影响因素及控制对策研究,F285
- 基于RS和SVM的风电总装企业物料分类研究与应用,TP18
- 基于粗糙概念格的多属性决策分析,O159
- 模糊拟序关系下的模糊粗糙集,O159
- 建筑安全短期行为及其控制研究,TU714
- 基于粗糙集的风景林景观美学评价,S759.5
- 工程量清单计价模式下的评标模型,F284
- 概念格的属性约简及建格算法的研究,O159
- 基于双论域上的不确定性问题的研究,O159
- 基于粒计算的三层结构的交通流模拟,U491.112
- 林分空间结构优化计算机辅助系统研究,S718.5
- 基于粒计算的模糊控制研究及应用,TP273.4
- 模拟电路故障诊断方法研究与实现,TN710
- 基于胜任力模型的企业人才测评系统研究,F224
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|