学位论文 > 优秀研究生学位论文题录展示

基于信息熵的粗糙集理论的研究和应用

作 者: 张晓红
导 师: 李龙澍
学 校: 安徽大学
专 业: 计算机软件与理论
关键词: 文本处理 主观倾向性 粗糙集 信息熵 属性约简
分类号: TP18
类 型: 硕士论文
年 份: 2011年
下 载: 100次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网信息资源的日益庞大,信息传输速度的迅速加快,互联网给人们提供的服务途径更加方便,内容不断丰富,例如人们可以在网络上发表博客,将自己知道的有趣的事情和所有的博友分享,也可以对其他博友分享的东西进行评论,发表自己的意见和见解;可以在网络上进行交易,买卖东西,甚至于对交易的产品质量、价格、买卖双方的诚信度进行评价。由于网络活动自己的虚拟性的特点,无论我们是在网络上分享奇闻异事还是在网络上进行交易活动,人们都看不到事情或是事物真实的存在,只能看到事物或事情在网络上的描述性的存在。为了更加加深对这种网络存在的事情或事物的认识,人们更多的是倾向于通过参照网络上现有的对这种网络存在事物或事情的评价来多方位、多角度的认识和了解这类网络存在事物的各个方面的性质,例如之前所介绍的网络奇闻异事的真实性、网络交易产品的质量、性价比、交易双发的诚信度等。但是由于网络评论仁者见仁智者见智,对于同一事物,人们可能会形成不同的评论,但结果不外乎两个,正面或是负面。如何可以通过计算机系统的对这些网络评论进行分析,判断人们对事物的评价倾向,即判断这些中文文本的情感倾向,对网络使用者来说,无疑是具有巨大的价值的。文本倾向性分析属于计算语言学的范畴。在计算语言学以及相关领域,对主观性信息的分析和提取的关注目前的研究并不是很多,尚处于起步阶段,还有很多问题需要进行全面的探索。这项研究涉及到人工智能,机器学习,信息检索,数据挖掘等多方面的基础研究,因此,文本倾向性的分析也具有重要的学术研究价值。本文主要对网络评论语句的特征形式进行分析,结合粗糙集理论中的属性约减、信息熵、模式匹配算法对网络评论语句进行预处理,提出了一种基于信息熵的粗糙约理论在中文文本处理中的应用,对中文文本的倾向进行判断,并通过实验验证了这种判断的可行性。

全文目录


摘要  3-4
Abstract  4-8
第一章 绪论  8-17
  1.1 中文文本倾向性的发展概况和研究方法  8-11
    1.1.1 中文文本倾向性的发展概况  8-9
    1.1.2 中文文本倾向性的方法  9-11
  1.2 粗糙集理论的研究背景和发展状况  11-14
    1.2.1 粗糙集理论的发展背景  11-13
    1.2.2 粗糙集理论在国外的研究现状  13-14
    1.2.3 粗糙集理论在国内研究现状  14
  1.3 论文研究内容和组织结构  14-17
    1.3.1 研究内容  14-16
    1.3.2 组织结构  16-17
第二章 糙集理论的代数表示与信息表示  17-50
  2.1 粗糙集理论的代数表示  17-30
    2.1.1 知识与不可分辨关系  17-21
    2.1.2 近似集、边界区和粗糙集  21-23
    2.1.3 知识表达系统和决策表  23-28
    2.1.4 知识的约简、核  28-30
  2.2 粗糙集理论的信息表示  30-50
    2.2.1 知识的粗糙性  30-32
    2.2.2 知识信息熵与互信息  32-34
    2.2.3 信息系统的知识约简  34-48
    2.2.4 决策表的的知识约简  48-50
第三章 基于粗糙集属性约简算法的中文文本处理方法  50-55
  3.1 中文文本预处理  51-52
  3.2 候选中文文本情感倾向性分析匹配模型  52-53
  3.3 粗糙集属性约减方法约减候选中文文本情感倾向性分析匹配模型  53-54
  3.4 测试语料测试约减后的匹配模型处理结果  54-55
第四章 连续属性的离散化方法  55-62
  4.1 常用离散化方法简介  55-57
    4.1.1 新增模板Slowinski R.方法(S方法)  55-56
    4.1.2 Hu X.H.方法(H方法)  56
    4.1.3 Lenarcik A.方法(L方法)  56-57
  4.2 基于动态层次聚类的连续属性离散化方法算法  57-62
    4.2.1 层次聚类算法  58-59
    4.2.2 基于动态层次聚类的离散化方法  59-62
第五章 基于信息熵理论的粗糙集理论及其在中文文本处理中的应用  62-69
  5.1 信息熵理论在粗糙集属性约减中的一个具体应用举例  63-69
第六章 总结  69-70
致谢  70-71
参考文献  71-75
攻读学位期间发表的论文目录  75

相似论文

  1. 基于信息熵的课堂观察量化评价模型研究,G632.4
  2. 基于支持向量机的故障诊断方法研究,TP18
  3. 基于连锁图的QTL综合分析方法研究,S562
  4. 基于遗传算法和粗糙集的聚类算法研究,TP18
  5. 基于粗糙集的城市区域交通绿时控制系统研究,TP18
  6. 粗糙集的增量式属性约简研究,TP18
  7. 知识粒度的计算及其在属性约简中的应用研究,TP18
  8. 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
  9. 粗糙集理论和Flex技术在中长期径流预报中的应用,P338
  10. 燃油喷雾粒度分布测量及其信息熵分析,TK407.9
  11. 服装质量预测系统的软件设计与实现,TP311.52
  12. 水质时序数据处理及预警系统数据库构建技术研究,TP274
  13. 基于粗糙集理论的决策树分类算法与应用研究,TP18
  14. 基于综合效应的粗糙规划模型,O221
  15. 基于核心示例集的属性约简方法研究,O159
  16. 基于广义信息熵的决策树模型及其在绩效评价中的应用,TP18
  17. 基于判断矩阵一致性的判别方法研究,O151.21
  18. 面向钢铁混合加工作业的资源分配方法研究,F426.31
  19. 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
  20. 基于粗集模糊逻辑的洗衣机模糊控制系统的应用研究,TP273.4
  21. 网络攻击效能评估若干关键技术研究,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com