学位论文 > 优秀研究生学位论文题录展示

基于基因表达式编程的分类与聚类研究

作 者: 周倩
导 师: 王红
学 校: 山东师范大学
专 业: 计算机软件与理论
关键词: 基于规则的分类 基因表达式编程 挖掘规则 备选规则集 K-means聚类算法 最优簇数目 迭代重定位
分类号: TP311.13
类 型: 硕士论文
年 份: 2014年
下 载: 11次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据挖掘中的分类与聚类问题一直都是研究的热点,因为它们贴近实际生活,能为人们提供各种应用模型。近年来对分类和聚类的研究也从纵向研究逐渐转变为横向研究,即与其他算法进行融合,利用其他算法优势和特性来完成分类和聚类的目的。在大数据时代背景下,数据挖掘中的分类与聚类问题也将会越来越受到人们的关注,正所谓“物以类聚,人以群分”。基因表达式编程是由葡萄牙进化生物学家Ferreira提出的,它开创性的融合了遗传算法和遗传编程的优点,使其具有广阔的搜索能力和无穷的变化性。它的应用十分广泛,涉及生物,数学,计算机应用,物理等科学领域。本文基于基因表达式编程的分类与聚类研究,是将数据挖掘中的规则分类和K-means聚类算法,分别与基因表达式编程算法相结合,利用基因表达式编程的进化的特性及全局搜索能力,继而完成规则分类和聚类的研究。两种算法的融合,能够互相取长补短,为数据挖掘领域输入新思想,为基因表达式编程算法的应用又添新的一笔。本文的主要工作包括如下方面:1.将基因表达式编程用于挖掘规则,从而对使用规则的问题进行分类。首先,针对规则分类问题,设计出了一种新形式的染色体终端符号,引入规则的正确率作为适应度函数度量;其次将适应度由高到低排序,建立备选规则集;最后通过使用基因表达式编程挖掘Monk与Acute Inflammations中的规则,利用挖掘出的规则对数据集进行分类。实验表明基于基因表达式编程的挖掘规则分类算法的准确率会高于传统的分类算法。2.提出基于基因表达式编程的K-means聚类分析,该方法是对基于基因表达式编程的自动聚类算法的一种改进。首先,在基于基因表达式编程的自动聚类算法的基础上,对染色体的编码及解码进行了适当的改进,能够避免无效染色体的出现。其次在算法中加入了最优簇数目选取算法,并引用了K-means算法中的迭代重定位方法,使得到的聚类簇数目更加准确,直观有效的提高了聚类的效果。最后通过对150个二维点的聚类,实验表明了基于基因表达式编程的K-means聚类算法正确率高,收敛速度更快。

全文目录


摘要  6-7
Abstract  7-8
第一章 引言  8-12
  1.1 研究背景  8-9
  1.2 GEP 算法相关研究现状  9-10
    1.2.1 GEP 算法拓展与改进  9-10
    1.2.2 GEP 的应用研究  10
  1.3 本文主要的研究工作  10-12
第二章 分类与聚类的基本知识  12-16
  2.1 数据分类概述  12-14
    2.1.1 基于规则的分类的概述  12
    2.1.2 基于规则的分类的研究方法  12-14
  2.2 聚类分析的概述  14-16
    2.2.1 聚类分析中的基本公式  14
    2.2.2 K-means 聚类分析的概述  14-15
    2.2.3 迭代重定位方法  15-16
第三章 基因表达式编程  16-22
  3.1 GEP 中的基因  16-17
  3.2 GEP 的基本遗传操作  17-20
  3.3 适应度函数的选择  20-21
  3.4 GEP 基本算法  21-22
第四章 基于基因表达式编程的挖掘规则分类算法  22-30
  4.1 传统的 GEP 分类技术  22
  4.2 用 GEP 挖掘分类规则  22-25
    4.2.1 染色体的设计  22-23
    4.2.2 适应度函数  23
    4.2.3 进化操作  23-24
    4.2.4 MCR-GEP 算法流程  24-25
  4.3 实例的规则分类问题  25-26
  4.4 实验  26-28
    4.4.1 参数设置  26
    4.4.2 数据集  26-27
    4.4.3 实验结果及分析  27-28
  4.5 本章小结  28-30
第五章 基于基因表达式编程的 K-means 聚类分析  30-40
  5.1 基于 GEP 的自动聚类算法  30
  5.2 GEP-KC 算法  30-36
    5.2.1 染色体的设计  31
    5.2.2 染色体解码  31-33
    5.2.3 适应度函数的选取  33-34
    5.2.4 进化操作  34
    5.2.5 进化过程的优化  34
    5.2.6 进化完成后的优化  34-35
    5.2.7 GEP-KC 算法流程  35-36
  5.3 实验  36-39
    5.3.1 实验数据和参数  36-37
    5.3.2 实验结果及分析  37-39
  5.4 本章小结  39-40
第六章 总结与展望  40-42
参考文献  42-45
发表的学术论文及科研成果  45-46
致谢  46

相似论文

  1. 语音情感识别的特征选择与特征产生,TP18
  2. 基于遗传算法和粗糙集的聚类算法研究,TP18
  3. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  4. 基于改良蚁群算法的神经网络分类规则提取,TP183
  5. Web数据挖掘技术在网络教育论坛中的应用研究,G434
  6. 改进分水岭算法在医学图像分割中的应用研究,TP391.41
  7. 基于模型的装备快速测试方法研究,TJ06
  8. Rule Based Multi Agent System to Reduce Malnutrition in Children,TP18
  9. 基于GEP的金属疲劳时间预测模型,O346.2
  10. 一种基于聚类的支持向量机反问题求解算法,TP18
  11. 数据挖掘在入侵检测系统中的应用研究,TP393.08
  12. 针对包含异常值数据的优化K-MEANS聚类算法,TP311.13
  13. GEP解码的局限性分析与对策,TP18
  14. 太阳能光伏发电系统设计及供电系统优化方法研究,TM615
  15. 基于网格的K-means算法与聚类有效性指标,TP18
  16. 分布式能源供应链的规划与鲁棒运作研究,F274;F407.22
  17. GEP及SVM融合的分类技术研究,TP18
  18. 基于基因表达式编程的Web个性化推荐技术研究,TP393.09
  19. 离心式风机振动故障诊断方法研究,TH442
  20. 基于数据挖掘的入侵检测技术研究,TP393.08
  21. 基于群智能算法的ST公司的特征分析和识别研究,F275.5

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com