学位论文 > 优秀研究生学位论文题录展示
基于蚁群聚类的特征基因选择算法研究
作 者: 刘云
导 师: 吴蓉晖
学 校: 湖南大学
专 业: 计算机科学与技术
关键词: 基因表达谱 基因选择 聚类 蚁群 支持向量机
分类号: TP181
类 型: 硕士论文
年 份: 2010年
下 载: 23次
引 用: 0次
阅 读: 论文下载
内容摘要
随着人类基因组计划的完成,生命科学进入了一个前所未有的新时代。生物学家们通过DNA微阵列技术能够同时检测成千上万个基因,使得他们对肿瘤细胞有了一个宏观的认识。然而由于这一技术高度自动化、规模化以及微型化,基因芯片数据存在维度高、样本少的特点。如何有效分析并处理这一技术所产生的大量数据并找到对疾病研究与治疗有意义的基因子集,已经成为了该领域研究的重点以及难点。蚁群聚类算法依据蚂蚁打扫墓穴原理发展演变而来。首先,将数据对象随机地投影到一个平面,然后每只蚂蚁随机地选择一个数据对象,根据该对象在局部区域的相似度而得到的概率,决定蚂蚁是否“拾起”、“移动”或“放下”该对象。经过有限次迭代,平面上的数据对象按其相似性而聚集,最后得到聚类结果和聚类数目。近些年来相关群智能算法已经广泛应用到基因选择方法中来,并取得了不错的效果。本文提出了一种基于网格的蚁群聚类算法。该方法首先将数据随机分布到一个二维平面上,该平面有m m有个网格组成。然后在该平面上产生一些虚拟蚂蚁对数据对象进行聚类分析。近年来,国内外研究学者纷纷提出各种基因选择方法,但仍存在诸如基因共线性、缺乏组合基因的考量以及整体运算复杂度的问题。为了解决这些问题,本文提出了一种基于蚁群聚类的特征基因选择方法。首先,我们采用过滤法依据基因自身所包含的表达差异信息对基因进行打分,并删除分值低于阈值的基因。随后我们采用蚁群聚类算法来删除冗余基因。我们采用支持向量机作为分类器,并对四个肿瘤数据集进行实验仿真。实验结果证明我们的方法能够有效解决上述问题。
|
全文目录
摘要 5-6 Abstract 6-7 目录 7-9 插图索引 9-10 附表索引 10-11 第1章 绪论 11-13 1.1 研究动机 11-12 1.2 研究目的 12 1.3 论文结构安排 12-13 第2章 相关理论研究 13-36 2.1 基因芯片原理 13-17 2.1.1 基因微阵列 13-14 2.1.2 基因表达谱数据形态 14-15 2.1.3 基因芯片应用 15-17 2.2 特征基因选择方法 17-22 2.2.1 过滤法 17-20 2.2.2 缠绕法 20 2.2.3 嵌入法 20-21 2.2.4 混合法 21-22 2.3 聚类分析 22-23 2.3.1 主要聚类方法 22-23 2.3.2 微阵列数据特征选择算法特性 23 2.4 蚁群聚类 23-28 2.4.1 蚁群算法概念 24 2.4.2 蚂蚁寻找食物行为 24-25 2.4.3 蚂蚁构造墓地行为 25 2.4.4 蚁群聚类算法 25-26 2.4.5 算法描述 26-28 2.5 预测分类器 28-35 2.5.1 人工神经网络 29-31 2.5.2 决策树 31-32 2.5.3 贝叶斯 32-33 2.5.4 支持向量机 33-35 2.6 小结 35-36 第3章 基于蚁群聚类的特征基因选择算法 36-45 3.1 过滤方法 36 3.2 基于 k-NN 原理的聚类方法 36-39 3.3 蚁群聚类方法 39-42 3.3.1 拾取基因 40-41 3.3.2 丢弃基因 41-42 3.4 分类评估方法 42-44 3.5 小结 44-45 第4章 仿真实验与结果分析 45-53 4.1 仿真平台 45-47 4.2 实验数据 47 4.3 仿真结果与分析 47-52 4.3.1 Leukemia 47-49 4.3.2 Colon 49-50 4.3.3 CNS 50-51 4.3.4 Prostate Cancer 51-52 4.4 小结 52-53 结论 53-55 参考文献 55-62 致谢 62-63 附录A 攻读学位期间所发表的学术论文及所参加项目 63
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于蚁群算法的电梯群优化控制研究,TU857
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 基于改进蚁群算法的机器人路径规划研究,TP242
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 基于RNA测序技术的马氏珠母贝珍珠囊转录组及数字基因表达谱分析,Q786
- 高血压前期证候特征研究,R259
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 大学生综合素质测评研究,G645.5
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|