学位论文 > 优秀研究生学位论文题录展示
基因表达数据中共调控模式的挖掘算法
作 者: 刘佳
导 师: 季丽萍
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: DNA 微阵列技术 聚类 子空间聚类 时序数据 基因协同簇
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 17次
引 用: 0次
阅 读: 论文下载
内容摘要
DNA微阵列技术是生物信息学中一项很重要的技术,它能够同时监控成千上万个基因的表达值。通过分析DNA微阵列的数据集,生物学家能够得到非常有用的信息用于基因预测和基因调控网络。聚类,尤其是子空间聚类技术被广泛的用于分析DNA微阵列数据。传统的算法基本都着眼于发现只含有同变化趋势表达基因的基因簇。然而在很多的生物学应用中,既包含同变化趋势基因又包含异变化趋势基因的基因簇可以提供更多的有用的信息。基于此,在这篇文章里,本文提出了共调控模式基因簇的概念,并据此本文提出了有效的可以从二维的微阵列矩阵中挖掘到这种基因簇的算法。本文进一步的将二维算法扩展到三维以此解决三维数据的挖掘问题,并指明了三维算法和二维算法之间的异同。在二维和三维的算法中,本文都给出了具体的框架并示以伪代码,并且给出了相关的算法证明。本文对于真实的酵母菌数据所做的实验证明了本文算法对于挖掘共调控模式基因簇的有效性,并且能将之应用于生物研究当中。本文做了有关的参数变化实验,来研究算法的本身特性。
|
全文目录
中文摘要 4-5 Abstract 5-6 Acknowledgement 6-10 LIST OF TABLES 10-12 LIST OF FIGURES 12-13 1.INTRODUCTION 13-21 1.1 Background: Microarray Data Analysis 13-16 1.1.1 Microarray Technology 13-15 1.1.2 Microarray Data Analysis 15-16 1.2 Literature review 16-18 1.3 Research Problem 18-20 1.4 Contributions and organization 20-21 1.4.1 Tcluster in 2-D dataset 20 1.4.2 Tcluster in 3-D dataset 20 1.4.3 Organization 20-21 2.LITERATURE REVIEWS 21-32 2.1 Biclustering algorithms 21-31 2.2 Summary 31-32 3.MINING TCLUSTER IN 2-D DATASET 32-46 3.1 Overview 32 3.2 2D Tminer 32-39 3.2.1 Data processing 32-34 3.2.2 Data transformation 34-35 3.2.3 2D Tminer algorithm 35-37 3.2.4 Pseudo code of the Algorithm 37-38 3.2.5 Correctness 38-39 3.2.6 Result Projection 39 3.3 Experiments and Results 39-46 3.3.1 Data Processing 40 3.3.2 Meaningful cluster 40-42 3.3.3 Biological Significance 42 3.3.4 Parameter Study 42-46 4.MINING TCLUSTER IN 3-D DATASET 46-60 4.1 Overview 46 4.2 3D Tminer 46-56 4.2.1 Data processing 46-47 4.2.2 Data transformation 47-49 4.2.3 3D Tminer algorithm 49-52 4.2.4 Pseudo code of the Algorithm 52-55 4.2.5 Correctness 55 4.2.6 Result Projection 55-56 4.3 Experiments and Results 56-59 4.3.1 Data Processing 56-57 4.3.2 Parameter Study 57-58 4.3.3 Biological Significance 58-59 4.4 Summary 59-60 5.CONCLUSION 60-62 5.1 Thesis Contribution 60-61 5.2 Future Research Directions 61-62 REFERENCE 62-66
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 恩替卡韦联合TACE治疗伴乙肝病毒复制的原发性肝癌效果分析,R735.7
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
- 转基因稻米及其米制品外源重组DNA的检测,S511
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 寄主型和迁飞型棉蚜在交配行为、mtDNA与共生菌相关基因上的分化,S433
- 江苏省小麦孢囊线虫的发生调查及其核糖体DNA-ITS序列分析,S435.121
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|