学位论文 > 优秀研究生学位论文题录展示

基因表达数据中共调控模式的挖掘算法

作 者: 刘佳
导 师: 季丽萍
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: DNA 微阵列技术 聚类 子空间聚类 时序数据 基因协同簇
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 17次
引 用: 0次
阅 读: 论文下载
 

内容摘要


DNA微阵列技术是生物信息学中一项很重要的技术,它能够同时监控成千上万个基因的表达值。通过分析DNA微阵列的数据集,生物学家能够得到非常有用的信息用于基因预测和基因调控网络。聚类,尤其是子空间聚类技术被广泛的用于分析DNA微阵列数据。传统的算法基本都着眼于发现只含有同变化趋势表达基因的基因簇。然而在很多的生物学应用中,既包含同变化趋势基因又包含异变化趋势基因的基因簇可以提供更多的有用的信息。基于此,在这篇文章里,本文提出了共调控模式基因簇的概念,并据此本文提出了有效的可以从二维的微阵列矩阵中挖掘到这种基因簇的算法。本文进一步的将二维算法扩展到三维以此解决三维数据的挖掘问题,并指明了三维算法和二维算法之间的异同。在二维和三维的算法中,本文都给出了具体的框架并示以伪代码,并且给出了相关的算法证明。本文对于真实的酵母菌数据所做的实验证明了本文算法对于挖掘共调控模式基因簇的有效性,并且能将之应用于生物研究当中。本文做了有关的参数变化实验,来研究算法的本身特性。

全文目录


中文摘要  4-5
Abstract  5-6
Acknowledgement  6-10
LIST OF TABLES  10-12
LIST OF FIGURES  12-13
1.INTRODUCTION  13-21
  1.1 Background: Microarray Data Analysis  13-16
    1.1.1 Microarray Technology  13-15
    1.1.2 Microarray Data Analysis  15-16
  1.2 Literature review  16-18
  1.3 Research Problem  18-20
  1.4 Contributions and organization  20-21
    1.4.1 Tcluster in 2-D dataset  20
    1.4.2 Tcluster in 3-D dataset  20
    1.4.3 Organization  20-21
2.LITERATURE REVIEWS  21-32
  2.1 Biclustering algorithms  21-31
  2.2 Summary  31-32
3.MINING TCLUSTER IN 2-D DATASET  32-46
  3.1 Overview  32
  3.2 2D Tminer  32-39
    3.2.1 Data processing  32-34
    3.2.2 Data transformation  34-35
    3.2.3 2D Tminer algorithm  35-37
    3.2.4 Pseudo code of the Algorithm  37-38
    3.2.5 Correctness  38-39
    3.2.6 Result Projection  39
  3.3 Experiments and Results  39-46
    3.3.1 Data Processing  40
    3.3.2 Meaningful cluster  40-42
    3.3.3 Biological Significance  42
    3.3.4 Parameter Study  42-46
4.MINING TCLUSTER IN 3-D DATASET  46-60
  4.1 Overview  46
  4.2 3D Tminer  46-56
    4.2.1 Data processing  46-47
    4.2.2 Data transformation  47-49
    4.2.3 3D Tminer algorithm  49-52
    4.2.4 Pseudo code of the Algorithm  52-55
    4.2.5 Correctness  55
    4.2.6 Result Projection  55-56
  4.3 Experiments and Results  56-59
    4.3.1 Data Processing  56-57
    4.3.2 Parameter Study  57-58
    4.3.3 Biological Significance  58-59
  4.4 Summary  59-60
5.CONCLUSION  60-62
  5.1 Thesis Contribution  60-61
  5.2 Future Research Directions  61-62
REFERENCE  62-66

相似论文

  1. 隐式用户兴趣挖掘的研究与实现,TP311.13
  2. 图像分割中阴影去除算法的研究,TP391.41
  3. 基于图分割的文本提取方法研究,TP391.41
  4. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  5. 高血压前期证候特征研究,R259
  6. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  7. K-均值聚类算法的研究与改进,TP311.13
  8. 大学生综合素质测评研究,G645.5
  9. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  10. 21个荷花品种遗传多样性的ISSR分析,S682.32
  11. 恩替卡韦联合TACE治疗伴乙肝病毒复制的原发性肝癌效果分析,R735.7
  12. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  13. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  14. 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
  15. 转基因稻米及其米制品外源重组DNA的检测,S511
  16. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  17. 南通市农业面源污染负荷研究与综合评价,X592
  18. 土壤环境功能区划研究,X321
  19. 寄主型和迁飞型棉蚜在交配行为、mtDNA与共生菌相关基因上的分化,S433
  20. 江苏省小麦孢囊线虫的发生调查及其核糖体DNA-ITS序列分析,S435.121
  21. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com