学位论文 > 优秀研究生学位论文题录展示

基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建

作 者: 岳超
导 师: 章元明
学 校: 南京农业大学
专 业: 作物遗传育种
关键词: 基因表达谱数据 聚类分析 Calinski-Harabasz指数 灵敏值 正确分类比率 基因网络 大豆疫霉菌
分类号: S435.651
类 型: 硕士论文
年 份: 2011年
下 载: 19次
引 用: 0次
阅 读: 论文下载
 

内容摘要


大豆疫霉(Phytophthora sojae)侵染大豆引起的大豆根腐病是大豆生产上的毁灭性病害之一,每年造成大豆10多亿美元的经济损失。为深入了解大豆疫霉引起的大豆病害,有必要进行基因芯片试验。在基因芯片试验数据分析中,聚类分析基因网络构建是常规的分析方法。这些方法所挖掘的信息对大豆遗传育种是有用的。本研究主要包括三个方面的内容。首先,选择一种适宜的聚类分析方法对大豆疫霉菌基因表达谱数据进行聚类分析。为此,利用52组基因表达谱模拟数据和1组酵母基因表达谱数据,通过CH(Calinski-Harabasz index)、FOM(figure of merit)和CCR (correct classification rate)三个指标,比较Ma等(2006)、Qu & Xu(2006)和Fu & Medico(2007)三种基于模型的基因表达谱聚类分析方法,以获得适宜的聚类分析方法;其次,用选择出的聚类分析方法对大豆疫霉菌基因表达谱数据进行聚类分析,并分析其表达趋势;最后,根据聚类分析结果,用Edwards等(2010)的方法,通过R语言包gRapHD对每一亚类大豆疫霉菌基因进行基因网络构建。其主要结果如下:1)用Ma等(2006)、Qu和Xu(2006)以及Fu和Medico(2007)方法对52组基因表达谱模拟数据和1组酵母基因表达谱数据进行聚类分析,得到Ma等(2006)的CH平均值最大、FOM平均值最小和CCR平均值最大,说明Ma等(2006)对基因表达谱数据的聚类分析效果是上述三种方法中最优的。2)用Ma等(2006)对大豆疫霉菌数据进行聚类分析,把8187个基因分成了21类,每一类的基因数目分别为:2593、501、566、381、9、676、105、40、98、1498、63、126、168、49、795、29、28、28、34、385和15。基因在各个时期的表达趋势为:菌丝、产包茵丝、游动孢子、休止孢子、休止孢子萌发、侵染Ⅰ(IF1.5h)、侵染Ⅱ(IF3.0h)、侵染Ⅲ(IF6.Oh)、侵染Ⅳ(IF12.0h)和侵染Ⅴ(IF24.0h)(?)寸期的上调基因数目分别为997、792、1425、3993、4226、2824、0、49、9和0个;其相应的下调基因数目分别为:446、1084、4056、357、1234、1326、751、34、74和89个。3)用R语言包gRapHD分别对每一类大豆疫霉菌基因进行了基因网络的构建,得到21个大豆疫霉菌基因调控网络,共找出60个有待验证的关键基因,并分析了这些基因的功能。

全文目录


摘要  8-10ABSTRACT  10-12英文缩略词  12-14第一章 文献综述  14-43  1 基因表达谱研究技术  14-17    1.1 抑制消减杂交技术  14-15    1.2 基因表达谱芯片技术  15-16    1.3 基因表达序列分析技术  16-17  2 聚类分析方法研究进展  17-26    2.1 聚类分析概述  17-19      2.1.1 聚类分析算法的基本定义  17-18      2.1.2 聚类分析中距离函数的概述  18-19    2.2 基因表达数据的聚类分析算法  19-22      2.2.1 K-均值(K-MEANS)算法  19-20      2.2.2 模糊C-均值(C-MEANS)聚类算法  20      2.2.3 分层聚类算法  20-21      2.2.4 自组织特征映射(SELF-ORGANIZING MAPS,SOM)算法  21      2.2.5 基于模型的聚类算法  21-22    2.3 聚类方法检验标准  22-25      2.3.1 外部准则  23      2.3.2 内部准则  23-24      2.3.3 相对准则  24-25    2.4 聚类算法面临的挑战  25-26    2.5 基因表达数据聚类分析问题所在  26  3 大豆疫霉菌基因表达谱数据的研究进展  26-29    3.1 大豆疫霉菌的简述  26-28    3.2 大豆疫霉基因组学研究  28-29  4 基因调控网络研究  29-42    4.1 基因调控网络概述  29-32      4.1.1 基因调控网络概念  29-30      4.1.2 基因调控网络研究的意义  30-31      4.1.3 基因调控网络研究现状  31-32    4.2 基因调控网络研究模型  32-40      4.2.1 有向图和无向图  32-33      4.2.2 布尔网络模型  33-36      4.2.3 线性组合模型  36      4.2.4 加权矩阵模型  36-38      4.2.5 微分方程模型  38-39      4.2.6 互信息关联矩阵模型  39-40    4.3 基因调控网络模型的比较分析  40-42  5 本研究的目的与研究内容  42-43第二章 基因表达数据聚类分析方法比较研究  43-67  1 引言  43-44  2 材料与方法  44-56    2.1 材料  44-47    2.2 方法  47-56      2.2.1 MA等(2006)的方法介绍  48-50      2.2.2 QU和XU(2006)的方法介绍  50-53      2.2.3 FU和MEDICO(2007)的方法介绍  53-55      2.2.4 方法比较的判别标准  55-56  3 结果分析  56-65    3.1 基于小样本模拟数据聚类分析方法的比较  56-59    3.2 基于大样本模拟数据聚类分析方法的比较  59-61    3.3 基于酵母基因表达谱数据聚类分析方法的比较  61-65  4 讨论  65-67    4.1 聚类分析方法比较的必要性  65    4.2 聚类分析方法使用方便性能及聚类效力比较  65-67第三章 大豆疫霉菌基因聚类分析与基因网络构建  67-90  1 引言  67-69  2 材料与方法  69-70    2.1 材料  69    2.2 方法  69-70  3 结果分析  70-85    3.1 聚类方法比较  70-72    3.2 大豆疫霉菌基因表达趋势分析  72-77    3.3 大豆疫霉菌基因的基因网络分析  77-85  4 讨论  85-90    4.1 聚类分析结果的可靠性  85    4.2 基因网络的基本评价  85-90第四章 全文结论和创新点  90-91  1 全文结论  90  2 创新点  90-91参考文献  91-101附录  101-109攻读硕士学位期间待发表的论文  109-110致谢  110

相似论文

  1. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  2. 高血压前期证候特征研究,R259
  3. 大学生综合素质测评研究,G645.5
  4. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  5. 21个荷花品种遗传多样性的ISSR分析,S682.32
  6. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  7. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  8. 南通市农业面源污染负荷研究与综合评价,X592
  9. 土壤环境功能区划研究,X321
  10. 大豆杂种优势及其遗传基础研究,S565.1
  11. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
  12. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  13. 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
  14. 云南省直管县改革研究,D630
  15. 基于分治法的聚类方法研究,TP311.13
  16. 三十种中成药元素含量分析及基于元素含量的中成药分类研究,R286.0
  17. 脑瘤的基因网络建模与分析,R739.4
  18. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  19. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  20. 重庆文化产业竞争力研究,F224

中图分类: > 农业科学 > 植物保护 > 病虫害及其防治 > 农作物病虫害及其防治 > 经济作物病虫害 > 油料作物病虫害 > 大豆病虫害
© 2012 www.xueweilunwen.com