学位论文 > 优秀研究生学位论文题录展示

随机森林算法及其在代谢指纹图谱中的应用研究

作 者: 吴清华
导 师: 梁逸曾
学 校: 中南大学
专 业: 分析化学
关键词: 随机森林 代谢轨迹 生物标记物 多维尺度变换
分类号: R587.1
类 型: 硕士论文
年 份: 2013年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


摘要:代谢组学作为一种新发展起来的系统生物学分支学科,研究的是生物机体内或是细胞组织系统内的动态代谢变化。糖尿病动物模型的代谢组学研究,对探究糖尿病及其并发症等的发病机制、降糖药的药理疗效以及及早发现并预防糖尿病,均具有十分重要的现实意义。本文重点研究随机森林算法在代谢指纹图谱中的应用,主要内容如下:一、基于C57BL/6J小鼠和经诺和龙/罗格列酮治疗的不同周期的糖尿病KK-av小鼠的尿液样本中小分子内源性代谢产物的定性定量信息,采用随机森林算法(RF)构建了糖尿病小鼠经其治疗后的代谢轨迹模型图,并经过树数目的选择、相似度矩阵、多维尺度变换等处理,获得不同组类小鼠的聚类信息,以及糖尿病小鼠经降糖药治疗后的不同周期的代谢变化轨迹。继而通过分析随机森林中变量重要度筛选出的代谢物,探究诺和龙/罗格列酮治疗糖尿病的机理及疗效。结果表明随机森林较之主成分分析(PCA)能得到更好的聚类信息,并能使其治疗的代谢轨迹清晰可视化。且模型中糖尿病小鼠逐渐向健康小鼠靠拢,也即经诺和龙/罗格列酮治疗后,其能很好调节血糖、多元醇以及有机酸,糖尿病小鼠的代谢模式逐渐转向健康小鼠。二、基于C57BL/6J(雄性和雌性)小鼠和AMPKa2-KO(雄性和雌性)小鼠的尿液样本中小分子代谢物的定性定量信息,采用随机森林得到四类小鼠间明显的聚类信息。同样运用其重要变量度筛选出不同组类小鼠中的重要内源代谢物。以此分析AMPK基因对生物机体内物质代谢的影响,并探讨了其对不同性别小鼠的代谢模式的不同影响。为进一步研究糖尿病的影响因素及致病机理提供了一定的依据。以上研究可以表明,采用随机森林算法分析代谢指纹图谱可以得到很好的聚类信息以及发掘其中潜在的重要生物标记物,其为进一步综合分析研究药物疗效、基因对疾病的影响提供了有理有力的依据。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-14
  1.1 代谢组学  9-11
  1.2 化学计量学在代谢组学中的应用  11-13
  1.3 本文研究内容  13-14
2 随机森林算法简介  14-21
  2.1 分类问题  14-15
  2.2 Bagging方法  15-16
  2.3 决策树简介  16-17
  2.4 随机森林模型  17-21
    2.4.1 变量重要度  18-19
    2.4.2 相似得分确定样本相似度  19-21
3 随机森林用于鉴定糖尿病小鼠经诺和龙治疗的代谢轨迹  21-30
  3.1 引言  21
  3.2 实验部分  21-22
    3.2.1 仪器与试剂  21-22
    3.2.2 动物样本  22
    3.2.3 样本处理  22
    3.2.4 GC-MS分析条件  22
  3.3 结果与讨论  22-29
    3.3.1 小鼠尿液中代谢物质的定性定量分析  22-25
    3.3.2 小鼠样本经诺和龙治疗后的代谢轨迹变化  25-27
    3.3.3 生物标记物对代谢轨迹变化的贡献  27-29
  3.4 本章小结  29-30
4 随机森林用于鉴定糖尿病小鼠经罗格列酮治疗的代谢轨迹  30-38
  4.1 引言  30
  4.2 实验部分  30
    4.2.1 动物模型  30
    4.2.2 实验条件与处理方法  30
  4.3 结果与讨论  30-37
    4.3.1 小鼠尿液中代谢物质的定性定量分析  30-32
    4.3.2 小鼠样本经罗格列酮治疗后的代谢轨迹变化  32-35
    4.3.3 生物标记物对代谢轨迹变化的贡献  35-37
  4.4 本章小结  37-38
5 基于随机森林分析AMPK基因敲除小鼠代谢图谱  38-47
  5.1 引言  38
  5.2 实验部分  38
    5.2.1 动物模型  38
    5.2.2 实验条件与处理方法  38
  5.3 结果与讨论  38-46
    5.3.1 小鼠尿液中代谢物质的定性定量分析  38-41
    5.3.2 随机森林算法处理分析代谢数据  41-43
    5.3.3 随机森林算法挖掘分析代谢数据中的生物学信息  43-46
  5.4 本章小结  46-47
6 结论  47-48
参考文献  48-56
攻读学位期间主要研究成果  56-57
致谢  57

相似论文

  1. 基于随机森林的植物抗性基因识别方法研究,Q943
  2. 镉胁迫诱导拟南芥MLH1基因启动子甲基化变化的分子诊断,X173
  3. 面向分子生物系统的计算技术应用研究,Q7-3
  4. 基因微阵列数据的SVM分类器优化方法,Q75
  5. 急性肾损伤生物标志物在冠脉造影及PCI术患者尿液中的变化,R692
  6. 含丹参和1,6-二磷酸果糖的St.Thomas液持续低温微量灌注离体大鼠心脏的保护作用,R654.2
  7. 在线生物监测技术在饮水安全预警中的应用研究,X832
  8. 基于RFA和Copula的海南旅游业及高尔夫产业预测,F592.7;G849.3
  9. 基于特征选择的多变量数据分析方法及其在谱学研究中的应用,Q51
  10. 非线性经济周期模型的随机稳定性与分岔研究,F224
  11. 蛋白质二级结构类预测中的信息提取与预测方法研究,Q51
  12. 基于随机森林的致病SNPs检测方法研究,Q811.4
  13. 无Co马氏体时效不锈钢成分设计及性能研究,TG142.71
  14. 高维病例—对照研究中交互作用的随机森林分析方法探讨,R195
  15. 随机生存森林在高维生存资料中的降维分析,R181.3
  16. 蛋白质结合位点预测方法研究与应用,R34
  17. 外周血smMHC、sELAF、D-dimer对于急性主动脉夹层诊断的临床意义,R543.1
  18. 全基因组二代测序及甲基化芯片法在探明肠癌患者个体化分子标记物中的应用,R735.34
  19. 基于证据理论的分类方法研究,TP311.13
  20. 基于随机森林的手势检测与识别系统的研究,TP391.41
  21. 基于随机森林与卡尔曼滤波的人体跟踪方法研究,TP391.4

中图分类: > 医药、卫生 > 内科学 > 内分泌腺疾病及代谢病 > 胰岛疾病 > 糖尿病
© 2012 www.xueweilunwen.com