学位论文 > 优秀研究生学位论文题录展示

隐马尔可夫模型在基因调控网络建模中的应用

作 者: 张闻
导 师: 刘丁;季瑞瑞
学 校: 西安理工大学
专 业: 控制理论与控制工程
关键词: 隐马尔可夫模型 概率基因调控网络 k-means聚类算法 状态转移矩阵 酵母细胞基因表达数据
分类号: O211.62
类 型: 硕士论文
年 份: 2010年
下 载: 116次
引 用: 0次
阅 读: 论文下载
 

内容摘要


人类基因组草图的绘制完成,标志着现代生命科学研究已经进入了后基因组时代。生物学关心的焦点已由结构基因组学转向了功能基因组学,对基因彼此之间的相互作用,尤其是基因表达调控网络的构建,受到越来越多的关注。建立基因调控网络模型的目的是为了更形象地从系统水平上研究基因之间的相互作用关系,从而帮助理解生命现象的本质规律。由于实际基因调控网络是一个复杂的随机系统,目前大多数确定型基因调控网络模型存在着结构简单且需预先确定、描述较为粗糙、精确性不高等缺点。然而,随机型模型却具有不依赖于先验知识和参数模型、可采用实例学习的方法获取模型参数、统计学意义上更为可靠、而且通过增加学习的实例可以提高基因网络构建的鲁棒性等优点。因此,概率基因调控网络模型近年来已受到越来越多的关注,本文也主要研究和讨论了概率基因调控网络的特点及其构建方法。已有概率基因调控网络的构建大都建立在聚类的基础上,本文首先对广泛应用于聚类分析中的k-means聚类算法进行了一定改进以提高聚类质量,并基于改进的聚类算法和冗余聚类原理给出一种基因调控网络构建方法;然后本文重点研究讨论了一种基于隐马尔可夫模型的基因调控网络构建方法,文中把聚为一类的不同基因指定为不同状态,并构建出这些基因间的隐马尔可夫模型,从而可依据输出状态转移概率矩阵找出目标基因的可能父代调控基因组,最终获得概率基因调控网络。本文通过对酵母细胞基因表达数据构建基因调控网络的实验,验证了采用该方法所构建的基因调控网络与实验数据匹配程度高,可以较好地描述基因之间的调控关系。

全文目录


摘要  3-4
Abstract  4-8
1 绪论  8-12
  1.1 课题背景  8-9
    1.1.1 生物信息学  8
    1.1.2 基因调控网络研究问题的提出  8-9
  1.2 研究目的及意义  9-10
  1.3 基因调控网络研究现状  10-11
  1.4 本文的主要内容  11-12
2 基因调控网络  12-22
  2.1 引言  12
  2.2 生物学背景  12-14
    2.2.1 生物学基本知识  12-13
    2.2.2 基因表达调控网络定义  13-14
  2.3 基因调控网络研究方法及工具  14-16
    2.3.1 基因调控网络重建  14
    2.3.2 基因调控网络分析  14
    2.3.3 基因调控网络模型的性能评价  14
    2.3.4 生物学工具  14-15
    2.3.5 计算机工具  15-16
  2.4 现有基因调控网络模型  16-21
    2.4.1 有向图和无向图  16-17
    2.4.2 布尔网络模型  17-18
    2.4.3 线性组合模型  18-19
    2.4.4 加权矩阵模型  19-20
    2.4.5 微分方程模型  20-21
    2.4.6 互信息关联矩阵模型  21
  2.5 小结  21-22
3 基于聚类思想构建概率基因调控网络  22-30
  3.1 概述  22-24
    3.1.1 聚类依据和意义  22
    3.1.2 聚类算法有效性评价  22-23
    3.1.3 常用聚类算法  23-24
  3.2 k-means聚类算法及其改进  24-27
    3.2.1 k-means聚类算法  24-25
    3.2.2 k-means聚类算法的改进  25-26
    3.2.3 实验结果及分析  26-27
  3.3 基于冗余k-means聚类原理重构基因调控网络  27-29
    3.3.1 冗余聚类工作过程  27
    3.3.2 构建概率基因调控网络步骤  27
    3.3.3 最优父代调控基因组的选择  27-28
    3.3.4 实验结果及分析  28-29
  3.4 本章小结  29-30
4 基于隐马尔可夫模型构建概率基因调控网络  30-46
  4.1 隐马尔可夫模型  30-31
    4.1.1 概述  30
    4.1.2 HMM的三个基本问题  30-31
  4.2 HMM基本算法  31-35
  4.3 基于HMM构建基因调控网络模型  35-37
    4.3.1 构建基因间的HMM  35-37
    4.3.2 构建概率基因调控网络  37
  4.4 使用模拟数据构建基因调控网络  37-38
    4.4.1 评价方法  37-38
    4.4.2 使用模拟数据进行实验  38
  4.5 使用真实生物数据构建基因调控网络  38-44
    4.5.1 基因表达数据预处理  38-42
    4.5.2 使用真实生物数据进行实验  42
    4.5.3 实验结果与分析  42-44
  4.6 本章小结  44-46
5 总结与展望  46-48
  5.1 总结  46
  5.2 展望  46-48
致谢  48-50
参考文献  50-54
在校期间发表论文情况  54

相似论文

  1. 基于遗传算法和粗糙集的聚类算法研究,TP18
  2. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  3. 基于基元空间的非线性系统控制方法研究,TP13
  4. 数据挖掘在入侵检测系统中的应用研究,TP393.08
  5. 数据挖掘在校园网用户网络行为分析的应用研究,TP393.18
  6. 针对包含异常值数据的优化K-MEANS聚类算法,TP311.13
  7. 太阳能光伏发电系统设计及供电系统优化方法研究,TM615
  8. 智能预测土建工程概算方法的研究及其应用,TU723.3
  9. 基于网格的K-means算法与聚类有效性指标,TP18
  10. 聚类算法在学生成绩分析中的应用研究,TP301.6
  11. 动态频谱共享无线通信系统性能分析及验证,TN925
  12. 离心式风机振动故障诊断方法研究,TH442
  13. 基于遗传算法的K-means聚类算法分析研究,TP18
  14. 基于状态空间模型的仿生算法在电力市场竞价中的应用,F224
  15. 基于功率谱分析的光盘调制编码性能评价与优化,TP333.4
  16. Ad Hoc无线自组织网网络流量的研究,TN929.5
  17. 数据挖掘在沪市公司分类的应用,TP311.13
  18. 基于客户行为分析与企业销售预测的客户管理决策模型与算法研究,F274
  19. 局域支持向量回归及其在时空混沌序列预测中的应用,TN911.7
  20. Web文本聚类技术及聚类结果可视化研究,TP391.1

中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 概率论(几率论、或然率论) > 随机过程 > 马尔可夫过程
© 2012 www.xueweilunwen.com