学位论文 > 优秀研究生学位论文题录展示

绝对频率在核小体辨别和预测中的应用

作 者: 张志乾
导 师: 张玉森
学 校: 山东大学
专 业: 运筹学与控制论
关键词: 核小体定位 二联体绝对频率 序列距离 机器学习
分类号: R593.241
类 型: 硕士论文
年 份: 2012年
下 载: 12次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文主要利用核小体二联体的绝对频率来研究核小体的辨别和预测。在真核细胞的染色质中,核小体是主要的组成单位。核小体定位就是测定核小体序列在基因组全序列上的精确位置。核小体的辨别与定位的研究,对于理解转录因子结合和转录调控机制等许多生物生理过程具有十分重要的作用。最近的研究表明在DNA复制与修复、可变剪接、基因转录调控等基本生命过程中核小体定位也都起着十分重要的作用,而且DNA序列与基因表达调控的进化也也是在核小体的调控下进行的。近年来由于CHIP-CHIP与CHIP-seq等高通量技术的出现和发展,核小体定位的研究出现了新的高潮,并且取得了一定的进展和成果。在现有的核小体辨别和定位的方法基础匕,本文将尝试创造一种新的核小体定位模型。在这里,我们引入了核小体二联体绝对频率,使用它我们把每个核小体进行向量化,使使用数学方法处理核小体数据成为可能。然后我们改进了一种距离判别方法,使之用来进行核小体的辨别和预测,最后通过已有数据集对模型进行检测,验证了新模型的有效及可行性。本文主要有以下几个方而的成果:一、引入了核小体二联体绝对频率的概念:不同于以往文章在考虑核小体对序列的依赖性时,没有使用二联体、三联体等传统统计量,而是使用核小体二联体绝对频率(absolute frequency),从而得到了较简洁的向量。二、寻找一种简洁的计算方式来计算核小体的相似性分析,很大程度上简化了计算的复杂度,使大数据量的核小体计算难度降低。三、综合使用距离和机器学习方法对核小体定位进行预测:通过计算距离和机器学习方法建立核小体定位模型,对酿酒酵母菌染色体中的核小体定位进行验证,得到了十分满意的准确率。四通过对核小体预测结果的分析,总结出了新模型的适用范围及局限。我们使用核苷酸二联体绝对频率得到了一个更精确地结果,但是影响核小体定位的因素有很多,例如DNA序列的依赖性、蛋白质分子的竞争与合作、ATP依赖重塑复合物等多种因素。如果我们能在向量中增加这些因素,比如周期性和曲率,得到的结果可能更好。另外,不同物种间核苷酸二联体绝对频率的依赖程度不同,使得预测结果存在差异,准确性还需要用实验的手段进行验证,新方法的适用范围还要进一步的研究进行明确。

全文目录


摘要  8-10
ABSTRACT  10-12
前言  12-14
第1章 绪论  14-20
  1.1 核小体基本信息  14-16
  1.2 核小体在基因转录中的调节作用  16-18
  1.3 核小体定位的研究现状  18-20
第2章 二联体对核小体定位的影响  20-26
  2.1 导言  20
  2.2 绝对频率(absolute frequency)  20-21
  2.3 核小体中的二联体绝对频率  21-26
第3章 核小体定位模型  26-34
  3.1 导言  26
  3.2 核小体向量化  26
  3.3 核小体数据的处理  26-28
  3.4 定位模型的选择  28-34
第4章 定位模型的检验分析  34-40
  4.1 导言  34
  4.2 数据来源  34
  4.3 模型预测结果  34-36
  4.4 预测结果的分析说明  36-40
第5章 总结与展望  40-42
  5.1 总结  40-41
  5.2 展望  41-42
参考文献  42-46
致谢  46-47
攻读学位期间发表的学术论文  47-48
学位论文评阅及答辩情况表  48

相似论文

  1. 英汉命名实体翻译方法研究,TP391.2
  2. 生物医学缩略语消歧,R-5
  3. 基于数据分布特征的文本分类研究,TP391.1
  4. 人类抗原肽载体结合力预测,R392.1
  5. 李群深层结构学习算法研究,TP181
  6. 机器学习算法在视频指纹识别中的应用研究,TP391.41
  7. 蛋白质关系抽取中平面特征和结构化信息的研究,TP181
  8. 基于李群机器学习算法的智能布线,TN710
  9. 学习表达式的映射机制研究,TP181
  10. 军事港口目标分类平台的设计与实现,TP751
  11. 基于多视角的分类器设计与权值优化方法研究,TP18
  12. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  13. 基于区域高斯特征的人体检测算法,TP391.41
  14. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  15. Android恶意软件静态检测方案的研究,TP309
  16. 基于马尔可夫链蒙特卡罗方法的RBM学习算法改进,O211.62
  17. 基于配体结构的药物靶标预测及细胞色素P450酶代谢底物数据库CYP-Meta的构建,R91
  18. 监督主题模型的研究与应用,TP391.1
  19. 基于失真效应的图像质量评价与分类,TP391.41
  20. 基于学习的逆向运动学人体运动合成,TP391.41
  21. 基于内容的网页恶意代码检测的研究与实现,TP393.092

中图分类: > 医药、卫生 > 内科学 > 全身性疾病 > 免疫性疾病 > 自身免疫性疾病、结缔组织疾病 > 红斑狼疮 > 系统型红斑狼疮
© 2012 www.xueweilunwen.com