学位论文 > 优秀研究生学位论文题录展示

基于R语言的差异表达基因检测研究

作 者: 纪相禹
导 师: 时小虎
学 校: 吉林大学
专 业: 软件工程
关键词: 生物信息学 R语言 基因表达谱 Bioconductor软件 差异基因表达检测
分类号: Q78
类 型: 硕士论文
年 份: 2011年
下 载: 408次
引 用: 0次
阅 读: 论文下载
 

内容摘要


21世纪,在这个信息社会,同时也是生命科学的时代,生物信息学已经成为一门新兴的学科。生物信息学作为多学科交叉的产物,包括生物学、计算机科学、数学、物理学以及信息科学等很多领域,通过互联网为媒介,以数据库为载体,数学理论知识来建立各种计算机模型,对实验生物学中产生的海量生物学数据进行处理、存储、检索以及分析和解释其生物学含义。本文主要探讨学习使用生物信息学的工具R语言以及Bioconductor生物信息学软件集,解决生物信息学的问题,通过T统计方法探讨了R语言在生物信息学差异表达基因检测中的应用。R语言是通过图形显示和统计计算为基础的开放式的软件平台,是一种通用的计算机语言。R语言在生物信息学中开发出了面向特定应用的软件,Bioconductor就是R语言开发的生物信息学中面向基因组信息分析的应用软件集合。R语言作为进行绘图、统计分析的语言,因为其开源性、可移植性、灵活性,而在统计、生物等学科领域有着广泛的应用。在生物学领域中,尤其是面向结构和功能基因组时代的数据信息分析来讲,其中非常典型的就是Bioconductor的应用软件项目。本文针对R语言以及Bioconductor生物信息学软件集在生物信息学中的应用,主要展开如下研究:1)、深入理解生物信息学的定义、特点及其意义,主要研究内容,分析基因芯片基因表达谱数据的处理方法,生物信息学数据库的应用。2)、总结了R语言的特点及其R语言的基本原理与核心。R语言作为构建生物信息学平台的重要软件,因其本身开源、易学等特点在处理复杂的大规模生物数据中发挥了重要的作用。3)、Bioconductor生物信息学软件集是建立在R语言环境上的面向生物信息管理和分析科学计算的开放式软件平台,包括有基因组数据分析和生物芯片数据等大量实用软件包。利用Bioconductor软件开放资源可以很好作为学习资料,并能分析各种样本数据。4)、总结了差异表达基因检测的预处理方法,并针对进行差异表达基因检测的T统计差异表达基因检测方法做了改进研究。5)、引入了ROC曲线对T统计差异表达基因检测方法和改进的增加参数的T统计差异表达基因检测方法和半T统计差异表达基因检测方法进行性能评价。综上所述,本文针对R语言在生物信息学中的应用进行研究,对生物信息学的内容,和学习R语言方面的知识做了总结、分析。针对差异表达基因检测,对已有的T统计方法做了改进,提出了新的差异表达基因检测方法,并对改进的几种方法和以往的方法进行性能评价。

全文目录


摘要  4-6
Abstract  6-10
第1章 绪论  10-13
  1.1 生物信息学  10
  1.2 基因芯片数据  10-11
  1.3 R语言简介  11
  1.4 本文工作  11-13
第2章 基因表达谱数据研究  13-20
  2.1 生物信息学的定义及意义  13
  2.2 生物信息学的主要研究内容  13-15
  2.3 基因表达数据的处理  15-18
    2.3.1 基因芯片与DNA微阵列  16
    2.3.2 基因表达谱  16-17
    2.3.3 微阵列技术的应用和研究方向  17-18
  2.4 生物信息学数据库  18-19
  2.5 讨论  19-20
第3章 R语言与Bioconductor生物信息学软件集  20-28
  3.1 R语言  20-21
  3.2 R语言的基本原理与核心  21
  3.3 Bioconductor生物信息学软件集  21-24
    3.3.1 Bioconductor的开发背景  22-23
    3.3.2 Bioconductor的各种包  23
    3.3.3 Bioconductor的安装  23-24
  3.4 Bioconductor的应用  24-26
    3.4.1 Bioconductor实验数据的读取  24
    3.4.2 Bioconductor的数据的可视化分析  24-25
    3.4.3 Bioconductor的数据处理和基因表达数据的计算  25
    3.4.4 Bioconductor对基因表达数据的分析  25-26
    3.4.5 Bioconductor的差异表达基因的注释  26
  3.5 小结  26-28
第4章 R语言在差异表达基因检测中的应用  28-45
  4.1 引言  28
  4.2 差异表达基因检测的预处理和分析  28-31
    4.2.1 基因芯片缺失值的填充  29-30
    4.2.2 对基因芯片重复测定值的处理  30-31
    4.2.3 基因芯片数据归一化处理  31
    4.2.4 差异基因表达检测方法  31
  4.3 基于R语言的差异表达基因检测  31-44
    4.3.1 差异基因表达检测方法  31-32
    4.3.2 基于T统计的差异基因表达检测方法  32-36
    4.3.3 仿真模拟和分析  36-44
  4.4 小结  44-45
第5章 总结和展望  45-46
  5.1 总结  45
  5.2 展望  45-46
参考文献  46-49
致谢  49

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 文学语言的模糊修辞研究,H05
  3. BioLab面向生物计算服务的网格系统,TP399-C8
  4. 飞行模拟中飞行管理计算机系统CDU组件设计与仿真,TP391.9
  5. 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
  6. 基于RNA测序技术的马氏珠母贝珍珠囊转录组及数字基因表达谱分析,Q786
  7. 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
  8. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  9. 大鼠肝再生与肝肿瘤发生的基因转录谱相关性及其意义研究,R735.7
  10. 俄罗斯留学生疑问代词非疑问用法的习得研究,H195
  11. 中日民俗中禁忌文化的对比研究,K893.13
  12. 从比喻手法看中国和英美国家的文化差异,G04
  13. 手机短信对苗族青少年汉语言社会化的影响研究,C912.1
  14. 一个医院信息系统的设计与实现,TP311.52
  15. 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
  16. 布依语—英语语音对比研究,H319
  17. XML重复对象检测系统的设计与实现,TP311.11
  18. 中文XML压缩技术研究,TP311.11
  19. 一个工程物资管理系统的设计与实现,TP311.52
  20. UEFI系统脚本语言与解释器的研究与实现,TP311.52
  21. 云存储中大规模加密小文档存储管理研究与实现,TP333

中图分类: > 生物科学 > 分子生物学 > 基因工程(遗传工程)
© 2012 www.xueweilunwen.com