学位论文 > 优秀研究生学位论文题录展示
基于R语言的差异表达基因检测研究
作 者: 纪相禹
导 师: 时小虎
学 校: 吉林大学
专 业: 软件工程
关键词: 生物信息学 R语言 基因表达谱 Bioconductor软件 差异基因表达检测
分类号: Q78
类 型: 硕士论文
年 份: 2011年
下 载: 408次
引 用: 0次
阅 读: 论文下载
内容摘要
21世纪,在这个信息社会,同时也是生命科学的时代,生物信息学已经成为一门新兴的学科。生物信息学作为多学科交叉的产物,包括生物学、计算机科学、数学、物理学以及信息科学等很多领域,通过互联网为媒介,以数据库为载体,数学理论知识来建立各种计算机模型,对实验生物学中产生的海量生物学数据进行处理、存储、检索以及分析和解释其生物学含义。本文主要探讨学习使用生物信息学的工具R语言以及Bioconductor生物信息学软件集,解决生物信息学的问题,通过T统计方法探讨了R语言在生物信息学差异表达基因检测中的应用。R语言是通过图形显示和统计计算为基础的开放式的软件平台,是一种通用的计算机语言。R语言在生物信息学中开发出了面向特定应用的软件,Bioconductor就是R语言开发的生物信息学中面向基因组信息分析的应用软件集合。R语言作为进行绘图、统计分析的语言,因为其开源性、可移植性、灵活性,而在统计、生物等学科领域有着广泛的应用。在生物学领域中,尤其是面向结构和功能基因组时代的数据信息分析来讲,其中非常典型的就是Bioconductor的应用软件项目。本文针对R语言以及Bioconductor生物信息学软件集在生物信息学中的应用,主要展开如下研究:1)、深入理解生物信息学的定义、特点及其意义,主要研究内容,分析基因芯片基因表达谱数据的处理方法,生物信息学数据库的应用。2)、总结了R语言的特点及其R语言的基本原理与核心。R语言作为构建生物信息学平台的重要软件,因其本身开源、易学等特点在处理复杂的大规模生物数据中发挥了重要的作用。3)、Bioconductor生物信息学软件集是建立在R语言环境上的面向生物信息管理和分析科学计算的开放式软件平台,包括有基因组数据分析和生物芯片数据等大量实用软件包。利用Bioconductor软件开放资源可以很好作为学习资料,并能分析各种样本数据。4)、总结了差异表达基因检测的预处理方法,并针对进行差异表达基因检测的T统计差异表达基因检测方法做了改进研究。5)、引入了ROC曲线对T统计差异表达基因检测方法和改进的增加参数的T统计差异表达基因检测方法和半T统计差异表达基因检测方法进行性能评价。综上所述,本文针对R语言在生物信息学中的应用进行研究,对生物信息学的内容,和学习R语言方面的知识做了总结、分析。针对差异表达基因检测,对已有的T统计方法做了改进,提出了新的差异表达基因检测方法,并对改进的几种方法和以往的方法进行性能评价。
|
全文目录
摘要 4-6 Abstract 6-10 第1章 绪论 10-13 1.1 生物信息学 10 1.2 基因芯片数据 10-11 1.3 R语言简介 11 1.4 本文工作 11-13 第2章 基因表达谱数据研究 13-20 2.1 生物信息学的定义及意义 13 2.2 生物信息学的主要研究内容 13-15 2.3 基因表达数据的处理 15-18 2.3.1 基因芯片与DNA微阵列 16 2.3.2 基因表达谱 16-17 2.3.3 微阵列技术的应用和研究方向 17-18 2.4 生物信息学数据库 18-19 2.5 讨论 19-20 第3章 R语言与Bioconductor生物信息学软件集 20-28 3.1 R语言 20-21 3.2 R语言的基本原理与核心 21 3.3 Bioconductor生物信息学软件集 21-24 3.3.1 Bioconductor的开发背景 22-23 3.3.2 Bioconductor的各种包 23 3.3.3 Bioconductor的安装 23-24 3.4 Bioconductor的应用 24-26 3.4.1 Bioconductor实验数据的读取 24 3.4.2 Bioconductor的数据的可视化分析 24-25 3.4.3 Bioconductor的数据处理和基因表达数据的计算 25 3.4.4 Bioconductor对基因表达数据的分析 25-26 3.4.5 Bioconductor的差异表达基因的注释 26 3.5 小结 26-28 第4章 R语言在差异表达基因检测中的应用 28-45 4.1 引言 28 4.2 差异表达基因检测的预处理和分析 28-31 4.2.1 基因芯片缺失值的填充 29-30 4.2.2 对基因芯片重复测定值的处理 30-31 4.2.3 基因芯片数据归一化处理 31 4.2.4 差异基因表达检测方法 31 4.3 基于R语言的差异表达基因检测 31-44 4.3.1 差异基因表达检测方法 31-32 4.3.2 基于T统计的差异基因表达检测方法 32-36 4.3.3 仿真模拟和分析 36-44 4.4 小结 44-45 第5章 总结和展望 45-46 5.1 总结 45 5.2 展望 45-46 参考文献 46-49 致谢 49
|
相似论文
- 基因调控网络模型描述语言研究,Q78
- 文学语言的模糊修辞研究,H05
- BioLab面向生物计算服务的网格系统,TP399-C8
- 飞行模拟中飞行管理计算机系统CDU组件设计与仿真,TP391.9
- 南极冰藻GPx、GST和SAHH基因的克隆、定量分析及原核表达载体的构建,Q943.2
- 基于RNA测序技术的马氏珠母贝珍珠囊转录组及数字基因表达谱分析,Q786
- 高温蛋白酶Pgsey及解旋酶Htc16特征的初步研究,Q814
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大鼠肝再生与肝肿瘤发生的基因转录谱相关性及其意义研究,R735.7
- 俄罗斯留学生疑问代词非疑问用法的习得研究,H195
- 中日民俗中禁忌文化的对比研究,K893.13
- 从比喻手法看中国和英美国家的文化差异,G04
- 手机短信对苗族青少年汉语言社会化的影响研究,C912.1
- 一个医院信息系统的设计与实现,TP311.52
- 水稻Rho家族OsRacD及其5种潜在互作蛋白的生物信息学分析,S511
- 布依语—英语语音对比研究,H319
- XML重复对象检测系统的设计与实现,TP311.11
- 中文XML压缩技术研究,TP311.11
- 一个工程物资管理系统的设计与实现,TP311.52
- UEFI系统脚本语言与解释器的研究与实现,TP311.52
- 云存储中大规模加密小文档存储管理研究与实现,TP333
中图分类: > 生物科学 > 分子生物学 > 基因工程(遗传工程)
© 2012 www.xueweilunwen.com
|