学位论文 > 优秀研究生学位论文题录展示
快速连锁分析算法研究
作 者: 熊洁仪
导 师: 袁哲明
学 校: 湖南农业大学
专 业: 农业昆虫与害虫防治
关键词: 连锁分析 算法 家系
分类号: Q343
类 型: 硕士论文
年 份: 2009年
下 载: 19次
引 用: 0次
阅 读: 论文下载
内容摘要
连锁分析是一种重要的单体型推断和基因定位方法。其原理是利用在染色体上遗传图谱位置已知的标记组来推断一个大家系中所有分离基因的连锁情况,也就是单体型推断;然后根据在家系中个体的表现型情况和已得的单体型估计易感基因的位置。随着分子生物学的发展,标记信息变得丰富和易于获得,连锁分析在上个世纪后期得到了快速的发展,包括适用于小家系的Lander-Green多位点算法的出现和之后的各种改进算法。然而由于随着家系中非奠基者数目的增长,计算复杂度将随之指数增长,这使得目前的程序在计算大家系和过多的标记时仍然困难重重。该问题是制约高分辨率的多位点连锁分析发展的瓶颈。本研究提出了基于以配子传递图为数据结构的连锁分析算法。新数据结构的采用使得计算复杂度随家系中非奠基者数目的增长而呈指数增长的问题得以解决。配子传递图通过使用特殊的贝叶斯网络表示家系中各种可能的遗传模式及其概率分布,相比遗传向量表示法节省大量的存储空间和计算时间。同时提出配子传递图之间马尔科夫链传递机制以实现多位点连锁分析。算法最终以成对受累个体的平均共享IBD为判断连锁信号的得分标准,并通过蒙特卡洛模型估计无效假设下IBD分值的分布,以评估连锁信号的显著性。本算法由Matlab编程实现。程序被应用于5个不同家系大小、不同标记数目以及不同易感基因位点的模拟数据,其结果与主流连锁分析程序Merlin相比较。结果显示,本程序与Merlin计算结果吻合,并且能在短时间内解决Merlin所不能解决的大家系和多标记连锁数据。本算法在计算时间和内存空间占用上有着预期中的无可替代的优势。此外,结果也显示大家系样本将带来高分辨率的基因定位。本算法有望突破连锁分析发展的瓶颈,尤其在易于获得大家系和SNP标记的模式生物基因定位方面发展前景广泛。
|
全文目录
摘要 4-5 Abstract 5-9 第一章 绪论 9-24 1.1 早期的连锁分析 10-12 1.2 人类遗传连锁分析的发展 12-14 1.3 多位点的家系连锁分析 14-17 1.4 似然度和分值的计算 17-19 1.5 Lander-Green算法介绍 19-20 1.5.1 遗传向量的构建 19-20 1.5.2 多位点的信息整合 20 1.6 非参数连锁分析与IBD分值 20-24 第二章 快速连锁分析算法设计 24-40 2.1 生成配子传递图 26-31 2.1.1 缺失数据的补全 27 2.1.2 生成配子传递图的初步框架 27-28 2.1.3 配子传递图的赋权过程 28-31 2.2 配子传递图的马尔科夫过程 31-36 2.2.1 遗传模式分布信息的传递 31-33 2.2.2 配子传递图的修整 33-35 2.2.3 左右概率的整合 35-36 2.3 IBD得分计算 36-38 2.4 显著性分析 38-40 第三章 结果 40-51 3.1 算法的程序实现 40-41 3.2 模拟数据的结果 41-51 3.2.1 模拟数据1 41-42 3.2.2 模拟数据2 42-45 3.2.3 模拟数据3 45-46 3.2.4 模拟数据4 46-49 3.2.5 模拟数据5 49-51 第四章 结论与讨论 51-53 参考文献 53-59 致谢 59-60 个人介绍 60
|
相似论文
- 基于差分进化算法的JSP环境下成套订单研究,F273
- 基于图的标志SNP位点选择算法研究,Q78
- 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 基于Thermo-Calc三元共晶合金凝固路径的耦合计算,TG111.4
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
- 基于感性负载的车身网络控制系统,U463.6
- 基于蚁群算法的电梯群优化控制研究,TU857
- 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
- 半导体激光器热电控制技术研究,TN248.4
- AES算法及其DSP实现,TN918.1
- 基于UWB脉冲信号的测距定位技术,TN929.5
- 基于TS101的DFT输出子集算法研究及软件实现,TN911.72
- 高光谱图像空—谱协同超分辨处理研究,TN911.73
- DBF接收机用于二维测向算法的研究,TN851
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- IEEE802.16e信道编译码算法研究,TN911.22
- LDPC码译码算法的研究,TN911.22
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
中图分类: > 生物科学 > 遗传学 > 遗传学分支学科 > 细胞遗传学
© 2012 www.xueweilunwen.com
|