学位论文 > 优秀研究生学位论文题录展示
新一代基因测序的数据处理中的相关问题
作 者: 张骏
导 师: 苑波
学 校: 上海交通大学
专 业: 计算机软件与理论
关键词: 下一代基因测序 图像处理 图像配准 碱基识别 图像分析 信号处理
分类号: TP391.41
类 型: 硕士论文
年 份: 2011年
下 载: 62次
引 用: 0次
阅 读: 论文下载
内容摘要
随着下一代基因测序技术(NGS, Next Generation Sequencing)的发展,实验设备和流程日趋成熟,越来越多的公司推出了自己的测序平台,基因测序已经逐渐脱离了专业的基因实验室,让更多的研究组和研究人员都开始进入该领域。与之而来的,NGS数据处理面临着越来越高的要求和挑战,研究人员已经不能满足于使用基因测序机器厂商所提供的基本的数据处理程序,转而使用更开放的、灵活的第三方处理软件。在本文中,我们重新审视了NGS基因数据处理的过程,从原始的图像数据处理到碱基识别,完成了一整套NGS基因测序数据的处理算法。其中,在现有的一些NGS数据处理工具中,图像处理部分一般采用的水平集分割法或简单的使用拉普拉斯算子进行处理。在我们仔细分析了这些结果之后,发现他们其实并不能精确的完成基因簇定位以及识别的任务,为此,我们重新设计了处理算法(NRDPT, NGS Raw Data Processing Tool)。不同于已有的几种处理方法的是,该方法使用了基于边缘和霍夫变换的基因簇定位算法,有效提高了定位准确度。并且,在基因簇定位准确的基础上,我们设计了一个两步的配准策略,极大的提高了效率(~9倍提高于传统算法)。在本文中我们会详细讨论这部分的算法。在碱基识别部分,目前已经有的一些研究均基于Illumina测序平台的测序数据,这些研究主要用来试图修正使用该仪器所经常会出现的相位错乱问题,这些问题一般是来源于所采用的生化反应的缺陷。而在新的一些测序方法中(如SoLiD、HYK等),因为更新了测序流程,这些问题并不存在。在本文中,我们讨论了在不同的测序方法中会出现的问题及其对于碱基识别过程的影响,在仔细考虑了几种不同的碱基识别策略后,我们完成了基于连接反应测序过程的碱基识别方法,并得到了不错的结果。基因测序技术的发展很快,我们的研究过程基于我国完全自主知识产权的华因康公司的P-STARII型基因测序仪展开,在整个的研究过程中,机器和测序流程也在不断升级,这些不确定性常常增加了我们研究的难度,但这也正说明本领域正在飞速的发展。在这里,我们期待NGS测序技术的真正成熟,并最终走入临床领域。
|
全文目录
摘要 3-5 ABSTRACT 5-9 第一章 绪论 9-20 1.1 新一代基因测序技术及其前景 9-11 1.2 研究的目的和意义 11-12 1.3 研究基础 12-17 1.3.1 新一代基因测序方法原理介绍 12-13 1.3.2 Otsu 二值化方法 13-14 1.3.3 互信息 14 1.3.4 霍夫变换 14-15 1.3.5 二值图像的形态学 15-17 1.4 主要研究内容 17-18 1.5 创新点 18-19 1.6 论文章节安排 19 1.7 本章小结 19-20 第二章 基因测序图像处理 20-55 2.1 图像采集 20-27 2.1.1 图像采集过程 20-24 2.1.2 实验过程导致的误差及举例 24-27 2.2 处理算法整体介绍 27-28 2.3 基因簇定位 28-38 2.3.1 明场图中的基因簇定位 32-33 2.3.2 荧光图中的基因簇定位 33-38 2.4 图像配准 38-43 2.4.1 搜索空间 38-40 2.4.2 相似度检测技术 40-41 2.4.3 二次配准技术 41-43 2.5 基因簇定位信息增强 43-44 2.6 亮度值提取和背景去除 44-53 2.6.1 图像亮度归一化 44-50 2.6.2 基因簇亮度提取 50-51 2.6.3 背景去除 51-53 2.7 本章小结 53-55 第三章 碱基识别 55-61 3.1 问题描述 55 3.2 核心算法 55-59 3.2.1 中心确定 56-57 3.2.2 距离定义 57-59 3.3 质量评估 59-60 3.4 本章小结 60-61 第四章 实验结果及结论 61-66 4.1 基因簇定位准确度实验 61 4.2 图像配准实验 61-62 4.3 碱基识别 62-64 4.4 讨论及展望 64-66 参考文献 66-70 致谢 70-72 攻读学位期间发表的学术论文 72-75 附件 75-76
|
相似论文
- 熔化极气体保护焊熔滴过渡图像分析系统,TG444
- 基于CCD图像传感器的温度测量技术研究,TH811
- 毫米波雷达中频模拟信号源数据产生部分的研究,TN955
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 图像拼接技术研究,TP391.41
- 雾天或背光条件下图像清晰化算法研究及硬件实现,TP391.41
- 基于嵌入式图像处理单元的运动目标跟踪系统研究,TP391.41
- 机械臂视觉伺服系统的研究,TP242.6
- 数字图像处理在集装箱检测中的应用研究,TP274.4
- 半成型结构在休闲女装中的应用,TS941.2
- 电子产品质量监控测试设备设计,TN06
- 无线信号多速率接收处理器的设计,TN851
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 基于机器视觉的光纤几何参数检测研究,TN253
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 车牌识别系统中车牌定位算法的研究,TP391.41
- 基于FPGA高清视频车辆检测系统的设计与实现,TP391.41
- 基于神经树的人脸识别方法研究,TP391.41
- 基于声学特性的裂纹缺陷检测方法研究,TP274
- 数字型仪表自动识读系统研究,TP391.41
- 智能清分机的管理和应用软件设计,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 图像识别及其装置
© 2012 www.xueweilunwen.com
|