学位论文 > 优秀研究生学位论文题录展示

绵羊全基因组CNV与部分性状的关联分析

作 者: 刘佳森
导 师: 杜立新
学 校: 中国农业科学院
专 业: 动物遗传育种与繁殖
关键词: 绵羊 拷贝数变异 单核苷酸多态 基因组 全基因组关联研究 复杂性状
分类号: S826
类 型: 博士论文
年 份: 2012年
下 载: 149次
引 用: 0次
阅 读: 论文下载
 

内容摘要


拷贝数变异(copy number variation,CNV)是指DNA片段大小介于1kb到数兆范围内的缺失,插入、重复和复杂多位点的变异。研究表明,CNV广泛存在于包括人类在内的动植物基因组。由于CNV所涉及基因组中覆盖的核苷酸总数超过了SNP的总数,可通过基因剂量和基因调控区域的改变影响基因的表达、表型变异以及进化适应性,是遗传变异和表型差异的重要来源,在复杂性状的发生发展中起着重要的作用。绵羊的生长发育性状受到基因和环境共同作用的影响,寻找DNA分子差异及其对应的基因是绵羊遗传育种的关注点之一,其中CNV对表型构成及疾病发生的调控作用已成为研究的热点。CNV与GWAS(genome wide association study)的结合为揭示复杂性状的遗传基础提供了重要的途径。为此,本研究利用illumina的高密度Ovine SNP50K BesdChip芯片对绵羊基因组进行分型,通过PennCNV软件检测拷贝数变异在绵羊基因组的分布特征,并首次构建了基于SNP分型数据的绵羊全基因组CNV图谱。研究结果显示,经过严格的质量控制,共检测出238个CNVRs,包括219个缺失事件(Loss),13个获得事件(Gain),6个既有缺失又有获得事件(Both),平均大小和中位数大小分别253.57kb和186.92kb,大小范围13.66kb~1.30Mb。经另一个CNV检测软件—CNVpartition进行相互验证,一共检测出52个CNVR,其中47个CNVR与PennCNV软件推断结果一致。这些CNVR在染色体上呈现非随机分布特点,每条常染色体均检测出CNVR的存在,其中富集CNVR最多的染色体为1、2和5。群体频率大于3%的CNVR有75个,这些CNVR与邻近SNP标记进行连锁不平衡分析表明,仅有两个CNVR被邻近SNP所标签,提示在illumina分型平台上,绝大多数CNVR未被邻近SNP所标签。对检测的CNVR进行基因含量注释和功能富集(GO)分析表明,发现多数基因富集于嗅觉、感官知觉、化学刺激、识别、神经系统的传递进程等环境应答相关的基因,另有一些基因与信号转导、信号通路、细胞分化与凋亡及GTP酶的活性等有关。为了判断CNV检测的准确性,选择10个CNVR进行定量PCR的验证,其中5个CNVR区域验证成功。本研究发现的CNV对了解绵羊基因组结构特征,填补绵羊基因组CNV精细图谱,加快绵羊育种的遗传进展以及CNV作为关联研究中潜在的遗传标记揭示表型变异提供重要的基础。为更好的揭示CNV在绵羊生长发育中的作用,本研究在绵羊全基因组CNV分析的基础上,对检测出的CNVR进行了重新定义,共得到402个新的CNVR,其中143个CNVR(群体频率>3%)定义为CNP(copy number polymorhism),对绵羊初生重、125天校正日龄重(断奶重)、190天校正日龄重(六月龄重)、断奶前日增重、断奶后日增重、平均日增重、体高、胸围和管围等11个性状表型进行了全基因组CNP的关联分析。采用混合线性模型对上述11个性状表型的CNP关联结果显示,共32个CNP区域与各表型性状显著关联(P<0.05),其中5个CNP与初生重显著相关,2个CNP与125天校正日龄重显著相关,9个CNP与190天校正日龄重显著相关,6个CNP与背膘厚度显著相关,3个CNP与眼肌面积显著相关,3个CNP与断奶前日增重显著相关,8个CNP与断奶后日增重显著相关,10个CNP与平均日增重显著相关,10个CNP区域与体高显著相关,5个CNP与胸围显著相关,5个CNP与管围显著相关。这些显著关联区域,经过FDR(false discovery rate)多重检验校正,除断奶后日增重关联的CNP-393在基因组水平显著外(p<0.05),其余CNP均不显著。另外,多数CNP区域影响多个性状,同时一些性状也受到多个CNP区域的影响,说明上述性状表型受到多微效基因的影响,并且各性状之间存在一定的遗传相关。研究结果还发现绵羊21号染色体上位于52788004~52907062区间的CNP-210对125天校正日龄重、190天校正日龄重、断奶前日增重、平均日增重以及体高性状显著关联。尤其是位于此区域上的NADSYN1和MRGPRG基因可能在绵羊生长发育过程中起着重要的作用。研究结果同时发现,基因组水平显著的CNP-393区域(绵羊9号染色体:76545109~76642439)的上游4.5Mb处的TRHR基因可能通过骨骼肌的发育调控作用,进而影响羔羊生长发育性状。本研究表明,CNP210和CNP-393可能是影响羔羊生长发育的两个遗传变异区域,可作为候选区域进一步进行功能验证和分析。综上,通过我们对绵羊全基因组CNV的分析,为了解绵羊复杂性状表型变异的遗传基础提供了新的思路,有助于对绵羊基因组的特征更加全面的了解,为进一步揭示绵羊生长发育遗传变异提供了重要的信息

全文目录


摘要  6-8
Abstract  8-13
英文缩略表  13-14
第一章 绪论  14-33
  1.1 拷贝数变异研究进展  14-25
    1.1.1 CNV 的生物学功能  15-16
    1.1.2 CNV 的检测方法  16-19
    1.1.3 CNVs 在人类复杂疾病/性状中的研究  19
    1.1.4 拷贝数变异在畜禽研究中的进展  19-25
  1.2 复杂性状的遗传学研究方法和策略  25-31
    1.2.1 连锁分析  25-26
    1.2.2 候选基因关联研究  26
    1.2.3 全基因组关联研究  26-31
  1.3 本研究的目的和意义  31-33
第二章 绵羊全基因组拷贝数变异分析  33-66
  2.1 试验材料和方法  33-36
    2.1.1 研究样本  33
    2.1.2 主要仪器设备  33-34
    2.1.3 试剂和溶液配制  34-35
    2.1.4 绵羊基因组 DNA 的提取与质量控制  35-36
  2.2 基因分型及质量控制  36-40
    2.2.1 芯片扫描  36-39
    2.2.2 实验控制  39
    2.2.3 分型数据  39
    2.2.4 数据质量控制  39-40
  2.3 CNV 的检测  40-46
    2.3.1 CNV 的检测原理与软件  40-41
    2.3.2 CNV 检测文件的准备  41-42
    2.3.3 CNV 的质量控制  42
    2.3.4 CNV 区域(CNV Region, CNVR )  42
    2.3.5 拷贝数多态(CNP)与邻近 SNPs 的连锁不平衡(LD)分析  42-43
    2.3.6 基因注释与功能富集分析  43
    2.3.7 CNV 的 q-PCR 验证  43-46
  2.4 结果与分析  46-59
    2.4.1 基因组 DNA 检测结果  46
    2.4.2 SNP 分型及质量控制结果  46
    2.4.3 样本个体 CNV 的推断  46-47
    2.4.4 基因组 CNVR 的分布特征  47-51
    2.4.5 CNV 图谱的构建  51-53
    2.4.6 CNVR 的功能富集分析  53
    2.4.7 CNP 与邻近 SNP 的连锁不平衡  53-56
    2.4.8 定量 PCR 验证  56-59
  2.5 讨论  59-66
    2.5.1 CNV 检测环境的优化  60
    2.5.2 CNV 的全基因组检测  60-62
    2.5.3 其他 CNV 研究的比较  62
    2.5.4 CNP 与邻近 SNP 的连锁不平衡  62-63
    2.5.5 基因含量与功能分析  63-64
    2.5.6 定量 PCR 的验证  64
    2.5.7 小结  64-66
第三章 绵羊部分性状的全基因组 CNV 关联研究  66-94
  3.1 材料与方法  66-72
    3.1.1 动物群体的构建  66
    3.1.2 主要仪器设备  66-67
    3.1.3 分析软件及在线网站数据库  67-68
    3.1.4 血样采集  68
    3.1.5 基因组 DNA 提取及质量控制  68-69
    3.1.6 性状表型的测定  69
    3.1.7 SNP 分型数据  69-70
    3.1.8 CNV 的分型  70
    3.1.9 数据处理  70-71
    3.1.10 关联研究的统计学分析  71-72
  3.2 结果与分析  72-89
    3.2.1 基因组 DNA 的质量控制  72
    3.2.2 SNPs 分型数据的质控  72-73
    3.2.3 表型的描述性统计分析  73
    3.2.4 群体分层分析  73-75
    3.2.5 CNV 的关联研究结果  75-86
    3.2.6 显著性关联区域的注释及功能分析  86-89
  3.3 讨论  89-94
    3.3.1 基于 CNP 关联研究的统计学策略  89-90
    3.3.2 全基因组关联研究结果  90-93
    3.3.3 小结  93-94
第四章 全文结论  94-96
  4.1 结论  94
  4.2 展望  94-96
参考文献  96-107
致谢  107-108
作者简介  108-109
附录  109-122

相似论文

  1. 基于基因组重排技术的1,3-丙二醇高产菌株选育,TQ923
  2. 南京地区西花蓟马Frankliniella occidentalis (Pergande)的发生调查及其线粒体基因组研究,S433
  3. 甘蓝型油菜多体附加系“Nj08-063”的农艺性状、细胞学与分子学鉴定研究,S565.4
  4. 鸡传染性支气管炎病毒河南地方株分离鉴定及HN104株与HN091株全基因组序列测定,S852.65
  5. 河南低致病性禽流感病毒(H9亚型)分离鉴定及生物学特性研究,S852.65
  6. 鸡Δ~6脂肪酸脱氢酶基因启动子区域多态性及基因时空表达的研究,S831
  7. 一个芥菜型油菜品种资源的线粒体基因组序列分析,S565.4
  8. 簇毛麦6V染色体短臂小片段易位系的分子细胞遗传学鉴定,S512.1
  9. 基于连锁图的QTL综合分析方法研究,S562
  10. 家畜布鲁氏菌病流行病学调查及布鲁氏菌单核苷酸多态性分子分型研究,S855.12
  11. 人参SSR及AFLP标记的开发,S567.51
  12. 心脏离子通道SCN5A基因和minK基因多态性与房颤的关联性研究,R541.75
  13. 急性白血病儿童还原型叶酸载体基因多态性研究,R733.71
  14. 丝毛飞廉种子中总黄酮的提取及对肝损伤保护作用的研究,R284
  15. 双相磷酸钙/半水硫酸钙/丝素蛋白/rhBMP-2骨水泥强化绵羊骨缺损椎体的体内实验研究,R-332
  16. TGFB1和TGFBR2基因多态性与乳腺癌易感性关系研究,R737.9
  17. 蚜虫代表物种的线粒体基因组研究,Q953
  18. 烟草疫霉菌效应物基因比较基因组学分析,S432.1
  19. ISS患儿NPR3、COL11A2基因单核苷酸多态性的研究,R723
  20. 黄瓜花叶病毒卫星RNA-sat405的生物学活性,S432.41
  21. 自动进样—空间温度梯度CE检测单核苷酸多态性的研究,R440

中图分类: > 农业科学 > 畜牧、动物医学、狩猎、蚕、蜂 > 家畜 >
© 2012 www.xueweilunwen.com