学位论文 > 优秀研究生学位论文题录展示

基于信息熵理论的基因组特性研究

作 者: 詹青
导 师: 王亚东
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: DNA 信息熵 起始密码子 进化树
分类号: O236
类 型: 硕士论文
年 份: 2011年
下 载: 81次
引 用: 0次
阅 读: 论文下载
 

内容摘要


从处理遗传信息的角度来看,细胞本身构成了一个信息处理独立基本单元,从DNA的复制、转录到RNA翻译为蛋白质,对生物的遗传信息进行存储、传递。按传统的遗传学观点,所有的遗传信息都存储在生物的遗传物质之中,这个信息处理系统控制着生物的发育、生长和遗传。要揭示生命内部的具体工作机制,使用信息科学中的方法来研究遗传信息的存储、传递和表达是必不可少的。信息论是研究信息的度量、传递、交换和存储的一门科学。由于遗传信息作为一种信息,其存储与传递也必然遵循信息存储与传递的一般规律,因而可以采用信息论方法对遗传信息进行分析。本文首先针对基因组翻译起始和终止区域的碱基分布,如保守性、周期性等问题,提出了一种基于信息熵方法的模型进行分析。对DNA序列上起始密码子、终止密码子附近区域的碱基分布情况进行了统计,使用该模型的方法计算了该区域每个位点的信息熵,进而计算出信息剩余度,绘制出信息剩余度曲线。分析了各位点的保守性,对编码区域和非编码区域中的不同进行了分析比较。对编码起始、终止位点附近区域的信息熵分析的结果显示:在原核生物中,其编码区域的信息剩余度呈现非常强的周期为三的性质;亲缘较近的序列,其信息剩余度曲线相互聚集;在原核生物生物特有的SD区域,信息剩余度相对较大。而对真核生物的分析结果则相对较差,需要进一步的研究。同时,针对基因组序列相似性分析问题,本文提出了一种基于信息熵的相似性度量模型。将两条比对后的序列间的平均交互信息量与它们的联合熵之比作为它们的相似性度量。使用该度量构建了11个物种的相似性矩阵,对它们的相似性进行了分析,结果在一定程度上与生物分类学相契合。通过距离矩阵所构建的进化树,也反映了它们之间的进化关系,表明该模型的设计具有合理性。本文使用信息熵方法所得的实验结果表明,信息熵能够很好地表征一些生物学特性,它在生物信息学中的应用还有待人们进行更深入的研究。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-15
  1.1 课题背景  9-11
  1.2 研究的目的与意义  11
  1.3 基因组特性的研究现状  11-13
  1.4 本文的主要研究内容和组织结构  13-15
第2章 信息熵理论基础及在序列分析中的研究现状  15-28
  2.1 引言  15
  2.2 信息熵理论基础  15-20
    2.2.1 信息的概念  16
    2.2.2 信息熵的定义  16-17
    2.2.3 熵函数的性质  17-18
    2.2.4 共熵与条件熵以及平均交互信息量  18-19
    2.2.5 Rényi 熵  19-20
  2.3 信息熵在基因组特性分析中的应用  20-27
    2.3.1 信息熵在基因识别研究中的应用  21-24
    2.3.2 信息熵在功能位点识别研究中应用  24-25
    2.3.3 信息熵在序列相似性分析及进化树构建中的应用  25-26
    2.3.4 信息熵在基因组序列特性分析中的其它一些应用  26
    2.3.5 基因组序列特性分析问题中的信息熵应用总结  26-27
  2.4 本章小结  27-28
第3章 基因组翻译起始和终止区域的特性分析  28-51
  3.1 引言  28
  3.2 数据准备与预处理  28-30
  3.3 基因组翻译起始和终止区域的特性分析  30-50
    3.3.1 基因组单碱基位点信息熵分析的算法模型及流程  30-32
    3.3.2 原核生物基因组单碱基位点信息熵分析  32-42
    3.3.3 真核生物基因组单碱基位点信息熵分析  42-46
    3.3.4 原核生物基因组相邻多碱基位点信息熵分析  46-50
  3.4 本章小结  50-51
第4章 不同物种基因组序列相似性的分析  51-60
  4.1 引言  51
  4.2 基于信息熵的序列相似性分析模型  51-53
  4.3 序列相似性模型的合理性分析与验证  53-59
    4.3.1 构建相似性矩阵和距离矩阵  53-58
    4.3.2 物种进化树的构建及合理性分析  58-59
  4.4 本章小结  59-60
结论  60-62
参考文献  62-68
攻读学位期间发表的论文  68-70
致谢  70

相似论文

  1. 基于信息熵的课堂观察量化评价模型研究,G632.4
  2. 恩替卡韦联合TACE治疗伴乙肝病毒复制的原发性肝癌效果分析,R735.7
  3. 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
  4. 鸡传染性支气管炎病毒河南地方株分离鉴定及HN104株与HN091株全基因组序列测定,S852.65
  5. 转基因稻米及其米制品外源重组DNA的检测,S511
  6. 寄主型和迁飞型棉蚜在交配行为、mtDNA与共生菌相关基因上的分化,S433
  7. 江苏省小麦孢囊线虫的发生调查及其核糖体DNA-ITS序列分析,S435.121
  8. 百萨偃麦草染色体1J和5J变异体的诱致与鉴定,S512.1
  9. 甘蓝型油菜线粒体DNA提取及基因表达分析研究,S565.4
  10. 普通小麦—百萨偃麦草染色体易位系的选育与效应分析,S512.1
  11. 豆梨组织培养过程中玻璃化形成机制及其恢复技术研究,S661.2
  12. 桃豫农矮砧1号离体快繁体系的研究和SSR-PCR反应体系的优化,S662.1
  13. 5-Aza-dC对肺癌SPC-A-1细胞p16、MGMT基因甲基化及其表达的影响,R734.2
  14. 肺癌患者癌组织和血浆p16基因甲基化的检测及去甲基化肺癌细胞生物学行为和p16基因转录的研究,R734.2
  15. 乙型脑炎病毒NS1蛋白的新型prime-boost免疫策略研究,R392
  16. 中国野生秋子梨群体特征及遗传多样性评价,S661.2
  17. 我国部分家鸭品种的DNA条形码初步分析,S834
  18. 五倍子蚜DNA序列分子系统发育关系,S899.4
  19. SO2胁迫对拟南芥DNA甲基化多态性的影响,Q943
  20. 5-氯水杨酸铬(Ⅲ)配合物的制备、性质及降脂活性研究,O627.63
  21. 靶向人端粒G-四链体的有机小分子的设计合成和键合作用研究,TQ460.1

中图分类: > 数理科学和化学 > 数学 > 控制论、信息论(数学理论) > 信息论(信息论的数学理论)
© 2012 www.xueweilunwen.com