学位论文 > 优秀研究生学位论文题录展示

基于互信息频度的特征选择及其在SNP关联分析中的应用

作 者: 赵剑
导 师: 张军英
学 校: 西安电子科技大学
专 业: 计算机应用技术
关键词: SNP 特征选择 互信息 频度
分类号: Q987
类 型: 硕士论文
年 份: 2009年
下 载: 60次
引 用: 1次
阅 读: 论文下载
 

内容摘要


SNP (Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究的重要领域之一。然而,由于SNP大量存在于人类基因组中,并且存在大量多余的及与疾病不相关的SNP,使得寻找与疾病相关的SNP成为一个难点。通常解决这类问题的办法是进行特征选择。特征选择自从上世纪70年代以来得到了长足的发展,有许多特征选择的方法可用于一般性问题。本文应用特征选择来试图找出与疾病相关的SNP。论文利用互信息作为特征选择的评价函数,提出了一种基于互信息频度的启发式搜索候选特征集的方法(枝条矩阵搜索算法),对SNP进行特征选择实验,并对算法及实验结果进行详细的分析。之后做了两组对比实验,第一组实验对ME算法和mRMR算法进行了仿真,并比较了这两种算法和本文算法的性能;第二组实验针对model内SNP之间的影响以及rnodel间SNP的影响。

全文目录


摘要  3-4
Abstract  4-5
目录  5-7
第一章 绪论  7-11
  1.1 课题背景  7-9
    1.1.1 SNP介绍  7
    1.1.2 SNP研究价值  7-9
    1.1.3 SNP的特点  9
    1.1.4 SNP研究的三个阶段  9
  1.2 国内外研究现状  9-10
  1.3 本文研究内容及结构  10-11
第二章 特征选择  11-21
  2.1 特征选择概念  11-13
  2.2 特征子集选择算法和评价函数  13-15
  2.3 特征选择算法分类及经典算法  15-20
  2.4 本章小结  20-21
第三章 基于互信息频度的特征选择算法  21-31
  3.1 基于互信息和频度的特征选择算法的框架  21-22
  3.2 信息论与互信息  22-23
    3.2.1 信息论基本内容及发展  22
    3.2.2 互信息  22-23
  3.3 枝条矩阵搜索算法  23-26
    3.3.1 枝条矩阵搜索算法描述  23-25
    3.3.2 时间复杂度分析  25
    3.3.3 参数分析  25-26
  3.4 性能评价  26-30
    3.4.1 ROC曲线简述  26-28
    3.4.2 ROC在本文性能评价中的应用分析  28-30
  3.5 本章小结  30-31
第四章 实验与结果分析  31-43
  4.1 实验数据处理与实验结果  31-34
    4.1.1 实验数据处理  31
    4.1.2 实验环境  31-32
    4.1.3 实验结果  32-34
  4.2 实验一:不同方法的比较  34-38
    4.2.1 ME方法及mRMR算法简介  34-37
    4.2.2 对比实验的实验结果  37
    4.2.3 ROC曲线性能对比  37-38
  4.3 实验二:SNP关联影响分析  38-41
    4.3.1 model内部SNP之间的影响  38-39
    4.3.2 model之间SNP的影响  39-41
  4.4 本章小结  41-43
总结与展望  43-45
致谢  45-47
参考文献  47-51
硕士期间发表的论文  51

相似论文

  1. 词义消歧语料库自动获取方法研究,TP391.1
  2. 基于仿生模式识别的文本分类技术研究,TP391.1
  3. 唇读中的特征提取、选择与融合,TP391.41
  4. 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
  5. 语音情感识别的特征选择与特征产生,TP18
  6. 荞麦种质CHS基因遗传多样性研究,S517
  7. 外源性NO对旋毛虫肌幼虫杀伤作用及其机制研究,R532.14
  8. PD-L1基因多态性和可溶性PD-L1分子与中国人群食管癌的关联分析,R735.1
  9. 基于特征选择的入侵检测研究,TP393.08
  10. IL-15在急性淋巴白血病中的遗传学研究和IL-1α的抗体的制备及相关研究,R733.71
  11. 非小细胞肺癌中TGFBR1等位基因特异性表达(ASE)及其与单倍型关系的研究,R734.2
  12. Pfu高保真酶结合双硫代修饰引物在全血基因分型检测中的应用,R91
  13. 血浆DNA直接芯片PCR扩增和微流控化学发光SNP分析系统的研究,R440
  14. TET2基因突变及SNP rs2454206在急性髓系白血病中的研究,R733.71
  15. 疑难亲缘鉴定中非CODIS STR和X-SNP的应用价值,D919.2
  16. 音乐内容和歌词相结合的歌曲情感分类方法研究,TP391.3
  17. 结肠癌中miRNA基因突变筛查,R735.35
  18. 糖基转移酶β3GnT2、β3GnT8真核表达载体和β3GnT8 RNA干扰细胞株SGC-7901的构建及β3GnT8对相关基因mRNA表达的影响,Q78
  19. 特征选择算法及其在网络流量识别中的应用研究,TP393.06
  20. 基于脑电信号的疲劳估计和实时监控技术研究,TN911.6
  21. 基于特征向量的实体间语义关系抽取研究,TP391.1

中图分类: > 生物科学 > 人类学 > 人类遗传学
© 2012 www.xueweilunwen.com