学位论文 > 优秀研究生学位论文题录展示
基于互信息频度的特征选择及其在SNP关联分析中的应用
作 者: 赵剑
导 师: 张军英
学 校: 西安电子科技大学
专 业: 计算机应用技术
关键词: SNP 特征选择 互信息 频度
分类号: Q987
类 型: 硕士论文
年 份: 2009年
下 载: 60次
引 用: 1次
阅 读: 论文下载
内容摘要
SNP (Single-Nucleotide Polymorphism,单核苷酸多态)是一种新的遗传标记。它在人类遗传变异中非常普遍,几乎占到已知变异多态性的90%以上。对SNP研究是后基因时代生物信息学研究的重要领域之一。然而,由于SNP大量存在于人类基因组中,并且存在大量多余的及与疾病不相关的SNP,使得寻找与疾病相关的SNP成为一个难点。通常解决这类问题的办法是进行特征选择。特征选择自从上世纪70年代以来得到了长足的发展,有许多特征选择的方法可用于一般性问题。本文应用特征选择来试图找出与疾病相关的SNP。论文利用互信息作为特征选择的评价函数,提出了一种基于互信息频度的启发式搜索候选特征集的方法(枝条矩阵搜索算法),对SNP进行特征选择实验,并对算法及实验结果进行详细的分析。之后做了两组对比实验,第一组实验对ME算法和mRMR算法进行了仿真,并比较了这两种算法和本文算法的性能;第二组实验针对model内SNP之间的影响以及rnodel间SNP的影响。
|
全文目录
摘要 3-4 Abstract 4-5 目录 5-7 第一章 绪论 7-11 1.1 课题背景 7-9 1.1.1 SNP介绍 7 1.1.2 SNP研究价值 7-9 1.1.3 SNP的特点 9 1.1.4 SNP研究的三个阶段 9 1.2 国内外研究现状 9-10 1.3 本文研究内容及结构 10-11 第二章 特征选择 11-21 2.1 特征选择概念 11-13 2.2 特征子集选择算法和评价函数 13-15 2.3 特征选择算法分类及经典算法 15-20 2.4 本章小结 20-21 第三章 基于互信息频度的特征选择算法 21-31 3.1 基于互信息和频度的特征选择算法的框架 21-22 3.2 信息论与互信息 22-23 3.2.1 信息论基本内容及发展 22 3.2.2 互信息 22-23 3.3 枝条矩阵搜索算法 23-26 3.3.1 枝条矩阵搜索算法描述 23-25 3.3.2 时间复杂度分析 25 3.3.3 参数分析 25-26 3.4 性能评价 26-30 3.4.1 ROC曲线简述 26-28 3.4.2 ROC在本文性能评价中的应用分析 28-30 3.5 本章小结 30-31 第四章 实验与结果分析 31-43 4.1 实验数据处理与实验结果 31-34 4.1.1 实验数据处理 31 4.1.2 实验环境 31-32 4.1.3 实验结果 32-34 4.2 实验一:不同方法的比较 34-38 4.2.1 ME方法及mRMR算法简介 34-37 4.2.2 对比实验的实验结果 37 4.2.3 ROC曲线性能对比 37-38 4.3 实验二:SNP关联影响分析 38-41 4.3.1 model内部SNP之间的影响 38-39 4.3.2 model之间SNP的影响 39-41 4.4 本章小结 41-43 总结与展望 43-45 致谢 45-47 参考文献 47-51 硕士期间发表的论文 51
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 唇读中的特征提取、选择与融合,TP391.41
- 基于BAP的数据压缩、操作与查询处理系统的实现,TP311.13
- 语音情感识别的特征选择与特征产生,TP18
- 荞麦种质CHS基因遗传多样性研究,S517
- 外源性NO对旋毛虫肌幼虫杀伤作用及其机制研究,R532.14
- PD-L1基因多态性和可溶性PD-L1分子与中国人群食管癌的关联分析,R735.1
- 基于特征选择的入侵检测研究,TP393.08
- IL-15在急性淋巴白血病中的遗传学研究和IL-1α的抗体的制备及相关研究,R733.71
- 非小细胞肺癌中TGFBR1等位基因特异性表达(ASE)及其与单倍型关系的研究,R734.2
- Pfu高保真酶结合双硫代修饰引物在全血基因分型检测中的应用,R91
- 血浆DNA直接芯片PCR扩增和微流控化学发光SNP分析系统的研究,R440
- TET2基因突变及SNP rs2454206在急性髓系白血病中的研究,R733.71
- 疑难亲缘鉴定中非CODIS STR和X-SNP的应用价值,D919.2
- 音乐内容和歌词相结合的歌曲情感分类方法研究,TP391.3
- 结肠癌中miRNA基因突变筛查,R735.35
- 糖基转移酶β3GnT2、β3GnT8真核表达载体和β3GnT8 RNA干扰细胞株SGC-7901的构建及β3GnT8对相关基因mRNA表达的影响,Q78
- 特征选择算法及其在网络流量识别中的应用研究,TP393.06
- 基于脑电信号的疲劳估计和实时监控技术研究,TN911.6
- 基于特征向量的实体间语义关系抽取研究,TP391.1
中图分类: > 生物科学 > 人类学 > 人类遗传学
© 2012 www.xueweilunwen.com
|