学位论文 > 优秀研究生学位论文题录展示
基于线性混合模型对大型数据的统计分析方法及其应用
作 者: 赵艳艳
导 师: 郑海涛
学 校: 西南交通大学
专 业: 概率论与数理统计
关键词: 线性混合模型 蛋白质质谱数据 FaST-LMM方法 奇异值分解
分类号: O212.1
类 型: 硕士论文
年 份: 2013年
下 载: 20次
引 用: 0次
阅 读: 论文下载
内容摘要
线性混合模型已经成为一类重要的统计模型,近年来,线性混合模型在各个领域得到了越来越广泛的应用。并且线性混合模型已被应用到多种多样的数据类型上。随着信息时代的发展,以数据为中心的传统科学的研究,例如基因组学、蛋白组学、脑科学等,产生了越来越多的大数据,线性混合模型也被越来越多的统计学家应用到了这种大型的基因数据与蛋白质质谱数据上本文为了解决在普通配置的计算机上,对于具有大型瘦长型设计矩阵的线性混合模型的参数估计问题。在FaST-LMM方法的思想基础上,通过推广用来求解dominant奇异子空间的方法,结合核外计算的思想得到了两种新的方法来求大型瘦长型矩阵的奇异值分解,即面向列分块的R-SVD方法,面向行分块SVD方法,并给出了这两种方法的并行算法的实现方法。将它们与FaST-LMM方法结合就可以在普通计算机上求得大数据线性混合模型的参数估计,本文在R中分别对这两种方法给出了模拟。为了能够将FaST-LMM方法应用到黑色素瘤质谱数据的分析上,本文还介绍了针对大型分块对角稀疏矩阵的SVD计算方法,并在R中实现了数据分析的过程。通过论文的研究工作,得出了一些有价值的规律和结论。
|
全文目录
摘要 6-7 Abstract 7-9 第1章 绪论 9-17 1.1 线性混合模型在大型数据上的应用以及研究现状 9-10 1.2 大型蛋白质质谱数据处理研究概况 10-13 1.2.1 大型蛋白质质潜数据的研究意义 10-12 1.2.2 蛋白质谱数据预处理阶段的研究 12-13 1.3 针对大型矩阵的奇异值分解的研究现状 13-15 1.4 本文的研究内容 15-17 第2章 相关理论概述 17-25 2.1 极大似然估计与受限的极大似然估计 17 2.2 奇异值分解理论概述 17-19 2.3 EMMA方法与FaST方法概述 19-25 第3章 针对大型矩阵奇异值分解的求解方法 25-31 3.1 面向列的分块R-SVD方法 25-26 3.2 并行计算与面向列的分块R-SVD方法结合 26-28 3.3 面向行的分块SVD方法 28-30 3.4 针对大型分块对角稀疏矩阵的特殊方法 30-31 第四章 数据模拟结果 31-38 4.1 而向列分块R-SVD方法的模拟结果 31-33 4.1.1 设计矩阵Z的维数为100,000乘4000时 31-33 4.1.2 设计矩阵Z的行数为500,000和1000,000时 33 4.2 面向行分块SVD方法的模拟结果 33-34 4.3 黑色素瘤细胞质谱数据分析 34-38 结论与展望 38-40 致谢 40-41 参考文献 41-45 附录1 45-56 附录2 56-59 攻读硕士学位期间发表的论文及科研成果 59
|
相似论文
- 机载导弹的传递对准研究,V249.322
- 基于Contourlet变换的数字图像盲水印技术研究,TP309.7
- 并行JACOBI方法求解矩阵奇异值的研究,O241
- 三维彩码水印算法研究,TP309.7
- 基于角点分析与奇异值分解的数字水印研究,TP309.7
- 主观题自动评分技术研究,TP391.1
- 多天线窃听信道的安全性能研究,TN918.91
- 社交网络中基于话题的影响最大化问题研究,TP393.09
- 基于核回归与非局部方法的图像去噪研究,TP391.41
- Web新闻热点发现系统的设计与实现,TP393.09
- 基于子空间分析的扩频通信窄带干扰抑制研究,TN914.42
- 基于改进GLRAM算法的人脸识别研究,TP391.41
- 基于奇异值分解的瑞雷面波加权阻尼最小二乘反演,P631.4
- 大地电磁正则化反演及其应用研究,P631.325
- 改进的完全正矩阵判定方法,O151.21
- 基于奇异值分解的信号处理方法及其在机械故障诊断中的应用,TH165.3
- 面向学科的文献资源聚类系统研究及应用,TP391.1
- 基于子空间分析的人脸识别算法研究,TP391.41
- 基于奇异值分解的数字水印算法研究,TP309.7
- 变换域数字水印算法的研究,TP309.7
- 地震资料随机干扰压制技术研究,P631.44
中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com
|