学位论文 > 优秀研究生学位论文题录展示

纵向数据缺失处理对分析模型影响的研究

作 者: 赵晓云
导 师: 杨贵军
学 校: 天津财经大学
专 业: 统计学
关键词: 数据缺失 纵向数据 重复测量方差分析 多重插补 混合回归模型
分类号: C81
类 型: 硕士论文
年 份: 2013年
下 载: 23次
引 用: 0次
阅 读: 论文下载
 

内容摘要


纵向数据的提出将数据模型研究推到了一个新的领域,纵向数据模型成为统计学在理论研究和实际应用中探究的重要课题。由于纵向数据结合了时间序列数据和横截面数据的特性,不仅体现了样本的时间变化趋势,还将样本的组内差异和组间差异更充分地表示出来。在相关领域的研究中为获得全面的分析需要变换时间和场合对同一对象进行重复观测来获取纵向数据。但由于获取资料所需的时间较长,实验条件变化较多,数据缺失经常发生。医学统计和生物统计的纵向研究中就常会遇到由于被观测个体的身体不适或不便、移居外地或对研究不再感兴趣等原因,不能按照事先规定的时间接受调查;甚至有的会退出研究,造成数据缺失。纵向数据中的数据缺失可能会发生在观测时间内的任一时间点,连续时间变化趋势下的统计分析就会受到影响。数据缺失会破坏数据的完整性,影响数据的可用性,违背数据分析模型的假定,导致相应的统计分析结果出现不同程度的偏差,降低结果的准确性和精度,给研究问题的解释带来困惑,影响整个数据研究工作的质量。在含缺失纵向数据的实际分析中,为简化问题的复杂性,往往采用删除缺失的完整观测数据。这在一定程度上减少了统计分析的样本量,而且是许多统计分析软件处理数据缺失的默认方法。但是,这种方法只有在数据是完全随机缺失,并且缺失单元与其他被观测单元不存在显著差异时才能给出合理的估计结果;否则,可能降低估计量的精度,甚至导致估计量与真值偏离较大,使得统计分析结果出现严重偏差。数据缺失的处理对模型分析具有重要的意义。本文探讨纵向数据缺失的处理方法对分析模型的影响。选取了健康相关生活质量的实际数据(参见Gjeilo等,2008),对删除缺失的完整观测分析结果与数据缺失处理之后的统计分析结果进行了比较。EM算法和链式方程多重插补法的实际结果显示,链式方程多重插补法的效果优于其它插补方法。针对链式方程多重插补的数据集合,给出了纵向数据的几种常用模型的分析结果,并进行了比较分析。结果显示,在处理纵向数据缺失时,插补法可以更合理地利用数据信息。对含插补值数据集合的分析,要依据相应选用的统计模型以得到更合理的统计分析结果。

全文目录


内容摘要  4-5
Abstract  5-7
目录  7-8
第1章 导论  8-13
  1.1 本文研究背景及目的  8-9
  1.3 相关研究文献综述  9-12
  1.4 论文结构和创新之处  12-13
第2章 数据缺失处理  13-25
  2.1 数据缺失的产生原因  13-14
  2.2 数据缺失的分类  14-17
  2.3 数据缺失的处理方法  17-25
第3章 常用纵向数据分析模型  25-42
  3.1 重复测量方差分析模型  26-30
  3.2 混合回归模型  30-36
  3.3 协方差模式模型  36-39
  3.4 离散结果变量分析模型  39-42
第4章 健康相关生活质量纵向数据的实证分析  42-67
  4.1 健康相关生活质量的纵向数据  42-45
  4.2 基于直接删除法的统计分析  45-52
  4.3 基于插补集合的统计分析  52-60
  4.4 多重插补集合下混合回归模型分析  60-63
  4.5 多重插补集合下常用分析模型比较  63-67
第5章 总结  67-69
参考文献  69-73
后记  73

相似论文

  1. 对联合线性混合模型使用Pairwise方法做仿真模拟,O212.1
  2. 简单序约束下基于二次推断函数的纵向数据模型选择方法,O212.1
  3. 水电工程施工现场安全评价方法的研究,TV513
  4. 大地电磁正则化反演及其应用研究,P631.325
  5. 基于贝叶斯方法的缺失数据补全研究,TP311.13
  6. 纵向数据处理中的异方差分析,O212.1
  7. 缺失纵向数据下半参数回归模型的分析研究,O212.1
  8. 边缘模型中的两种统计推断方法:GEE与QIF,C81
  9. 基因表达数据的分析与处理,Q78
  10. 线性约束下纵向数据半参数模型的渐近性质,O212.1
  11. 缺失数据情形半参数回归模型的二阶段估计,O212.1
  12. 多重插补在区间删失型数据中的应用,O212
  13. 连续护理模式对COPD病人生活质量干预效果的研究,R473.5
  14. Web信息采集和统计技术的研究与实现,TP311.52
  15. 数据预处理方法在移动通信企业的应用研究,F626
  16. 纵向数据变系数回归模型交叉核实核估计的性质,O212
  17. 针刺治疗干眼症短期临床疗效相关研究,R246
  18. 纵向数据部分线性模型的惩罚广义矩方法,O212
  19. 纵向数据混合效应模型的研究,O212.1
  20. 上市公司融资结构研究,F275
  21. 数据部分缺失情况下的均值估计,O212.1

中图分类: > 社会科学总论 > 统计学 > 统计方法
© 2012 www.xueweilunwen.com