学位论文 > 优秀研究生学位论文题录展示

缺失数据下零点膨胀负二项回归模型的统计推断

作 者: 王健
导 师: 戴琳
学 校: 昆明理工大学
专 业: 系统分析与集成
关键词: 计数数据 零点膨胀 ZINB Score检验统计量 缺失数据
分类号: O212.1
类 型: 硕士论文
年 份: 2011年
下 载: 58次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在现实生活中,计数数据广泛存在于金融、保险、临床医学、生物遗传学以及抽样调查等多个研究领域中,国内外学者对此类问题进行了广泛的分析研究,建立了各类应用背景下的计数数据模型。在上述模型中,Poisson回归模型是分析研究计数数据的重要模型,也是最基本的模型。Poisson回归模型要求事件的发生相互独立,事件的条件均值等于条件方差,但是,在实际研究分析中,这个前提往往难以得到满足,而负二项回归就是Poisson回归在这一情况下的一种扩展。在实际的计数数据的分析研究中,常由于各种原因导致观测数据中存在大量的零,当其比例远远超过Poisson回归或负二项回归的预测能力时,表现出零点膨胀现象(zero-inflated)。经典的零点膨胀计数数据模型,通过对零计数和非零计数建立混合回归模型,很好地解决数据中存在的过多零的问题。本文在Greene(1994)提出的零膨胀负二项回归模型(zero-inflated negative binomial, ZINB)的基础上,系统的讨论了计数数据建模的基本思想,单水平ZINB模型,双水平带随机效应的ZINB模型,以及缺失数据下的ZINB模型。现将本文的主要研究内容概述如下:(1)分析讨论了刻画计数数据的常用分布,对其数字特征,应用范围做了系统的介绍,并且详细介绍了计数数据建模的基本思想,尤其是对存在零点膨胀的计数数据的建模方法。(2)在完全数据模式下,针对不同的情况,分别讨论了单水平ZINB模型,以及双水平带随机效应的ZINB模型,并分别给出了针对零点膨胀的Score检验统计量以及相应的抽样分布和势。(3)基于Little和Rubin于2002年提出的缺失数据模式和缺失机制,我们分析研究了缺失数据下的ZINB模型,建立起了模型参数的ML估计程序以及模型选择标准,并在论文的最后给出了模拟研究。综上所述,针对存在零点膨胀以及缺失数据的计数数据,本文主要在ZINB模型的基础上,给出了完全数据下的ZINB模型以及相应的Score检验统计量,缺失数据下的ZINB模型的参数估计及模型选择标准,并给出了相应的模拟研究。

全文目录


摘要  4-5
ABSTRACT  5-9
第一章 绪论  9-16
  1.1 研究背景  9-12
    1.1.1 计数数据  9
    1.1.2 计数数据的相关分析及建模方法  9-11
    1.1.3 零点膨胀计数数据的相关研究内容  11-12
  1.2 国内外研究现状  12-13
  1.3 缺失数据问题  13-14
  1.4 本文的主要工作  14-15
  1.5 后续研究方向  15-16
第二章 零点膨胀计数数据建模  16-25
  2.1 刻画计数数据的常用分布  16-21
    2.1.1 二项分布  16-17
    2.1.2 泊松分布  17-19
    2.1.3 负二项分布  19-20
    2.1.4 其他分布  20-21
  2.2 零点膨胀计数数据  21-23
    2.2.1 零点膨胀的产生  21-22
    2.2.2 零点膨胀计数数据建模的基本思想  22-23
  2.3 本章小结  23-25
第三章 零点膨胀负二项回归模型的统计推断  25-36
  3.1 单水平零点膨胀负二项回归模型  25-30
    3.1.1 模型定义  25-27
    3.1.2 零点膨胀的Score检验  27
    3.1.3 score检验统计量的抽样分布和势(Power)  27-30
  3.2 双水平带随机效应的零点膨胀负二项回归模型  30-35
    3.2.1 模型定义  30-31
    3.2.2 针对零点膨胀的Score检验统计量  31-32
    3.2.3 抽样分布与Power的计算  32-34
    3.2.4 针对超散度的Score检验统计量  34-35
  3.3 本章小结  35-36
第四章 缺失数据下零点膨胀负二项分布的统计推断  36-49
  4.1 模型及定义  36-37
  4.2 缺失数据建模  37-40
    4.2.1 缺失数据机制简介  37-39
    4.2.2 缺失数据建模  39-40
  4.3 EM算法及Q函数  40-45
    4.3.1 EM算法简介  40-41
    4.3.2 数据添加  41-42
    4.3.3 Q函数  42
    4.3.4 算法的实施  42-44
    4.3.5 标准差的估计  44-45
  4.4 模型选择  45
  4.5 模拟研究  45-48
  4.6 本章小结  48-49
第五章 结束语  49-50
参考文献  50-53
致谢  53-54
附录  54

相似论文

  1. 针对零膨胀超散度计数数据的统计推断,C81
  2. 基于一组实际调查问卷数据的统计分析,O212.1
  3. 基于EM算法的含缺失数据的参数估计,O212.1
  4. 基于空间分析和模型理论的大兴安岭地区林火分布与预测模型研究,S762
  5. 半参数广义线性模型若干问题的研究,O212.1
  6. 数据预处理方法在移动通信企业的应用研究,F626
  7. 缺失数据下的非参数回归分析,O212.1
  8. 观测数据不完全的动态定位算法研究,P228.4
  9. 基于小子样复杂信息集的可靠性评估方法及其应用研究,E911
  10. 几何分布和Weibull分布产品的统计分析,TB114
  11. 经验似然方法的若干应用,O212.7
  12. 半参数变系数部分线性模型的统计推断,O212.7
  13. 混沌数据恢复与非线性系统的模型参考控制,O193
  14. 可交换的两值数据的统计分析,O212.1
  15. 基于胃肠疾病流行病学调查数据的结构方程建模研究,R181.3
  16. 胃食管反流病流行病学调查及其缺失数据的处理方法研究,R571
  17. 基于退化隐式半马尔科夫模型的设备健康预测及系统性维护策略研究,F273.4;F224
  18. 复杂数据下半参数单调回归模型的估计,O212.1
  19. 有缺失数据的AR(1)模型参数的估计方法,O212.1
  20. 具有部分缺失数据时Poisson分布参数的经验Bayes估计,O212.5

中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com