学位论文 > 优秀研究生学位论文题录展示

缺失数据情形非参数回归函数的估计

作 者: 黄江艳
导 师: 秦永松
学 校: 广西师范大学
专 业: 概率论与数理统计
关键词: 缺失数据 MAR缺失机制 非参数回归函数 相合性 渐近正态性
分类号: O212.1
类 型: 硕士论文
年 份: 2009年
下 载: 83次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在实际问题中,由于某些抽样个体不愿意提供所需信息、某些不可控的原因导致信息丢失以及调查者未能收集到准确信息等因素而导致大量缺失数据的产生.事实上,数据缺失在可靠性寿命试验、市场调查、医学研究以及科学试验等中经常发生.近年来,缺失数据情形的统计推断已成为当今统计界的一个热门研究领域(Little and Rubin, StatisticalAnalysis with Missing Data[M], New York: John Wiley & Sons, 1987.).在有数据缺失的情况下通常的统计方法往往不能直接应用,需要对数据进行必要的处理.最早用于处理缺失数据的方法是Complete-Case方法,它是将所有数据缺失的项删除,然后对余下的项构成的“完全样本”按照通常的统计方法进行统计推断.现在处理不完全样本的常用方法是填补法,分为固定填补法和随机填补法两种,它们都是对缺失值进行必要的补充,继而得到“完全样本”,再按照通常的用于完全样本情形的统计方法进行统计推断.非参数回归模型是一种重要的统计模型,该模型广泛用于解决经济和医学等领域的诸多问题.在完全样本情形,Benedetti(On the nonparametric estimation of regression functions[J],J. Roy. Stat. Soc. B, 1977, 39(2): 248-253.)讨论了Priestley-Chao型固定设计权函数估计的强相合性, Georgiev and Greblicki (Nonparametric function recovering from noisy observation[J],J. Stat. Plan. Infer., 1986, 13: 1-14.)系统研究了固定设计情形一般权函数估计的均方相合性和完全收敛性;孙东初(回归函数核估计的强相合性[J],数学年刊, 1985, 6A(4):481-486.),方兆本和赵林城(非参数回归核估计的强相合性[J],应用数学学报, 1985, 8(3):268-276.), Schuster (Joint asymptotic distribution of the estimated regression function at a finitenumber of distinct points[J], The Annals of Mathematical Statistics, 1972, 43(1): 84-88.)等在随机设计情形研究了非参数回归模型核估计的大样本性质.在缺失数据情形,响应变量满足MAR缺失机制下, Cheng (Nonparametric estimation of mean functionals with missingdata at random[J], J. Am. Stat. Assoc., 1994, 89(425): 81-87.)基于核回归补足得到的“完全样本”讨论了随机设计情形非参数回归模型中响应变量均值的渐近正态性, Wang andRao (Empirical likelihood-based inference under imputation for missing data[J]. The Annals ofStatistics, 2002, 30(3): 896-924.)基于核回归补足得到的“完全样本”构造了随机设计情形非参数回归模型响应变量均值的经验似然置信区间, Wang and Rao (Empirical likelihoodfor linear regression models under imputation for missing responses[J]. The Canadian Journal ofStatistics, 2001, 29(4): 597-608.)基于固定补足得到的“完全样本”研究了固定设计情形线性模型回归系数的经验似然置信域的构造.本文的第二章考虑固定设计下的非参数回归模型,在响应变量有缺失的不完全数据情形,用三种不同的处理方法处理缺失数据,即利用剔除有缺失数据的个体资料方法,利用确定性补足得到的“完全样本”和随机补足得到的“完全样本”,由此给出了回归函数的三种估计,并讨论了估计的强、弱相合性和渐近正态性.我们在第三章考虑了随机设计下的非参数回归模型,在响应变量有缺失的不完全数据情形,用两种不同的处理方法处理缺失数据,即利用剔除有缺失数据的个体资料方法和回归补足得到的“完全样本”,由此给出了回归函数的两种估计,并讨论了估计的强、弱相合性和渐近正态性.本文的特色体现在以下几个方面:1.在MAR缺失机制下,首次研究了固定设计情形非参数回归模型回归函数的估计问题,对缺失的响应变量,利用三种不同的缺失数据处理方法给出了回归函数的三种估计,证明了估计的强、弱相合性和渐近正态性.2.在MAR缺失机制下,首次研究了随机设计情形非参数回归模型回归函数的估计问题,对缺失的响应变量,利用两种不同的缺失数据处理方法给出了回归函数的两种估计,证明了估计的强、弱相合性和渐近正态性.

全文目录


摘要  3-5
Abstract  5-9
第一章 绪论  9-13
  1.1 非参数回归模型的研究概况  9-11
  1.2 缺失机制和缺失数据的研究进展  11-12
  1.3 本文主要内容及结构  12-13
第二章 缺失数据下固定设计情形非参数回归函数的估计  13-31
  2.1 引言  13-14
  2.2 主要结果  14-15
  2.3 窗宽的选取  15-16
  2.4 模拟结果  16-17
  2.5 引理与定理的证明  17-31
第三章 缺失数据下随机设计情形非参数回归函数的估计  31-50
  3.1 引言  31-32
  3.2 主要结果  32-33
  3.3 引理与定理的证明  33-50
结论与展望  50-51
参考文献  51-54
致谢  54-55

相似论文

  1. 针对零膨胀超散度计数数据的统计推断,C81
  2. 基于SARIMA与神经网络混合模型的桥梁健康监测系统缺失数据填补,TP183
  3. 数据缺失及相关因素对逐步回归变量筛选的影响,R181.3
  4. 缺失数据的贝叶斯模型处理,C811
  5. 基于贝叶斯方法的缺失数据补全研究,TP311.13
  6. 均值协方差模型中非约束参数的最大似然估计,O212.1
  7. 有缺失协变量的相对危险率模型的估计理论及其渐近性质,O212.1
  8. 缺失数据下广义线性模型参数拟似然估计的相合性和渐近正态性,O212.1
  9. 基于经验似然的缺失数据下部分线性模型的异方差检验,O212.1
  10. 响应变量存在缺失时非线性半参数回归模型的经验似然推断,O212.1
  11. 广义线性模型中极大拟似然估计的相合性与渐近正态性,O212.1
  12. 复杂系统可靠度U统计量估计及性质,N941.4
  13. 响应变量随机缺失下的半参数变系数部分线性变量含误差模型的统计推断,O212.1
  14. α混合样本优化型CVaR估计的大样本性质,F832.51
  15. 缺失纵向数据下半参数回归模型的分析研究,O212.1
  16. 响应变量有缺失时变系数部分线性模型的统计推断,O212.1
  17. 二维指数信号模型中参数随机加权估计的渐近正态性,O211.67
  18. 缺失数据的概率主成分分析,O212.1
  19. GEE和QIF用于含有缺失数据的AsthmaData数据分析,O212.1
  20. 对含缺失数据的非参可加模型进行成分选取,O212.1
  21. 密度核估计的广义相合性,O211.5

中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com