学位论文 > 优秀研究生学位论文题录展示

广义线性模型的稳健估计及其医学应用

作 者: 郝永红
导 师: 王彤
学 校: 山西医科大学
专 业: 流行病与卫生统计学
关键词: 广义线性模型 稳健估计 离群点 Mallows拟似然估计 条件无偏影响约束估计 Mallows降权杠杆点估计 一致性错分模型估计
分类号: R311
类 型: 硕士论文
年 份: 2009年
下 载: 88次
引 用: 0次
阅 读: 论文下载
 

内容摘要


广义线性模型(generalized linear model,GLM)是一类应用范围较广的模型,它可以满足应变量为连续和离散数据的建模,特别是后者,如属性数据,计数数据。这在应用上,尤其是生物、医学、经济和社会数据的统计分析上,有着重要意义。但是其经典模型拟合方法最大似然估计(MLE)容易受离群点的影响,甚至得出错误结论。因此,研究能有效对抗离群点的稳健估计方法将具有重要意义。本文回顾和比较了四种适用于广义线性模型的稳健估计方法:Mallows拟似然估计、条件无偏影响约束估计(CUBIF)、Mallows降权杠杆点估计和一致性错分模型估计。首先在稳健回归估计基本理论的基础上对这四种估计方法的基本思想和稳健性质进行了详细的阐述。其中后两种方法只能适用于Logistic回归模型。在模拟分析中,对Mallows拟似然估计考虑了帽矩阵、MVE和MCD三种针对x方向降权的尺度,对Mallows降权杠杆点估计考虑Carroll和Huber两种降权函数。模拟分析基于两种常见的广义线性模型即Logistic回归和Poisson回归进行了设计,然后对每种模型建立的模拟样本中分别构建y方向、x和y方向两种不同类型和不同比例的离群点情况,探讨了适用于各自模型的各种估计方法对抗不同类型和比例离群点的能力。通过模拟研究我们得到以下结论:1.相比较于经典的MLE,这一类稳健估计方法在一定程度上可以更好的对抗离群值产生的影响,描述最佳拟合大部分数据的结构;可以更清楚地识别离群值、模型中的强影响点与模型偏离的结构;当数据中没有影响点时,其估计与经典MLE估计一样好,但是当MLE条件不满足时,稳健估计结果要远远优于MLE。2.在Logistic回归模型和Poisson回归模型情况下,Mallows拟似然估计基于MVE和MCD的降权方法都表现了较其他估计方法更强的对抗离群点的能力。而基于帽矩阵的降权方法则由于帽矩阵本身的不稳健性导致了其较低的失效点。3.Mallows降权杠杆点估计方法由于其权函数是基于x方向离群点,所以在单纯的1%的y方向的离群点时即失去效用,但是在x和y方向同时异常时有很好的对抗性离群点的能力,不过由于其权函数对x方向离群点观测赋权重为0达到规避离群观测的特性,在离群点比例增大时,极容易导致logistic回归模型完美分割导致估计无解情况的发生,而且其降权过程会损失样本的大量信息。4.一致性错分模型估计表现要差于前两种方法,但相对MLE来说具有较好的稳健性,不过其缺点在于可能造成正常观测点的强制降权作用。5.CUBIF本身思想为影响约束估计,可以同时考虑x和y方向的异常情况,不过其表现要劣于其他稳健估计方法。最后本文通过两个实例,探讨了这些方法的实际应用。

全文目录


中文摘要  5-7
英文摘要  7-8
前言  8-9
第一章 广义线性模型及其参数估计  9-11
  1.1 模型基本结构介绍  9-10
  1.2 广义线性模型参数估计  10-11
第二章 稳健估计理论概要  11-13
第三章 广义线性模型稳健估计  13-23
  3.1 Mallows 型拟似然估计  14-17
  3.2 条件无偏影响约束估计  17-19
  3.3 Mallows 型降权杠杆点估计  19-20
  3.4 一致性错分模型估计  20-23
第四章 模型诊断理论概要  23-26
第五章 模拟研究  26-41
  5.1 最大似然估计值分布情况  26-27
  5.2 Logistic 回归模型的稳健估计  27-35
    5.2.1 对无离群点数据的系数估计  27-31
    5.2.2 对不同比例污染样本的系数估计  31-35
      5.2.2.1 在y 方向构建错分错误  31-33
      5.2.2.2 在x 和y 方向同时添加离群点  33-35
    小结  35
  5.3 Poisson 回归模型的稳健估计  35-41
    5.3.1 对无离群点数据的系数估计  35-37
    5.3.2 对不同比例污染样本的系数估计  37-40
      5.3.2.1 在Y 方向添加离群点  37-38
      5.3.2.2 在x 和y 方向同时添加离群点  38-40
    小结  40-41
第六章 实例分析  41-48
  6.1 白血病数据的logistic 模型  41-44
  6.2 癫痫病人数据的Poisson 回归模型  44-48
第八章 讨论  48-50
参考文献  50-53
个人简介  53-54
致谢  54

相似论文

  1. 一种多数据流聚类异常检测算法,TP311.13
  2. GLM在建筑工程质量保险费率厘定中的应用研究,F842
  3. 基于局部不变特征的图像匹配技术研究,TP391.41
  4. 基于改进免疫算法的弹性参数反演,P631.4
  5. 相关稳健估计在GPS数据处理中的应用研究,P228.4
  6. 空间离群点挖掘算法的研究,TP311.13
  7. 基于蚁群算法的离群点挖掘算法研究,TP311.13
  8. 缺失数据下广义线性模型参数拟似然估计的相合性和渐近正态性,O212.1
  9. 基于局部线性嵌入的高维数据降维研究,O186.12
  10. 基于Squeezer算法与Java技术的WSN入侵检测系统,TN918.82
  11. 基于离群点挖掘的网络入侵检测方法研究,TP393.08
  12. 广义线性模型在机动车辆保险费率厘定中的应用研究,F224
  13. 广义线性模型中极大拟似然估计的相合性与渐近正态性,O212.1
  14. 风电场出力的短期预测研究,TM715
  15. 流形学习中的鲁棒性问题研究,TP181
  16. 基于模糊聚类分析的入侵检测技术研究,TP393.08
  17. 内容相关性驱动的Web资源离群点挖掘技术研究与系统实现,TP311.13
  18. 面向审计领域的聚类离群点检测研究,TP311.13
  19. 离群点预处理及检测算法研究,TP311.13
  20. 移动对象聚类和空间离群点检测算法研究,TP311.13
  21. 无线传感器网络中动态离群点的检测,TN929.5

中图分类: > 医药、卫生 > 基础医学 > 医用一般科学 > 医用数学
© 2012 www.xueweilunwen.com