学位论文 > 优秀研究生学位论文题录展示

多元线性回归中多重共线性问题的解决办法探讨

作 者: 张凤莲
导 师: 林健良
学 校: 华南理工大学
专 业: 概率论与数理统计
关键词: 多重共线性 岭回归 主成分回归 偏最小二乘回归 通路分析
分类号: O212.1
类 型: 硕士论文
年 份: 2010年
下 载: 403次
引 用: 4次
阅 读: 论文下载
 

内容摘要


无论是在经济、工商管理、社会科学,还是在工程技术、医学、生物科学中,回归分析都是一种普遍应用的统计分析与预测技术。在回归分析中,当自变量之间出现多重共线性现象时,常会严重影响到参数估计,扩大模型误差,并破坏模型的稳健性,因此消除多重共线性成为回归分析中参数估计的一个重要环节。现在常用的解决多元线性回归中多重共线性的回归模型有岭回归(Ridge Regression)、主成分回归(Principal Component Regression简记为PCR)和偏最小二乘回归(Partial Least Square Regression简记为PLS)。本文在已有文献的基础上,对偏最小二乘回归的基本理论、性质进行了整理、扩充;对偏最小二乘回归、普通最小二乘回归(Ordinary Least Square Regression)、岭回归及主成分回归方法进行了系统的比较;在岭回归中采用了一种基于均方误差无偏估计达到最小原则下选择岭参数的方法;在主成分回归中采用主成分的加权残差平方和来替代仅用残差平方和来筛选特征值的方法;对偏最小二乘回归理论做了进一步探讨:从理论与实例两方面分析了哪类数据不适合直接使用偏最小二乘回归处理的原因,提出一种改进方法,并给予实例验证;针对偏最小二乘回归模型中仍包含所有原始自变量的情况,结合通路分析方法,探讨了筛选偏最小二乘回归模型中原始自变量的问题,并应用该方法建立预测某地区火灾发生频数的模型。结果表明,该方法不仅能简化模型、提高模型的预测精度,而且还能选出对火灾频数影响较大的因素,具有实用价值。

全文目录


摘要  6-7
ABSTRACT  7-10
第一章 绪论  10-17
  1.1 问题提出  10-12
    1.1.1 多重共线性的含义  10-11
    1.1.2 多重共线性形成的原因  11
    1.1.3 多重共线性的危害  11-12
  1.2 文献的回顾及面临的问题  12-15
    1.2.1 文献的回顾  12-15
    1.2.2 面临的问题  15
  1.3 论文结构、内容及特点  15-17
第二章 处理多重共线性的几种方法  17-34
  2.1 共线性的诊断  17-19
    2.1.1 经验式的诊断方法  17-18
    2.1.2 统计诊断方法  18-19
  2.2 处理多重共线性的经验式方法  19-20
    2.2.1 删除不重要的共线性变量  19
    2.2.2 增加样本容量  19
    2.2.3 变量转换的方式  19-20
  2.3 岭回归  20-22
  2.4 主成分回归  22-24
  2.5 偏最小二乘回归  24-30
    2.5.1 偏最小二乘回归分析的算法推导及基本原理  25
    2.5.2 算法推导  25-28
    2.5.3 基本性质  28-29
    2.5.4 交叉有效性原则  29-30
  2.6 三种回归方法比较  30-34
    2.6.1 岭回归分析方法  31-32
    2.6.2 主成分回归法  32
    2.6.3 偏最小二乘回归方法  32-33
    2.6.4 比较结果  33-34
第三章 岭回归分析中确定岭参数k的一种方法  34-37
第四章 主成分分析中特征因子的一种筛选方法  37-40
第五章 偏最小二乘回归的一种不适用情况及弱点改进  40-49
  5.1 不适用情况的成因分析  40-42
  5.2 改进方法  42-46
  5.3 实证分析  46-47
    5.3.1 剩余信息的计算  46-47
    5.3.2 结果比较  47
  5.4 本章小结  47-49
第六章 基于通路分析筛选偏最小二乘回归中原始自变量  49-58
  6.1 通路分析的基本原理  49-51
  6.2 变量筛选准则  51
  6.3 变量筛选步骤  51-52
  6.4 与逐步回归算法的比较  52
  6.5 实证分析  52-57
  6.6 本章小结  57-58
结论  58-59
参考文献  59-62
攻读硕士学位期间取得的研究成果  62-63
致谢  63

相似论文

  1. 朝阳地区参考作物腾发量演变特征与预测模型研究,S161.4
  2. 利谷隆致胚胎期SD大鼠睾丸发育整体基因表达水平的研究,Q75
  3. Logistic回归多重共线性的诊断与改进及其在医学中的应用,R195
  4. 名牌企业的抗金融危机能力研究,F272;F224
  5. 淮河流域X县水中藻毒素分布特征及水样有机提取物细胞毒性、遗传毒性与污染谱的回归模型研究,R114
  6. 偏最小二乘回归与判别分析在科技人员类型及影响因素研究中的应用,G644
  7. 紫外法水质COD检测的理论与实验研究,X832
  8. 固定床间歇煤气化工艺的分析,TQ546
  9. 内蒙古金融发展与经济增长关系的实证研究,F832.7;F127
  10. 我国上市公司资本结构与公司规模相关性的研究,F275
  11. 中国多省区木材加工业增长机制研究,F426.88
  12. 形状记忆合金复合薄板的非线性动力学研究,TG139.6
  13. 配电网中长期负荷预测方法研究,TM715
  14. 汽车铝合金轮毂辐条力学性能的统计学分析,U463.343
  15. 多变煤质条件下火电厂负荷优化分配方法研究,TM621
  16. 影响刺五加质量因素的研究,R284
  17. 宜宾市商品住宅价格影响因素研究,F224
  18. 互联网对中国GDP贡献度测算研究,F222.33;F224
  19. 主成分回归分析在企业价值评估中的应用,F224
  20. 房屋截面数据的统计分析,O212.1
  21. 北方大型灌区地下水动态预报方法及其应用研究,S273.4

中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com