学位论文 > 优秀研究生学位论文题录展示
广义线性模型基于Elastic Net的变量选择方法研究
作 者: 卢颖
导 师: 张尚立
学 校: 北京交通大学
专 业: 概率论与数理统计
关键词: 广义线性模型 变量选择 Lasso Elastic Net Logistic回归 Poisson回归
分类号: O212.1
类 型: 硕士论文
年 份: 2011年
下 载: 241次
引 用: 2次
阅 读: 论文下载
内容摘要
模型的变量选择是统计建模中很重要的问题之一,关于线性模型的变量选择研究,前人已经做了很多工作,尤其引人注目的是1996年Tibshirani提出的Lasso方法,它可以同时做到变量的选择和参数的估计。随着解决此类问题的有效算法LARS的提出,Lasso及其相关改进方法的研究已经成为了当今统计学界的热门问题。Elastic Net是Lasso的一种有效改进方法,它在处理微阵列数据方面要显著优于Lasso法,即当数据中的变量间存在组效应时,ElasticNet方法能够将群变量全部选出。本文将该方法应用于广义线性模型,分别在Logistic模型和Poisson模型中推广了Elastic Net估计的这一性质,证明了这两种模型在研究数据存在组效应情况下,Elastic Net方法同样可以将群变量全部选出。另外,本文还通过实际的和模拟的数据例子,分析验证了Elastic Net方法相比于Lasso方法和Ridge方法在模型变量选择方面的良好表现。本文第一章回顾了普通线性模型和广义线性模型在变量选择方面的研究进展,第二章介绍了广义线性模型和Elastic Net方法的一些相关预备知识,第三章和第四章则将Elastic Net分别应用于Logistic模型和Poisson模型,给出了两种模型下Elastic Net估计的定义,讨论了该估计的组效应性质,并通过数据例子进行了分析和验证,文章最后对全文进行了总结并提出了一些有待进一步研究的问题。
|
全文目录
致谢 5-6 中文摘要 6-7 ABSTRACT 7-10 第1章 引言 10-14 1.1 普通线性模型变量选择方法的发展 10-12 1.2 广义线性模型变量选择方法的发展 12-14 第2章 预备知识 14-24 2.1 线性模型 14-16 2.1.1 普通线性模型 14-15 2.1.2 广义线性模型 15-16 2.2 Elastic Net变量选择方法 16-24 2.2.1 Lasso方法 16-19 2.2.2 Ridge方法 19-21 2.2.3 Elastic Net方法 21-24 第3章 Logistic回归模型基于Elastic Net的变量选择方法 24-32 3.1 Logistic回归模型Elastic Net估计的定义 24-25 3.2 Logistic回归模型Elastic Net估计的组效应性质 25-27 3.3 Logistic回归模型Elastic Net估计的应用 27-32 3.3.1 白血病数据实例 27-30 3.3.2 模拟数据 30-32 第4章 Poission回归模型基于Elastic Net的变量选择方法 32-39 4.1 Poission回归模型Elastic Net估计的定义 32-33 4.2 Poisson回归模型Elastic Net估计的组效应性质 33-35 4.3 Poisson回归模型Elastic Net估计的应用 35-39 4.3.1 超市购物数据实例 35-37 4.3.2 模拟数据 37-39 第5章 结论与展望 39-40 参考文献 40-44 学位论文数据集 44
|
相似论文
- 大学生抑郁情绪的预测模型研究,B842.6
- 高职院校人力资源管理激励机制的研究,G717.2
- 结直肠手术手术部位感染相关因素Logistic回归分析,R656.7
- 昆明中学教师慢性咽炎危险因素定量评价研究,R766.14
- Logistic回归多重共线性的诊断与改进及其在医学中的应用,R195
- 内蒙古呼伦贝尔草原火灾风险预警研究,S812.6
- 常州市婴幼儿母乳喂养现况及其危险因素分析,R174
- 基于logistic回归模型的苏州上市企业信用风险研究,F224;F832.4
- 贫困生数据的累积logistic回归分类,O212.1
- Logistic回归模型分析综述及应用研究,O212.1
- 高维伊辛模型结构学习及其应用研究,TP181
- 跨国公司在华子公司市场知识转移模式的实证研究,F276.7
- 上市公司融资方式选择模型研究,F224
- 基于一组实际调查问卷数据的统计分析,O212.1
- 基于SAS的客户营销响应模型设计,TP311.13
- 基于logistic回归消费者服装品牌忠诚度影响因素实证研究,F426.86;F224
- 福建集体林区森林保险事业发展机制研究,F842.6;F224
- 病毒性脑炎的临床特点及预后因素探讨,R512.3
- 多元回归模型中变量选择问题研究,O212.1
- 基于转导推理思想的一致性预测器,TP181
- 我国制造业上市企业财务预警模型构建,F224
中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com
|