学位论文 > 优秀研究生学位论文题录展示

倾向得分匹配法的研究探索及应用

作 者: 周珺
导 师: 李兴绪
学 校: 云南财经大学
专 业: 应用统计
关键词: 倾向得分匹配 选择性偏倚 probit回归
分类号: F224
类 型: 硕士论文
年 份: 2013年
下 载: 20次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在实际试验研究中,估计和评价某种处理效应的作用情况,采用随机对照试验(randomized controlled trial,RCT)无疑是最理想的。随机对照试验是实际试验统计分析的基础,但随机对照试验的应用也受到一些限制,如研究费用成本高、实际操作比较困难以及不适用于周期很长的研究等这都限制了随机对照试验的应用。而非随机化研究同样存在一定局限性,如在于预后因素在组间分布的不均衡性以及各种偏倚的存在,会产生有偏的处理效应估计。统计研究中通常使用多元分析模型、分层法、匹配法等方法来控制选择性偏倚。但这三种方法都不适用于混杂因素较多的情况。倾向得分是非随机化研究中控制偏倚的一种新方法。近年来,倾向得分方法以其研究步骤标准化程度高、易于理解等优点而备受研究者的关注,并广泛的应用于各领域的非随机化研究中。倾向得分的概念是由Rubin和Rosenbaum在1983年首次提出的,其概念是在给定一组协变量前提下,将任意一个研究对象分配到处理组或者对照组的条件概率。倾向得分法的优点是可以将多个协变量共同作用的结果表示出来,倾向得分达到控制选择性偏倚的目的是通过调整处理组和对照组之间的协变量均衡性来达到的。当前,倾向得分法主要应用于两分组资料的研究,对于多分组资料领域还未普及,其原因是多分组资料的应用中还有一些关键问题尚待解决,比如匹配法中卡钳值的选择问题、如何检验灵敏度以及评价均衡性的方法等。本文采用倾向得分匹配法运用到种烟对农民的收入影响的研究中,整理数据并根据数据类型选择合适的模型及纳入的协变量后,计算出倾向得分,再进一步研究。在研究中,我们采用Probit模型,首先通过逐步引进农户家庭特征变量来估算倾向得分,检查种植烟叶户和非种烟户倾向得分平衡性以及模型的Pseudo R值,选择满足平衡性要求且Pseudo R值最大的变量组合用于最终倾向得分估算。Probit模型估算的Pseudo R值在2007至2010年分别为0.047、0.062、0.052和0.054,变量的选择满足平衡性要求。Probit模型估算说明了个变量对于农户选择种植烟草的影响。从具体的显著性影响看,在这4个调查年份中,农户家庭劳动力比重越小,种植烟叶的可能性越大;农户山地面积比重越大越可能选择种植烟草;农户家庭人数越多,选择种植烟草的可能性越大。采用倾向得分匹配法评估种植烟叶对农户收入的效应,分析发现,种植烟叶对农户收入的增加具有稳健的正向效应。利用倾向得分匹配法对农户种植烟叶的评估有别于利用描述性统计分析的结果。第一,两种分析方法所考察的种植效应递减在趋势上存在差别。从种烟户和非种烟户收入比较的描述性统计分析中我们可以知道:种烟户收入与非种烟户收入的差异(倍数)在2007至2010年这4个考察年间呈现出的趋势变化比较大(从1.16到1.44再到1.18,最后到1.29);而利用倾向得分匹配法的分析则能看出种烟效应总体呈现缓慢的递增趋势(从1.041到0.997,再到1.248,最后到1.387)。第二,传统的描述性统计分析会高估种植烟叶对农户收入的效应。在种植烟叶效应评估方法上,本文采用不同的匹配算法评估种烟对农户收入的效应。不同匹配算法所得的效应大小是有差别的,其原因在于不同的匹配方法产生不同的共同支撑区域,从而引起了不同数量的样本农户损失和不同的匹配质量。

全文目录


中文摘要  3-5
Abstract  5-10
第1章 引言  10-12
第2章 倾向得分法  12-33
  2.1 倾向得分的概念及研究步骤  12-15
    2.1.1 基本概念  12-13
    2.1.2 研究现状  13-14
    2.1.3 研究步骤  14-15
  2.2 倾向得分的估计方法  15-17
    2.2.1 广义线性模型  16
    2.2.2 判别分析  16
    2.2.3 COX 比例风险模型  16-17
    2.2.4 神经网络技术  17
  2.3 倾向得分的应用方法  17-21
  2.4 倾向得分法应用的条件及注意事项  21-29
  2.5 倾向得分法的优缺点  29-33
    2.5.1 倾向得分的优点  29-30
    2.5.2 倾向得分的缺点  30
    2.5.3 倾向得分法的总结与评论  30-33
第3章 实例数据分析  33-43
  3.1 数据来源与分析方法  33-35
    3.1.1 数据来源  33
    3.1.2 分析方法  33-35
  3.2 结果  35-42
    3.2.1 农户及其种植烟叶基本情况  35-36
    3.2.2 农户收入与贫困状况  36-37
    3.2.3 变量选择及模型估算结果  37-38
    3.2.4 检测匹配的质量  38-40
    3.2.5 种植烟叶对农户收入的效应  40-41
    3.2.6 不同得分匹配算法对效应评估结果的影响  41-42
  3.3 讨论  42-43
第4章 小结  43-45
参考文献  45-49
个人简历和研究成果  49-50
致谢  50

相似论文

  1. 股权代理成本和债务代理成本对现金股利政策的影响研究,F275
  2. 多分组资料倾向得分匹配法的研究,R195
  3. 基于积累线性模型的证券市场流动性度量模型,F224
  4. 城市快速路交通状态识别与预测研究,U491
  5. 不同缺失机制并存时偏倚校正的模拟研究,R195
  6. 新型农村合作医疗制度影响农民医疗服务利用的实证研究,F323.89
  7. 非随机对照试验倾向得分区间匹配法的探索与应用,R181.3
  8. 就业指导课对大学生就业概率的参与效应评估,G647
  9. 政府补贴对企业研发投资的影响研究,F273.1
  10. R&D税收优惠对企业创新的影响-基于国家认定企业技术中心的研究,F812.42
  11. 小额信贷对孟加拉国农村居民民生和自主权的影响-政府和非政府金融机构的比较研究,D735.4
  12. 为了孩子的教育去买房?-基于中国家庭追踪调查数据,G521
  13. 基于企业数据的风险投资与技术创新关系研究,F273.1
  14. 政府补贴对安徽企业出口行为有效性研究,F752.8
  15. 大学毕业生失业派生风险研究,F249.21
  16. 感性设计过程中的映射方法研究,TB472
  17. 信用评分模型的开发及probit回归在模型中的应用,F224
  18. 财务报表分析与中国股市超额收益的概率预测,F224
  19. 上市公司财务预警组合预测模型的应用研究,F275
  20. 市场对募集资金投向变更的反应的研究,F224

中图分类: > 经济 > 经济计划与管理 > 经济计算、经济数学方法 > 经济数学方法
© 2012 www.xueweilunwen.com