学位论文 > 优秀研究生学位论文题录展示
配置抽样和具有附加信息时随机化调查的改进
作 者: 汤荣
导 师: 闫在在
学 校: 内蒙古工业大学
专 业: 计算数学
关键词: 敏感问题 附加信息 条件Poisson抽样 配置抽样 条件配置抽样
分类号: O212.1
类 型: 硕士论文
年 份: 2013年
下 载: 8次
引 用: 0次
阅 读: 论文下载
内容摘要
在社会经济调查中,人们有时需要知道涉及个人隐私情况的具体数据,例如吸毒,赌博,堕胎,同性恋,偷税漏税等.调查者往往不愿意也很难通过直接问这类问题获得被调查者的真实回答.为了提高回答率,改善回答的真实性,Warner(1965)创造性的设计出随机化回答模型.许多学者在这一设计思想的启发下构造出一些新的敏感问题总体参数估计方法.基于敏感问题的特殊性,对于要调查的总体,往往都有一些记录,如医院会记录某些未婚女士的堕胎情况,政府部门会记录某些个人或者单位的偷税漏税数目,在做这类敏感问题的抽样调查之前,这些信息是可以合理利用的.至今为止没有学者考虑总体中部分个体敏感信息已知(我们称之为附加信息)时如何构造以及改进现有的估计量.本文主要工作是讨论当总体附加信息已知时,如何对敏感问题的总体参数进行估计.另外,有辅助信息的不等概率抽样设计通常效率较高,将包含概率与目标变量规模成比例的不放回不等概率抽样称为πPS抽样.该设计的样本单元不会重复,在实际中应用更广泛.长久以来,如何构造更高效πPS抽样设计是一个公开问题.一个好的πPS抽样设计不仅能实现预定的包含概率、样本容量固定,还能快速获得合格样本.Hajek(1981)设计的条件Possion抽样实现了样本容量固定的目标,但该设计的包含概率近似等于预定的包含概率,而且由于样本容量的不稳定性得到一个合格样本过于耗时.Joyce(1972)提出另一种严格πPS抽样设计,样本容量n也是随机的,称为配置抽样.配置抽样样本容量n的方差小于Poisson抽样样本容量的方差,总体总值的估计精度也有一定的优势.考虑到这些优良性,受条件Possion抽样设计思想的启发,本文我们提出一种新的称之为条件配置抽样的抽样设计:通过不断产生配置样本,直到其样本量实现了预定容量n时样本才被接受.一方面围绕建立该设计基本理论展开探讨研究,给出了条件配置抽样一阶、二阶包含概率的形式表达式,另一方面在几种经典的超总体模型下,从数值上说明与条件Possion抽样比较条件配置抽样在精度和实施上的优良性.第一章,对抽样调查、敏感问题调查方法和不等概率抽样设计的背景知识及相关定义进行了深入的调查分析.为了更好地理解本文,介绍涉及到的一些基本概念及相应的数学符号.第二章,综述了与本文研究方法相关的一些经典的抽样方法,如Warner(1965)随机化回答技术,Eichhorn(1983)扰动随机化回答模型,条件Poisson抽样、配置抽样、2PπPS抽样设计等.第三章,首次提出了利用附加信息提高敏感问题总体参数的估计的研究思路,推导出了属性敏感总体部分个体附加信息已知时总体参数的估计量,计算出了这一估计量的方差,估计量方差的估计,比较了新提出的估计量在精度上的得益,并将这一方法推广到更一般的情形.一个实例说明有附加信息的敏感属性问题总体比例估计的应用可能性.第四章,本章推导出了数量敏感问题部分个体附加信息已知时总体均值的估计量,计算出了这一估计量的方差,估计量方差的估计,比较了新提出的估计量在精度上的得益,并将这一方法推广到更一般的情形:假定总体中部分敏感个体与非敏感个体都已知,对应总体参数的估计.数值上比较新提出的方法与传统估计量之间的差异.第五章,首次提出条件配置抽样的思想,探讨并给出包含概率的形式表达式,数值上,在不同超总体模型下比较提出的方法与其他抽样方案如条件Poisson抽样的差异.第六章,总结了本文的主要工作以及有待于进一步改进研究的地方.
|
全文目录
摘要 3-5 Abstract 5-9 第一章 引言 9-13 1.1 研究背景 9-12 1.1.1 敏感问题抽样调查设计的主要工作 9-10 1.1.2 不等概率抽样设计的主要工作 10-11 1.1.3 不放回不等概率抽样 11-12 1.2 主要常用符号 12-13 第二章 一些经典抽样调查方法的回顾 13-21 2.1 几种经典敏感问题随机化调查方法 13-15 2.1.1 Warner随机化回答技术 13 2.1.2 Eichhorn扰动随机化回答模型 13-14 2.1.3 Sarndal(1972)方法 14-15 2.1.4 Zaizai方法 15 2.2 几种经典的不等概率抽样设计 15-21 2.2.1 Possion抽样 15-16 2.2.2 条件Possion抽样 16-17 2.2.3 2PπPS抽样 17-18 2.2.4 配置抽样 18-21 第三章 有附加信息的定性敏感问题总体比例的估计 21-31 3.1 本章的主要工作及符号定义 21-22 3.2 属性敏感总体中具有已知附加信息时总体比例的估计 22-25 3.3 附加信息包含敏感与非敏感属性个体时总体比例的估计 25-29 3.3.1 已知总体中敏感与非敏感属性个体各一个 25-26 3.3.2 已知总体中敏感与非敏感属性个体各M和R 26-29 3.4 一个实例 29-31 第四章 有附加信息时定量敏感问题总体均值的估计 31-37 4.1 本章的主要内容及相关定义 31-33 4.1.1 知总体中敏感与非敏感数量个体各一个 31 4.1.2 已知总体中敏感与非敏感数量个体各M和R 31-33 4.2 效率比较 33-35 4.2.1 理论比较 34 4.2.2 数值模拟 34-35 4.3 讨论 35-37 第五章 条件配置抽样 37-47 5.1 方法描述 37 5.2 包含概率理论推导的讨论 37-38 5.3 数值模拟 38-40 5.4 结论 40-47 第六章 总结与展望 47-49 参考文献 49-53 致谢 53-55 在读期间取得的科研成果 55
|
相似论文
- 敏感问题二阶段抽样调查的统计方法及应用,R195
- 线性模型中几种模型条件对统计结果的影响,O212.1
- 分类敏感问题分层二阶段抽样调查的统计方法及应用,R195.1
- 带有随机形式附加信息的线性模型的Bayes估计与试验设计,O212.8
- 公路货运资源合理配置理论研究,U492.3
- 低密度校验码的研究,TN911.2
- 聚类分析和最大似然法在医科大学生婚前性行为研究中的应用,G647.9
- 线性模型假设条件的影响分析,O212
- 聚类分析和随机应答技术在大学生婚前性行为调查中的应用,G647.9
- 相依样本下一类统计泛函的经验似然置信区间,O212.1
- Φ-混合样本下一类统计泛函的渐近性质,O212.1
- 随机化调查若干问题的研究,O212
- 相依数据的若干统计模型及分析,O211.67
- Kirchhoff板和Mindlin板上动态分布载荷的辨识问题的研究,O326
- NA样本下总体分位数和M-泛函的经验似然推断,O212.1
- 分类敏感问题分层抽样调查的统计方法及应用,R195
- 数量特征敏感问题RRT模型整群抽样调查的统计方法及其效度信度模拟评价,R181.3
- ACASI技术和CAPI技术应用于农村居民敏感问题调查中的比较研究,R195
- 敏感问题9种RRT模型下(分层)二阶段抽样调查设计的统计方法及其应用,R181.1
- 稀疏数据矩阵条件下应用公式法估计方差分量的影响因素研究,O212.1
- 贝叶斯方法下二值与多值序次数据模型与异常点的同时识别,O212.1
中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com
|