学位论文 > 优秀研究生学位论文题录展示

敏感问题9种RRT模型下(分层)二阶段抽样调查设计的统计方法及其应用

作 者: 濮翔科
导 师: 高歌
学 校: 苏州大学
专 业: 流行病与卫生统计学
关键词: 敏感问题 随机应答技术(RRT) 艾滋病 (分层)二阶段抽样 样本大小
分类号: R181.1
类 型: 博士论文
年 份: 2012年
下 载: 32次
引 用: 0次
阅 读: 论文下载
 

内容摘要


目的:敏感问题由于具有高度私人机密性或不便在公开场合表态和陈述,若采用直接询问等传统的调查方式,会产生无应答偏倚或故意说谎偏倚。为了提高敏感问题的正确应答率,国内外统计学家研究开发出了一系列关于敏感问题调查的随机应答技术(Randomized Response Technique, RRT)模型。目前,国内外研究较多的敏感问题类型为二项选择敏感问题和数量特征敏感问题,而对于多项选择敏感问题较少关注;研究较多的敏感问题抽样调查的统计方法主要局限于简单随机抽样,实际应用也主要局限于小范围特殊人群小样本的简单随机抽样调查,或在大规模调查中将复杂抽样调查方法获取的敏感问题资料误用简单随机抽样调查有关公式来统计分析;抽样调查是重要的研究方法,抽样设计是抽样调查的关键,样本大小的估计是抽样设计的重要环节。但关于敏感问题随机应答模型在各种复杂抽样方法下各阶段样本大小的估计,目前相关文献仍较少见。有鉴于此,本文拟对9种随机应答模型与二阶段抽样及分层二阶段抽样2种抽样方法组合的共18种调查方法,在给出敏感问题特征相关统计量计算公式的基础上,当限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例及总体均数时的最优样本大小计算公式,为适用于各类型敏感问题较大规模或大规模调查的复杂抽样方法提供了科学的样本大小估计公式;通过对北京市男同性恋人群敏感问题特征的初步调查分析,为掌握北京市性病、艾滋病的流行趋势提供了初步的数据,并估计出样本大小计算公式中的有关统计量的数值;针对本团队拟于2013年开展的国家自然科学基金项目《敏感问题高危人群基数调查估计的统计方法及其应用》(编号:81273188)研究中北京市男同性恋人群基数及敏感问题特征的二阶段与分层二阶段抽样调查,按本文所推导的计算公式估计出各层各阶段的样本大小,完成该国家自然科学基金项目研究中的调查设计;对科学估计艾滋病高危人群基数及敏感问题的特征提供统计方法,为有关部门制订性病、艾滋病预防控制规划、措施提供科学依据。方法:一、对二项选择敏感问题Warner随机应答模型、二项选择敏感问题Simmons随机应答模型、二项选择敏感问题双无关问题模型和二项选择敏感问题改进的随机应答模型,多项选择敏感问题单一样本随机应答模型、多项选择敏感问题随机间接应答模型以及数量特征敏感问题无关联问题模型、数量特征敏感问题加法模型、数量特征敏感问题乘法模型9种随机应答模型,与二阶段抽样、分层二阶段抽样2种抽样方法组合的共18种调查方法,根据Cochran的经典抽样理论、全概率公式、均数的基本性质、方差的基本性质等概率论与数理统计学理论方法,给出了敏感问题总体比例、总体均数的估计量及其估计方差的计算公式。二、分别对以上18种调查方法,在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,使用哥西不等式、求条件极小值点等高等代数与高等数学的方法,从数学上推导出估计敏感问题特征总体比例、总体均数时各阶段的最优样本大小计算公式。三、设计RRT的随机化装置,制定敏感问题的调查问卷,采用二项选择敏感问题Simmons模型、多项选择敏感问题随机应答模型、数量特征敏感问题加法模型及二阶段抽样、分层二阶段抽样方法,于2010年8月至2010年10月对北京市男男性行为人群(men who have sex with men, MSM)进行初步调查;并按本文给出的统计公式,对调查资料作初步的统计分析并估计出样本大小计算公式中的有关统计量的数值。四、根据本文推导的敏感问题复杂抽样方法下的样本大小计算公式和初步调查得到的有关统计量的数值,对二项选择敏感问题Simmons模型、多项选择敏感问题随机应答模型、数量特征敏感问题加法模型下共10个敏感问题的二阶段抽样与分层二阶段抽样,分别计算在限定抽样误差的值使调查费用达到最小时所需各阶段最优样本大小和限定调查费用的值使抽样误差达到最小时所需各阶段最优样本大小。结果:一、本文设计了9种随机应答模型与二阶段、分层二阶段2种抽样方法组合的18种调查方法,分别对18种调查方法,给出了敏感问题总体比例、总体均数的估计量及其估计方差计算公式。二、本文分别对9种随机应答模型与2种复杂抽样方法组合的18种调查方法,当限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例、总体均数的各阶段最优样本大小计算公式。三、本文对北京市男男性行为人群进行了敏感问题3种随机应答模型下二阶段抽样、分层二阶段抽样的初步调查。其中二阶段抽样得到如下主要初步调查结果:北京市MSM人群首次男男性行为的年龄均数为21.9岁、标准误为0.1792岁;男男性行为月人均不同性伴人数2.79人,标准误为0.0860人;月人均男男性行为次数为4.8次,标准误为0.1587次;最近一次肛交男男性行为安全套全程使用的比例为77.63%,标准误为1.82%;上月男男性行为中从不全程使用安全套、有时全程使用安全套、每次全程使用安全套、没有肛交的比例分别为6.07%、29.16%、55.60%、8.86%,其标准误分别为0.93%、1.30%、1.84%、1.10%;男男商业性性行为的次均费用<200元、200-399元、400-599元、600元以上的比例分别为2.60%、3.18%、0.88%、5.99%,其标准误分别为0.57%、1.05%、0.35%、0.65%;最近一年HIV病毒检测结果为阳性、结果不确定、没有检查过的比例分别为4.89%、1.31%、4.22%,其标准误分别为1.05%、0.54%、1.26%;最近一年性病检测结果有性病、无性病、没有检查过的比例分别为14.58%、77.49%、7.38%,其标准误分别为1.70%、2.37%、1.45%;男男性行为的方式为肛交、口交的比例分别为69.23%、15.57%,其标准误分别为2.21%、1.79%;安全套使用有破损的比例为3.53%,其标准误为0.92%。四、针对本团队拟于2013年开展的国家自然科学基金项目《敏感问题高危人群基数调查估计的统计方法及其应用》(编号:81273188)研究中北京市男同性恋人群基数及敏感问题特征的二阶段与分层二阶段抽样调查,根据本文给出的公式和调查结果,计算出各层各阶段样本大小的估计值。1、二阶段抽样:第一阶段需抽取的区县数n1=13,第二阶段平均每个区县需抽取的男男性行为者人数n2=129(人)。2、分层二阶段抽样:第一层(15-29岁层)需抽取的区县数n11,=8,平均每个区县需抽取的男男性行为者人数n21=121(人);第二层(30-49岁层)需抽取的区县数n12=8,平均每个区县需抽取的男男性行为者人数n22=113(人)。结论:一、本文对敏感问题9种随机应答模型与二阶段、分层二阶段2种抽样方法组合的共18种调查方法,给出了敏感问题特征总体比例、总体均数的估计量及其估计方差的统计公式,并将其中三种随机应答模型的二阶段与分层二阶段抽样调查方法成功应用于北京市男男性行为人群这一性病、艾滋病高危人群的敏感问题预调查,取得了良好的实际应用效果。说明本文提供的调查方法及其统计公式科学、可靠、有效,具有广泛的应用前景。二、预调查结果提示北京市男男性行为人群存在无固定性伴、肛交为主要性行为方式、全程使用安全套比例低、男男商业性性行为比例高(分层二阶段抽样结果达到6.11%)、未进行HIV病毒与性病检测比例高、安全套破损比例高(分层二阶段抽样结果达到5.43%)等艾滋病、性病高危性行为,性病艾滋病的防控形势不容乐观,应引起政府、卫生部门的高度重视,寻找合理的应对措施。三、本文对敏感问题9种随机应答模型与二阶段、分层二阶段2种抽样方法组合的共18种调查方法,在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例、总体均数的各层各阶段最优样本大小计算公式,为敏感问题的抽样调查设计提供了科学的新方法。采用3种随机应答模型与二阶段、分层二阶段2种抽样方法组合的6种调查方法及本文推导的公式,对北京市男男性行为人群基数及敏感特征的调查估计了各层各阶段所需的最优样本大小,具有广泛的应用前景和推广意义。

全文目录


中文摘要  4-8
Abstract  8-13
目录  13-15
引言  15-19
第一部分 敏感问题(分层)二阶段抽样调查设计的统计方法  19-90
  1. 二项选择敏感问题Warner模型的二阶段抽样  19-22
  2. 二项选择敏感问题Simmons模型的二阶段抽样  22-25
  3. 二项选择敏感问题双无关问题模型的二阶段抽样  25-29
  4. 二项选择敏感问题改进的随机应答模型的二阶段抽样  29-32
  5. 多项选择敏感问题单一样本随机应答模型的二阶段抽样  32-35
  6. 多项选择敏感问题随机间接应答模型的二阶段抽样  35-38
  7. 数量特征敏感问题无关联问题模型的二阶段抽样  38-42
  8. 数量特征敏感问题加法模型的二阶段抽样  42-45
  9. 数量特征敏感问题乘法模型的二阶段抽样  45-48
  10. 二项选择敏感问题Warner模型的分层两阶段抽样  48-52
  11. 二项选择敏感问题Simmons模型的分层两阶段抽样  52-56
  12. 二项选择敏感问题双无关问题模型的分层两阶段抽样  56-62
  13. 二项选择敏感问题改进随机应答模型的分层两阶段抽样  62-66
  14. 多项选择敏感问题单一样本随机应答模型分层二阶段抽样  66-71
  15. 多项选择敏感问题随机间接应答模型的分层二阶段抽样  71-75
  16. 数量特征敏感问题无关联问题模型的分层二阶段抽样  75-80
  17. 数量特征敏感问题加法模型分层二阶段抽样  80-85
  18. 数量特征敏感问题乘法模型分层二阶段抽样  85-90
第二部分 北京市男男性行为人群的(分层)二阶段抽样调查  90-144
  1. 前言  90-91
  2. 调查设计  91-93
  3. 调查和结果分析  93-144
第三部分 北京市男男性行为人群基数及性行为特征抽样调查样本大小的估计  144-179
  1. 二阶段随机抽样样本大小的计算  144-158
  2. 分层二阶段随机抽样样本大小的计算  158-178
  3. 最终样本大小的确定  178-179
讨论  179-183
总结与展望  183-185
参考文献  185-191
综述  191-209
  参考文献  201-209
攻读博士学位期间主要科研成果  209-210
附录  210-213
致谢  213

相似论文

  1. 楚雄市CSW人群艾滋病综合干预效果及其影响因素研究,R193
  2. 四川省西昌市静脉吸毒人群HIV/HCV/HBV/梅毒新发感染及高危行为变化的研究,R181.3
  3. 敏感问题二阶段抽样调查的统计方法及应用,R195
  4. 东北地区艾滋病感染者组织社会救助功能研究,R193
  5. 常熟市艾滋病与结核病双重感染情况分析,R512.91
  6. HAART治疗一年对HIV/AIDS患者Th17和Treg细胞的平衡状态及其IL-17的影响,R512.91
  7. 天津市男男性行为人群HIV和梅毒感染风险的研究,R181.3
  8. 艾滋病咳嗽的中医临床证候特点研究,R259
  9. 吉林省艾滋病疫情估计和预测,R512.91
  10. 分类敏感问题分层二阶段抽样调查的统计方法及应用,R195.1
  11. 一种基于智能体的吸毒者艾滋病空间传播模型研究,R181.3
  12. 云南省艾滋病时空分析系统的研究与开发,R181.3
  13. 基于多智能体与GIS集成的艾滋病传播仿真建模技术研究,O242.1;P208
  14. GIS与艾滋病疫情灰色预测模型的集成研究,P208;N941.5
  15. 双萘酰亚胺类衍生物的合成及抗HIV-1活性的初步研究(Ⅰ),R96
  16. 四川省宁南县艾滋病流行病学调查,R181.3
  17. 上海市计生和卫生系统开展艾滋病VCT&VCR服务现况研究,R193
  18. 综合医院医务人员主动提供HIV检测咨询(PITC)的可行性研究,R512.91
  19. 江苏省艾滋病疫情的估计和预测,R181.8
  20. 电喷雾质谱法研究鸟嘌呤四链DNA的结构性质,O629.7
  21. 核酸扩增技术在血液筛查中的应用研究,R440

中图分类: > 医药、卫生 > 预防医学、卫生学 > 流行病学与防疫 > 流行病学基本理论与方法 > 基本理论
© 2012 www.xueweilunwen.com