学位论文 > 优秀研究生学位论文题录展示
胃食管反流病流行病学调查及其缺失数据的处理方法研究
作 者: 王睿
导 师: 贺佳
学 校: 第二军医大学
专 业: 流行病与卫生统计学
关键词: 胃食管反流病 流行病学调查 缺失数据 多重填补
分类号: R571
类 型: 博士论文
年 份: 2009年
下 载: 304次
引 用: 2次
阅 读: 论文下载
内容摘要
【目的】胃食管反流病(gastroesophageal reflux disease,GERD)是指过多的胃、十二指肠内容物反流入食管引起的烧心等症状,并可导致食管炎和咽、喉、气道等食管以外的组织损害。该病在西方国家比较常见,相比较而言,该病在我国的发病率相对较低。但是,目前全球GERD的发病率不断上升,在亚洲,这种趋势也引起了人们越来越多的关注。在世界范围内很多国家都进行了该病的大规模的流行病学调查,但中国国内尚无全国范围的调查。缺失数据在流行病学调查中很常见,但在实际应用中,很少有研究对缺失数据进行处理。本研究拟进行一项大规模的胃食管反流病的流行病学调查,并比较不同的缺失数据处理方法,最后采用合适的方法对本次调查中的缺失数据进行处理,以估计中国人口中GERD的人群患病率,探讨GERD的危险因素,了解GERD对生活质量和睡眠情况的影响,并为流行病学调查缺失数据的处理提供方法学支持。【方法】本研究首先在上海进行预调查,随机抽取了1200名城乡居民进行调查,分析测量工具的信度、效度,建立可行、可靠、可比的GERD流行病学调查工具,并评估GERD的患病率。在总结预调查经验的基础上,于2007年4月开始在全国五城市(北京、上海、西安、武汉、广州)进行调查,到2008年1月结束,历时10个月。调查采用了多阶段分层随机抽样的方法,按照区/县-街道/镇-居委会/村的顺序在五城市内抽取18000名18-80岁的城乡居民。调查采用自填式的方法,由被调查者自己填写问卷,必要时由经过相关培训的调查人员给予解释。调查内容包括基本情况及中文版的反流疾病调查问卷(Reflux Disease Questionnaire,RDQ)、简化的ROMEⅡ两个量表;另外,20%的被调查者还填写了SF-36健康调查问卷(36-item Short Form Health Survey,SF-36)和嗜睡评价量表(Epworth Sleepiness Scale,ESS),并进行了体格检查;上海的被调查者还进行了抽血检查,其中的志愿者进行了胃镜检查。调查督察员在调查过程中对调查员的工作质量进行督导和协调。调查结束后,资料双份录入并进行清理。在清理后数据的基础上,选取部分变量建立不同数据类型的完整数据集,得到参数模型,估计该模型的各参数及其标准误,并在此基础上建立不同缺失模式、不同缺失程度的缺失数据集并模拟100次,采用删除法、哑变量调整法、条件均数填补法、热平台填补法、多重填补法等方法进行处理,得到相应模型各参数及其标准误的估计值的均数,比较不同方法的优劣,找出不同条件下合适的处理方法,并针对调查数据采取合适的缺失数据处理方法,对填补后的数据进行分析,以了解GERD的发病情况,探讨GERD对生活质量和睡眠情况的影响。【结果】结果显示,对于连续变量,不论是单调缺失还是任意缺失,缺失率较低时,删除法效果较好,缺失率较高时,多重填补方法较好;对于分类资料,删除法的效果较好,MI的填补效果并不如填补连续变量时好;在处理多类型资料时,缺失率较低时,删除法效果较好,缺失率较高时,多重填补法显示其优越性,但需要多次填补才能达到较好效果,但也不是填补次数越多越好,有时填补20次的效果还不如填补10次的效果。缺失率在50%时,几种方法的效果都不是很稳定,填补后的结果上下波动很大。处理李克特量表资料时,条目均数填补法、多重填补的效果都不错,其次是自身均数填补法,删除法的填补效果一般。对填补后的数据进行分析,根据RDQ,基于Montreal定义,GERD患病率为3.08%,反流的每周发生率是4.23%,烧心每周发生率是1.83%。相对上海,武汉、西安的GERD患病率较高,广州、北京与上海的患病率无差别。农村的患病率高于城市,且随着年龄的增长,患病率逐渐增高。性别、工作、婚姻、家庭月收入、吸烟和饮酒并没有发现与GERD患病有关。虽然很多研究认为BMI是GERD的危险因素,但本研究并没有发现。另外发现功能性消化不良、吞气症、IBS、功能性腹胀、功能性便秘、非特异性功能性肠病、胆囊功能障碍与GERD关系密切,与预调查的结果一致。与其他相关研究相比,本次调查得到的人群的总体生活质量比其他研究高。相对于正常组,GERD组的自评健康水平较低,生活质量也有明显降低,八个维度都有损害,且差别都有临床意义。而在生理领域的RP、BP、GH三个维度的损害最厉害,心理领域的RE维度的差异也较大。在完成SF-36量表的3214名被调查者中,基于GERD定义,有110名被诊断为GERD患者,RDQ分数越高,SF-36分值越低,即GERD相关症状越严重,生活质量越差。比较GERD组与正常组之间ESS分值,两组之间差别显著,GERD组中的ESS分值明显较高,说明嗜睡情况比较严重。按照ESS总分在0-9之间为正常,10-12分之间为临界,13-24分之间为嗜睡进行分组,比较两组差别,结果显示,GERD组中嗜睡比例明显高于正常组,有26.36%的人嗜睡,而正常组中的人只有13.34%。【结论】多重填补是一种比较稳定的缺失数据填补方法,但也并不一定是处理缺失数据的最好办法,要根据实际情况、考虑数据特征和缺失方式,谨慎的选择合适的方法。本次调查显示,中国胃食管反流病的发病率不高,远低于西欧国家,在影响因素、合并疾病方面都有其自身的特点。该病造成了生活质量的显著下降,且影响了患者的睡眠,导致了白天的嗜睡,应引起人们足够的重视。
|
全文目录
摘要 6-10 ABSTRACT 10-14 主要英文缩写词表 14-16 第一章 前言 16-22 一、研究背景 17-18 二、研究内容与方法 18-19 三、研究目的与意义 19-22 第二章 流行病学调查 22-60 一、目的 23 二、上海预调查 23-38 (一) 调查方法与过程 23-26 (二) 调查结果 26-36 (三) 建议 36-38 三、全国五城市调查 38-60 (一) 调查目的 38 (二) 调查方法与过程 38-44 (三) 调查结果 44-60 第三章 数据缺失概述 60-68 一、流行病学调查中数据的缺失及其原因. 61-62 二、数据缺失机制及模式 62-64 (一) 数据缺失机制 62 (二) 数据缺失模式 62-64 三、传统数据填补方法 64-68 (一) 推理填补法 64 (二) 删除法 64 (三) 均数填补法 64-65 (四) 回归填补法 65 (五) 末次观测值结转法 65-66 (六) 热平台填补法 66 (七) 冷平台填补 66 (八) 最近邻填补 66 (九) 哑变量调整法 66-68 第四章 多重填补 68-74 一、多重填补介绍 69-70 二、多重填补方法 70-74 (一) 回归填补法 70 (二) 预测均数匹配法 70 (三) 趋势得分法 70-71 (四) 马尔科夫链蒙特卡罗法 71-72 (五) 判别分析 72 (六) Logistic 回归法 72-73 (七) 小结 73-74 第五章 缺失数据填补方法比较 74-108 一、连续变量 75-84 (一) 单调缺失模式 75-80 (二) 任意缺失模式 80-84 二、分类变量 84-90 (一) 单调缺失模式 84-87 (二) 任意缺失模式 87-90 三、多类型资料 90-98 (一) 单调缺失模式 90-94 (二) 任意缺失模式 94-98 四、量表资料 98-106 五、小结 106-108 第六章 结果 108-124 一、患病率 109-112 二、生活质量 112-120 三、GERD 与嗜睡 120-124 第七章 讨论 124-130 一、流行病学调查 125-127 (一) 调查过程 125 (二) 调查结果 125-127 二、数据填补 127-128 三、研究特色和创新点 128-129 四、尚待完善的问题 129-130 文献综述 130-138 参考文献 138-144 发表文章 144-146 致谢 146
|
相似论文
- 河南省樱桃谷鸭乙型肝炎病毒(DHBV)分子流行病学调查及FNC抗DHBV体内试验研究,S858.32
- 江苏地区白斑综合征分子流行病学调查,S945.1
- 针对零膨胀超散度计数数据的统计推断,C81
- 芜湖地区猪“高热病”流行病学调查与防控,S858.28
- IHHN、TS的流行病学调查和TSV结构蛋白VP1、VP3相互作用的研究,S945
- 黛力新联合埃索美拉唑、伊托必利治疗老年RGERD的临床疗效观察,R571
- 安徽省部分地区乙型肝炎分子流行病学初步研究,R512.62
- 上海地区人群夜尿症的患病率及危险因素分析,R691
- 鳞状上皮细胞间隙与非糜烂性胃食管反流病症状关系的研究,R571
- 江苏省规模化猪场PCV-2流行病学调查与断奶仔猪多系统衰竭综合症的防制,S858.28
- 基于SARIMA与神经网络混合模型的桥梁健康监测系统缺失数据填补,TP183
- 长沙市2-4岁儿童婴幼儿龋流行情况调查及相关因素的研究,R788.1
- 湖南省居民牙齿磨损及咀嚼槟榔与牙齿磨损关系的流行病学调查,R781.2
- 湖南省居民楔状缺损及咀嚼槟榔与楔状缺损关系的流行病学调查,R783
- 胃食管反流病相关危险因素分析,R571
- 保和丸加味联合西药治疗胃食管反流病痰浊中阻证的疗效观察,R259
- 云南省澜沧江下游地区钩端螺旋体病流行病学调查研究,R181.3
- 数据缺失及相关因素对逐步回归变量筛选的影响,R181.3
- 深圳市高血压、糖尿病患者就医流向影响因素研究,R197.1
- 缺失数据的贝叶斯模型处理,C811
- 基于贝叶斯方法的缺失数据补全研究,TP311.13
中图分类: > 医药、卫生 > 内科学 > 消化系及腹部疾病 > 食管疾病
© 2012 www.xueweilunwen.com
|