学位论文 > 优秀研究生学位论文题录展示
基于广义偏线性模型的40-65岁女性原发性骨质疏松症筛检工具研究
作 者: 田峰
导 师: 谢雁鸣
学 校: 中国中医科学院
专 业: 中西医结合临床
关键词: 原发性骨质疏松症 危险因素 中医证候 筛检工具 广义偏线性模型 隐树模型 支持向量机
分类号: R580
类 型: 博士论文
年 份: 2011年
下 载: 78次
引 用: 0次
阅 读: 论文下载
内容摘要
1目的1.1筛选出原发性骨质疏松症(primary osteoporosis, POP)发病的重要危险因素和中医证候要素,明确POP发病的重要影响因素。1.2建立基于广义偏线性模型(generalized partial linear model, GPLM)的、包括危险因素和中医证候要素内容的POP判别模型,为建立POP筛检工具提供数理模型依据。1.3初步建立符合北京、上海社区人群特征的POP筛检工具,为对POP高危人群进行筛查提供科学依据。2方法2.1 POP筛检问卷设计在导师课题组前期设计的《原发性骨质疏松症中医证候调查问卷》的基础上根据量表学和临床流行病学方法,结合骨质疏松症专家的临床经验,以及《中医内科常见病诊疗指南:西医疾病部分》中的中医证候辨证内容,增加了躯体症状条目,新加了生活习惯、发病相关因素等领域内容,制定了《社区40岁~65岁妇女骨质疏松危险因素及证候调查问卷》。整个筛检问卷包括一般信息、生活习惯、发病相关因素、躯体状况、临床体征等五个领域的内容,共65个条目,为封闭式设计。在调查实施前,由独立的中国中医科学院中医临床基础医学研究所伦理委员会对问卷内容进行论证,认为符合医学伦理要求。2.2调查人群筛选标准2.2.1纳入标准纳入:①女性;②年龄40~65岁;③意识清楚,可用言辞表达,有阅读能力,与调查人员沟通无障碍者;④经调查人员说明研究目的后,本人愿意接受筛检问卷调查和骨密度(bone mineral density, BMD)检测,并在“卷首页”签名同意者。2.2.2排除标准排除:①药物或其他疾病(如糖尿病、化脓性脊髓炎、肾炎、甲亢等)引起的继发性骨质疏松症;②有恶性肿瘤、痛风、类风湿性关节炎等疾病,影响中医证候判断者;③精神障碍、认知障碍者。2.3 POP诊断标准根据2008年中华中医药学会发布的《中医内科常见病诊疗指南:西医疾病部分》中BMD检测T值为骨质疏松定性诊断标准,取BMD检测报告单中腰椎L1-L4、股骨颈、股骨全区3个部位的最小T值,T值>M-1SD为骨量正常,M-1SD~2.0SD为骨量减少,<M-2.0SD以上为骨质疏松症。2.4数据来源2009年3月~8月期间,在上海市徐汇区凌云、华泾镇、长桥3家社区医疗服务中心,北京市东城区交道口、景山、朝阳、东华门、北新桥5家社区医疗服务中心,进行POP高危人群筛选,对符合本次调查纳入标准的人员进行现场问卷调查,并进行BMD检测。在上海社区共发放筛检问卷1101份,返回问卷1027份,经核实排除不合格问卷26份,得到合格问卷共1001份,占发放问卷数的90.92%。在北京社区共发放筛检问卷800份,返回问卷763份,经核实排除不合格问卷24份,得到合格问卷共739份,占发放问卷数的92.38%。应用课题组与北京科技大学合作开发的“骨质疏松症健康管理系统”网络数据采集平台(http://210.76.97.192:8080/gzss),将合格的问卷独立双录双核后,进行一致性检验,共获得1740例合格筛检问卷和BMD检测数据。2.5统计分析方法2.5.1统计分析软件应用SPSS 18.0 for Windows软件、SAS 9.2 for Windows软件和SPSS Climentine 12.0数据挖掘软件进行筛检问卷数据分析和统计建模,运用Lantern 1.5软件进行隐树模型分析。2.5.2筛检问卷信度和效度分析运用克朗巴赫α系数和Guttman折半系数法考核筛检问卷的信度,筛检问卷“躯体症状”领域条目的结构效度采用因子分析(factor analysis)方法。2.5.3 POP发病危险因素分析采用多分类logistic回归(multinomial logistic regression)方法分析POP发生与各危险因素之间的定量关系,建立多项logit模型(multinomial logit model),以初步筛选出影响POP发生的危险因素。2.5.4 POP中医证候要素分析运用隐树模型(latent tree model)方法,通过可见的“症状显变量”来探求内在的不可见的“证素隐变量”,并建立“证素隐变量”之间的隐树结构,分析POP的基本中医证候要素及其相互关系。2.5.5 POP判别模型的建构运用支持向量机(support vector machine, SVM)数据挖掘方法筛选出与骨质疏松发病相关的重要危险因素和中医症状为自变量,以BMD定性诊断为因变量,建立基于GPLM的POP判别模型。2.5.6 POP筛检工具的评价运用接收者工作特征曲线(receiver operating characteristic curve, ROC)评价筛检工具的判别准确度,通过ROC曲线下面积(area under the ROC curve, AUC)评价筛检工具诊断价值的大小。3结果3.1筛检问卷信度和效度评价3.1.1筛检问卷信度评价通过对筛检问卷“躯体症状”领域条目分析,肾阳虚证、肝肾阴虚证、脾肾阳虚证、血瘀证等4个维度的克朗巴赫系数α值分别为0.803、0.871、0.811和0.707,整个领域的克朗巴赫系数α值为0.913。“躯体症状”领域4个维度的Guttman折半信度值分别为0.789、0.831、0.743和0.699,整个领域的Guttman折半信度值为0.867。3.1.2筛检问卷效度评价采用因子分析方法,运用主成分法提取公因子,经过平均正交旋转法,迭代25次,KMO检验统计量为0.935(>0.5),Bartlett’s检验的近似χ2=18058.066,df=741,P<0.01。按特征根值>1提取其因子,共提取了10个因子,累积方差贡献率达到53.789%。3.2 POP发病危险因素的筛选3.2.1 POP发病相关因素一般描述经方差分析,年龄、体重指数、绝经年限在骨量正常、骨量减少和骨质疏松三类人群中的均数差异有统计意义(P<0.05)。经交叉表分析,肉类膳食、鱼类膳食、饮用咖啡、每天锻炼时间、是否变矮、是否绝经、怀孕次数、生产次数、骨折次数等在三类人群中的分布比例差异有统计意义(P<0.05)。3.2.2 POP发病危险因素的多项logit模型将肉类膳食、鱼类膳食、饮用咖啡、每天锻炼时间、是否变矮、是否绝经、怀孕次数、生产次数、骨折次数等9个影响因素作为自变量;绝经年限和体重指数作为协变量;以BMD定性诊断为因变量,以骨量正常人群作为参考分类标准,运用SPSS 18.0软件Multinomial Logistic过程逐步向前法(forward stepwise)建立多项logit模型。按α=0.05的标准,模型最终引入的变量有:绝经年限、体重指数、鱼类膳食、是否变矮、是否绝经和生产次数。3.3 POP中医证候要素分析3.3.1 POP躯体症状一般描述北京、上海两地总人群中,出现频率高于15%的躯体症状有:健忘、遇寒痛甚、腰膝酸软、恶热、乏力、畏寒、腰痛、易怒、脱发、纳呆、视物模糊、头晕、下肢骨痛、下肢困重、失眠、夜尿次数、小便清长、腿软、背痛、齿摇、目睛干涩、气短、便秘、多梦易惊、下肢抽筋、身痛、耳鸣、盗汗、尿频、口苦、手足烦热等。经方差分析和两独立样本t检验,按α=0.05的标准,畏寒、目睛干涩、齿摇、纳呆、腹胀、胸胁苦满、夜尿次数、下肢抽筋、下肢骨痛等9个症状在骨量正常和骨质疏松两类人群中的发生率差异有统计意义(P<0.05)。3.3.2 POP中医证候要素隐树模型分析利用启发式单重爬山算法学习得到BIC评分最高的隐树模型,其BIC评分为-15671。隐树模型中的显变量症状所展现的隐变量与POP常见的肾虚、肝虚、阳虚、阴虚、肾精不足、血瘀等基本证候要素特点相吻合,病变部位以肝肾两脏为主,病性以虚证为主3.4基于GPLM的POP判别模型建构和评价3.4.1 GPLM模型变量筛选采用支持向量机RBF核函数变量选择方法,筛选出12个对骨质疏松症有重要判别意义的变量,分别是:是否绝经、绝经年限、鱼类膳食、目睛干涩、驼背、体重指数、生产次数、下肢抽筋、下肢骨痛、腹胀、胸胁苦满、饮用咖啡等。3.4.2 GPLM模型参数估计综合多项logit模型筛选出来的危险因素和SVM方法筛选出来的中医症状变量为自变量,BMD定性诊断为因变量,构建GPLM模型。GPLM模型线性部分参数估计,是否绝经、体重指数、下肢抽筋、下肢骨痛、绝经年限(线性效应)的模型系数分别为:1.14182、-0.15805、0.36149、0.32267、0.12956,具有统计意义(P<0.05)。GPLM模型非线性部分估计,绝经年限(非线性效应)的检验χ2=13.5948,P=0.0012,具有统计意义(P<0.05)。3.4.3 GPLM模型评价用“是否绝经”、“下肢抽筋”、“下肢骨痛”“体重指数”4个危险因素和中医症状作为自变量,与因变量BMD定性诊断拟合线性logistic回归模型,其AUC值为0.7536,而拟合GPLM模型时加入了“绝经年限”的非线性效应,其AUC值为0.7971,提高了骨质疏松症人群的判别准确率,经检验,χ2=21.9162,P<0.001,具有统计意义(P<0.05),说明带有非线性效应的GPLM模型要优于线性logistic回归模型。3.5 POP筛检工具的建立和评价3.5.1 POP筛检工具的建立基于GPLM模型,将“是否绝经”、“绝经年限”和“体重指数”3个西医危险因素,“下肢抽筋”和“下肢骨痛”两个中医症状作为筛检工具的主要条目。将GPLM模型中各变量的参数估计值取Exp值,并取10倍值调整后得到筛检工具算式:Score=31.3×是否绝经+11.4×绝经年限-8.5×体重指数+14.4×下肢抽筋+13.8×下肢骨痛。3.5.2 POP筛检工具的评价筛检工具的AUC值为0.789(95%CI:0.766 to 0.812),与AUC=0.5相比较,检验Z值为21.482,P<0.0001,具有统计意义(P<0.05)。筛检骨质疏松的灵敏度为55.67%(95%CI:50.6% to 60.6%),特异度为84.62%(95%CI:82.0%-87.0%),阳性预测值为63.0%(95%CI:57.7% to 68.0%),阴性预测值为80.2%(95%CI:77.5%to82.8%),Youden指数为0.403。以-80为截断值,高危人群(Score≥-80)中,63.0%患有骨质疏松,37.0%骨量正常;低危人群中(Score<-80),仅19.8%患有骨质疏松,80.2%骨量正常。结果显示筛检工具具有较好的筛检骨质疏松和排除骨量正常人群的能力。4结论4.1绝经是POP的主要危险因素,低体重指数也是POP发病的危险因素;鱼类膳食和POP发病之间均存在负相关性,是POP的保护性因素。4.2下肢抽筋和下肢骨痛是POP发病的重要中医症状。肾虚、肝虚、阴虚、阳虚和血瘀是POP的基本中医证候要素。病变部位以肝肾两脏为主,病性以虚证为主。隐树分析方法可以弥补聚类分析在中医证候研究方法上的先天不足。4.3经过GPLM模型非参数部分的拟合检验,发现绝经年限与骨质疏松发病之间存在非线性效应。将西医危险因素和中医症状作为线性变量,绝经年限作为非线性变量,建立基于GPLM的POP判别模型,反映病证结合特点,与线性logistic回归模型相比,具有更好的判别准确性。4.4在POP筛检工具中,融入中医证候特色内容,具有较好的灵敏度和特异度,增加了筛检工具对骨质疏松高危人群的判别准确性,满足了骨质疏松中医临床实际应用的需要。
|
全文目录
中文摘要 8-14 ABSTRACT 14-21 英文缩略语表 21-22 第一部分:综述研究 国内外原发性骨质疏松症(POP)危险因素、判别模型和筛检工具综述 22-29 1 POP发病危险因素研究现状 22-23 2 POP中医证候研究现状 23-24 3 POP筛检工具研究现状 24-26 4 POP判别模型研究现状 26-27 5 POP筛检工具和判别模型研究中的问题和对策 27-29 第二部分:基于广义偏线性模型的40~65岁女性POP筛检工具研究 29-85 前言 29-30 研究思路和技术路线 30-31 1 研究思路 30 2 技术路线 30-31 研究内容一:POP筛检问卷的设计 31-33 1 目的 31 2 方法 31-32 3 结果 32-33 研究内容二:POP筛检问卷的测试 33-59 1 目的 33 2 方法 33-35 2.1 POP筛检问卷调查实施 33-34 2.1.1 调查人群筛选标准 33 2.1.2 POP高危人群筛选和调查 33-34 2.2 POP诊断标准 34 2.3 质量控制和数据录入 34-35 2.3.1 质量控制 34 2.3.2 数据录入 34-35 2.4 统计分析方法 35 3 结果 35-59 3.1 POP筛检问卷可行性、信度和效度评价 35-39 3.1.1 POP筛检问卷调查的可行性 35 3.1.2 POP筛检问卷信度评价 35-36 3.1.3 POP筛检问卷效度评价 36-39 3.2 POP筛检调查资料一般描述 39-44 3.2.1 北京、上海地区总人群一般特征分析 39-41 3.2.2 北京地区人群一般特征分析 41-43 3.2.3 上海地区人群一般特征分析 43-44 3.3 POP发病相关因素分析 44-52 3.3.1 年龄因素 44-45 3.3.2 生活习惯 45-49 3.3.3 体重 49 3.3.4 身高 49 3.3.5 体重指数 49-50 3.3.6 吸烟情况 50 3.3.7 饮酒情况 50 3.3.8 月经情况 50-51 3.3.9 孕产次数 51-52 3.3.10 骨折次数 52 3.4 POP躯体症状特征分析 52-58 3.4.1 北京、上海地区总人群躯体症状频数分布 53 3.4.2 三类人群躯体症状频数分布和发生频率比较检验 53-56 3.4.3 北京地区人群躯体症状频数分布 56-57 3.4.4 上海地区人群躯体症状频数分布 57-58 3.5 POP临床体征分析 58-59 3.5.1 驼背 58 3.5.2 面色 58 3.5.3 精神状态 58 3.5.4 舌体 58-59 3.5.5 舌苔 59 研究内容三:POP筛检工具的建立与评价 59-85 1 目的 59 2 方法 59-62 2.1 多项logit模型 60 2.2 隐树模型 60-61 2.3 支持向量机 61 2.4 广义偏线性模型 61 2.5 接收者工作特征曲线 61-62 2.6 统计分析软件 62 3 结果 62-78 3.1 POP发病危险因素的多项logit模型 62-64 3.1.1 多项logit模型变量的选择 62-63 3.1.2 多项logit模型的拟合 63-64 3.1.3 多项logit模型的评价 64 3.2 POP中医证候要素的隐树模型 64-72 3.2.1 模型变量的选择 64-65 3.2.2 POP隐树模型结构 65 3.2.3 POP隐树模型中隐变量的诠释 65-68 3.2.4 POP隐树模型中隐类的解释 68-72 3.3 基于GPLM的POP判别模型 72-76 3.3.1 基于支持向量机的GPLM模型变量筛选 72-73 3.3.2 GPLM模型非参数部分的选择 73-74 3.3.3 GPLM模型参数部分估计 74 3.3.4 GPLM模型非参数部分估计 74-75 3.3.5 GPLM模型的判别效果 75-76 3.4 POP筛检工具的建立和评价 76-78 3.4.1 POP筛检工具的建立 76-77 3.4.2 POP筛检工具的评价 77-78 4 讨论 78-85 4.1 POP发病的相关因素讨论 78-80 4.1.1 绝经对POP发病的影响 78-79 4.1.2 体重指数对POP发病的影响 79-80 4.1.3 鱼类膳食对POP发病的影响 80 4.2 POP的中医证候要素讨论 80-82 4.2.1 POP的重要中医躯体症状 80-81 4.2.2 POP的基本中医证候要素 81 4.2.3 聚类分析方法在中医证候研究中的不足 81 4.2.4 现有隐树模型算法在中医证候研究中的局限性 81-82 4.3 GPLM模型相关讨论 82 4.3.1 GPLM模型的优点 82 4.3.2 GPLM模型的不足 82 4.4 POP筛检工具讨论 82-85 4.4.1 国外POP筛检工具的不足之处 83 4.4.2 中医证候内容对POP筛检工具判别准确性的影响 83-85 结语 85-86 参考文献 86-93 致谢 93-95 个人简历 95-98 附录1:北京、上海社区40~65岁妇女原发性骨质疏松症筛检工具 98-99 附录2:查新报告 99-106
|
相似论文
- 慢性结石性胆囊炎胆囊切除术后腹泻的研究与分析,R657.4
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 慢性阻塞性肺病合并骨质疏松症与中医肾虚证的相关性研究,R259
- 痛风方治疗急性痛风性关节炎(湿热蕴结证)的临床观察,R259
- 中西医结合治疗对老年高血压患者中医证候及生活质量的影响,R544.1
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 围绝经期高血压不同中医证型与性激素、心血管相关危险因素关系的研究,R259
- 合肥市0-6岁儿童血铅现况调查及低水平铅暴露影响因素分析,R179
- 影响慢性肾脏病住院患者肾功能进展的危险因素分析(附348例分析),R692
- 合肥市手足口病流行状况及高危人群危险因素分析,R725.1
中图分类: > 医药、卫生 > 内科学 > 内分泌腺疾病及代谢病
© 2012 www.xueweilunwen.com
|