学位论文 > 优秀研究生学位论文题录展示

基于MeSH主题词关联规则的医学热点挖掘研究-以哮喘为例

作 者: 杜兆淳
导 师: 许建业
学 校: 南京农业大学
专 业: 图书馆学
关键词: MeSH主题词 关联规则 数据挖掘 知识发现 哮喘 研究热点
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 32次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在当今信息爆炸的社会,生物医学作为21世纪的重点研究领域,其文献增长速度惊人。但面对数量庞大的文献,人们不再满足于对数据库中的数据进行检索存取等简单操作,而是希望计算机自动智能地分析数据库中的大量数据,以揭示隐藏在这些数据中的更重要信息,即关于这些数据整体特征的描述及对其发展趋势的预测。本研究尝试使用关联规则方法对哮喘相关文献挖掘其近年的研究热点,目的在于寻求一种效果比较理想的计算机处理文献方法分析特定专题领域的研究热点,解决依靠人工阅读工作量过大和人工分析具有主观性的问题。本研究以PubMed数据库中2004-2008年发表的以哮喘为主题的文献作为研究对象。下载文献的XML题录,提取各篇文献的主题词和对应副主题词,并统计主题词/副主题词出现的频次,截取频次大于100的主题词作为高频主题词。高频主题词和各篇文献形成词篇矩阵,利用SPSS Clementine软件做关联规则挖掘,生成规则800余条。构建高频主题词共现矩阵,利用SPSS统计软件对矩阵做层次聚类。分析出哮喘研究热点的6大领域。然后依据聚类树状图最底层两两合并的主题词,在各自作为前件的关联规则中找出高置信度的共同后件,组成形如(主题词A/主题词B)→主题词C的“共同关联规则”。通过“共同关联规则”分析各领域的研究热点。哮喘的研究热点集中在6大领域:(1)哮喘免疫学发病机制;(2)哮喘诱因及流行病学;(3)气道重塑;(4)哮喘诊断与评估;(5)哮喘治疗;(6)职业性哮喘。通过“共同关联规则”分析得到的各领域的研究热点详见文内。检索SCI影响因子大于3.8的呼吸系统核心期刊2004-2008期间发表的哮喘相关文献,通过人工阅读文摘对文献主题内容提取并分类,结果发现90%以上的文献的主题内容在本研究总结的研究热点中出现。本研究利用关联规则分析方法对哮喘相关文献进行研究热点挖掘分析,具有较好的准确度,为计算机处理文献分析特定专题领域的研究热点做出了一个新的尝试。相对于成熟的共词聚类分析方法,本研究在其基础上能赋予更多的主题词之间关系,能更加具体地分析研究热点。

全文目录


摘要  8-9
ABSTRACT  9-11
第一章 绪论  11-27
  1.1 研究背景  11-12
  1.2 研究内容  12
  1.3 研究意义  12
  1.4 知识发现数据挖掘概述  12-16
  1.5 对医学文献数据库知识发现的研究现状  16-19
    1.5.1 非相关文献发现  16
    1.5.2 关联规则  16-17
    1.5.3 共词分析  17-18
    1.5.4 共篇分析  18-19
  1.6 数据挖掘研究现状  19-27
    1.6.1 关联规则挖掘  19-20
    1.6.2 分类挖掘  20-23
    1.6.3 聚类挖掘  23-27
第二章 实验基于理论及假设  27-43
  2.1 MeSH主题词代表文献的内容特征  27-32
    2.1.1 MeSH的组成  27-30
    2.1.2 MeSH词表的特点  30-31
    2.1.3 以MeSH主题词为对象对文献进行挖掘  31-32
  2.2 主题词共现分析揭示词间关系的紧密  32
  2.3 共词聚类分析是以词间关系紧密程度对主题词群聚  32-35
    2.3.1 聚类  32-33
    2.3.2 层次聚类法  33-35
    2.3.3 共词聚类分析对MeSH主题词大体归类  35
  2.4 关联规则发现主题词之间的联系  35-43
    2.4.1 关联规则的基本概念  36-37
    2.4.2 Apriori算法  37-41
    2.4.3 关联规则揭示主题词间的关系  41-43
第三章 实验设计  43-47
  3.1 实验目的  43
  3.2 实验思路  43
  3.3 实验步骤  43-46
  3.4 实验工具介绍  46-47
第四章 实现与分析  47-75
  4.1 数据预处理  47-50
    4.1.1 获取原始数据  47-49
    4.1.2 提取关键数据  49
    4.1.3 数据清洗  49-50
    4.1.4 降维  50
  4.2 关联规则的生成  50-53
    4.2.1 构建词篇矩阵  50-51
    4.2.2 关联规则挖掘处理  51-53
  4.3 聚类  53-63
    4.3.1 构建词词矩阵  53
    4.3.2 聚类运算  53-63
  4.4 实验数据整合  63-65
  4.5 实验结果分析  65-72
    4.5.1 哮喘免疫学发病机制  65-66
    4.5.2 哮喘诱因及流行病学  66-68
    4.5.3 气道重塑  68
    4.5.4 哮喘诊断与评估  68-69
    4.5.5 哮喘治疗  69-71
    4.5.6 职业性哮喘  71-72
  4.6 实验结果验证  72-75
第五章 总结与展望  75-79
  5.1 实验讨论  75-76
  5.2 本研究的成果与意义  76
  5.3 本研究的创新  76
  5.4 本研究的不足  76
  5.5 后续研究展望  76-79
参考文献  79-85
致谢  85

相似论文

  1. 基于数据挖掘技术的保健品营销研究,F426.72
  2. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  3. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  4. 维生素A联合BCG早期干预对成年后SD哮喘大鼠肺部CD11C+和抗OVA-IgE的影响,R562.25
  5. 维生素A不同给药途径对持续性哮喘大鼠CD4~+CD25~+调节性T细胞及IL-4、IFN-γ细胞因子的影响,R562.25
  6. 维生素A和孟鲁司特对哮喘大鼠气道炎症细胞及Th1/Th2平衡的影响,R725.6
  7. Bicluster数据分析软件设计与实现,TP311.52
  8. 基于变异粒子群的聚类算法研究,TP18
  9. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  10. 基于遗传算法和粗糙集的聚类算法研究,TP18
  11. 穴位埋线对哮喘模型大鼠IL-4等影响的实验研究,R245
  12. 支气管哮喘不同发病阶段IL-18、IL-33等炎性因子水平与肺功能相关性研究,R562.25
  13. 三位一体支气管哮喘教育管理模式对患者控制现状和认知程度的评估,R562.25
  14. 盐酸丙卡特罗加吸入糖皮质激素治疗咳嗽变异性哮喘的临床研究,R562.25
  15. 体内特异性阻断白介素17在BALB/c小鼠已建立哮喘模型中作用的研究,R562.25
  16. 支气管哮喘急性发作期一氧化氮呼气检测与血清ECP、IL-13、IL-8的关系,R562.25
  17. 健康教育管理对哮喘控制影响的Meta分析,R562.25
  18. 哮喘小鼠血清IL-17的变化及布地奈德对其干预作用的研究,R562.25
  19. 糖皮质激素对哮喘大鼠Aiolos基因表达及血清IgE的影响,R562.25
  20. 哮喘儿童吸入糖皮质激素治疗的回顾性研究,R725.6
  21. 哮喘患儿肺炎支原体感染时IL-13、嗜酸细胞计数与IgE水平的表达及意义,R725.6

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com