学位论文 > 优秀研究生学位论文题录展示

基于贝叶斯网的多维数据中不确定性知识表示与推理方法

作 者: 岳名亮
导 师: 刘惟一
学 校: 云南大学
专 业: 计算机技术
关键词: 多维数据 贝叶斯网 知识表示 知识推理 分类
分类号: TP181
类 型: 硕士论文
年 份: 2011年
下 载: 41次
引 用: 0次
阅 读: 论文下载
 

内容摘要


多维数据被广泛应用于社会、经济、科技等领域中,由于多维数据的复杂性,其所蕴含的信息往往不易于人们分析和理解,从多维数据中掘取有价值的不确定性知识显得至关重要。贝叶斯网(BN)是一种不确定性知识表示和推理的工具。BN以网络节点表示随机变量,以有向边表示变量间的概率因果关系,并以条件概率表(CPT)对概率进行量化。推理时,给定一组变量观察值(证据),通过搜索CPT计算一组查询变量的后验概率分布。以多维数据为随机变量,用BN对多维数据建模时,每个多维变量的取值取决于其各维度取值的组合,其存储和推理的复杂度往往非常高。同时,推理时所给定的证据也是各维度取值组合的实例,当该实例不在CPT中时,推理便无法进行。上述由属性取值组合而引起的问题有两种直观的解决方案:以多维变量的每个维度作为随机变量(称属性变量)构造BN;将多维数据的实例分类,以类变量作为随机变量构造BN。然而,对于前者,相应BN中所蕴含的属性变量间的依赖关系可能十分复杂;同时,多维变量的整体信息以及各多维变量间的整体依赖关系也会因此丢失。而对于后者,虽然类变量的取值表示了多维变量整体信息,相应BN中将彻底没有任何细节的属性信息。针对多维数据整体和细节的知识表示和推理,借鉴分类的思想,本文的主要贡献概括如下:·将每个多维变量与一个类变量相关联,学习类变量与相应属性变量的概率因果关系,构造局部贝叶斯网(LBN)。基于LBN进行推理可得出相应类变量的取值分布,进而以类节点的取值状态表示多维变量的整体信息。·通过对类变量间依赖关系的学习,连接相应类节点,构造全局贝叶斯网(GBN)。由于LBN间有且仅有类节点间存在依赖关系,从而避免了不同多维变量的属性变量间部分依赖关系带来的复杂性,同时也避免了多维变量间整体依赖关系的丢失。·基于GBN对多维数据中的不确定性知识进行表示和推理,本文给出了2-阶段学习算法和3-阶段推理算法,并通过实验证明了本文方法的可行性。

全文目录


摘要  3-4
Abstract  4-7
第1章 前言  7-14
  1.1 研究意义  7-8
  1.2 国内外研究现状分析  8-12
    1.2.1 多维数据的知识发现  8-10
    1.2.2 多维数据的知识表示与推理  10-12
  1.3 本文主要研究内容  12-13
  1.4 论文结构  13-14
第2章 背景知识  14-23
  2.1 贝叶斯网简介  14-20
    2.1.1 概率论基础知识  14-15
    2.1.2 贝叶斯网的定义  15-16
    2.1.3 贝叶斯网的学习  16-17
    2.1.4 贝叶斯网推理  17-20
  2.2 贝叶斯网分类器简介  20-23
    2.2.1 朴素贝叶斯网分类器  20-21
    2.2.2 树扩展的贝叶斯网分类器  21-23
第3章 全局贝叶斯网的定义和学习  23-31
  3.1 问题描述  23-25
  3.2 全局贝叶斯网的定义  25-26
  3.3 全局模型的学习  26-31
第4章 全局贝叶斯网的推理  31-35
第5章 实验结果与分析  35-40
  5.1 实验配置  35
  5.2 3-阶段推理算法的收敛性与准确性  35-40
    5.2.1 吉布斯算法的收敛性  36-37
    5.2.2 3-阶段推理算法的准确性  37-40
第6章 总结和展望  40-41
参考文献  41-43
致谢  43-44
附录  44-50
  攻读硕士学位期间发表的论文  44-45
  部分源代码  45-50

相似论文

  1. K公司计划及预测改进对于合理库存配置的研究,F224
  2. 基因调控网络模型描述语言研究,Q78
  3. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  4. 基于词义及语义分析的问答技术研究,TP391.1
  5. 基于三维重建的焊点质量分类方法研究,TP391.41
  6. 基于串核的蛋白质分类算法的研究与实现,TP301.6
  7. 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
  8. 上下文相关的词汇复述研究,TP391.1
  9. 基于仿生模式识别的文本分类技术研究,TP391.1
  10. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  11. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  12. 基于图像的路面破损识别,TP391.41
  13. 多样性密度学习算法的研究与应用,TP181
  14. 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
  15. 计算智能在数字化卷烟叶组配方中的应用研究,TS44
  16. 基于中国土壤系统分类的土壤类型和界线确定研究,S155
  17. 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
  18. 基于视觉的番木瓜外观品质检测技术研究,S667.9
  19. 面向公众的教育视频共建共享平台的设计与实践研究,G434
  20. 基于土壤系统分类的土壤调查方法研究,S155
  21. 西藏生防芽孢杆菌鉴定及其脂肽化合物分析,S476.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com