学位论文 > 优秀研究生学位论文题录展示

非监督的结构学习及其应用

作 者: 陈远浩
导 师: 张宏江
学 校: 中国科学技术大学
专 业: 模式识别与智能系统
关键词: 结构学习 物体识别 文本聚类 层次聚类 非监督学习 结构推导 知识传播 谱聚类
分类号: TP181
类 型: 博士论文
年 份: 2008年
下 载: 290次
引 用: 1次
阅 读: 论文下载
 

内容摘要


在机器学习领域中,数据的表示方式是其中的核心问题。传统的方法经常通过特征向量的方式将数据表示为高维空间中的点。特征向量的表示方式由于简单直观的特性得到广泛的研究。但是,近年来的一些研究表明,单一的特征向量表示很难描述数据的某些特性。因此,基于结构的数据表示方式已经成为研究人员关注的重点。本文的研究重点是通过非监督的结构方式学习数据的结构。由于数据结构空间的搜索是组合问题,会出现组合爆炸现象,因此如何通过近似途径快速地搜索数据的结构空间是非监督学习的重点。根据不同任务的特性,我们提出了不同非监督学习算法。在文本聚类任务中,我们提出了层次谱聚类算法来进行文本的层次聚类和语义树的生成。在图像的物体识别任务中,我们提出了结构推导算法和知识传播策略学习物体的图模型的结构和参数。论文主要研究内容与创新成果如下:1.我们提出基于概率文法和马尔可夫场的物体模型(Probabilistic Grammar-MarkovModel,PGMM)。PGMM模型的学习过程只需要极少量的监督信息,即PGMM模型的结构和参数都可以通过非监督的方式进行学习。关键点三元组被提出作为PGMM模型的基本组成单位。结构推导算法通过对关键点三元组的组合来生成复杂的模型结构。由于PGMM模型的结构采用了联合树的形式,允许动态规划算法的使用,因此PGMM模型可以快速推理和参数学习。实验结果证明,PGMM模型能处理在未知背景中的物体识别和定位。在学习和推理过程中,PGMM模型允许物体在2D范围内的任意变化(位置、旋转和尺寸)。由于概率文法模型的帮助,PGMM模型不但能够处理物体具有不同的形态,还能够处理由不同的物体类别构成的混合类数据。2.我们提出一种学习概率物体模型(Probabilistic Object Model,POM)的新方法。POM模型综合各种视觉特征,能够同时执行图像分类、图像分割和图像物体识别等多个视觉任务的能力。我们通过组合使用互补图像特征的基本的概率物体模型的方式来学习POM模型的结构。在模型的学习过程中,我们提出了知识传播策略。该策略允许一个基本概率物体模型为其它基本概率物体模型提供信息,并且指导它们的学习过程。知识传播策略显著地降低了训练过程对数据的要求,也提高了推理过程的速度。PGMM模型是POM模型中的一个组成部分。相对于PGMM模型,POM模型不仅保留了PGMM模型的所有优点,而且能够执行更多的视觉任务。同时,在图像分类任务中,POM模型也具有更高的性能。3.我们提出一种新颖的层次聚类算法,谱层次聚类算法(Spectral Hierarchi-calClustering,SHC)。SHC算法是基于谱图理论的层次聚类算法。它采用AMG(Algebraic Multi-Grid)数值计算方法,通过迭代地权重融合方式,自底向上地分层合并节点进行聚类。AMG数值计算方法的应用保证了算法能够得到近似全局最优解。实验证明了SHC算法在文本聚类算法中的性能。SHC算法最终得到的自然并且不规则的聚类结构也是其一大特性。基于博客标签的语义树生成实验证明了SHC算法的聚类结构的合理性。它使得用户浏览语义树更为方便自然。综上所述,本文提出新颖的非监督学习模型结构的算法,将它们应用于物体识别和文本聚类任务中,并通过实验证明它们的合理性和有效性。

全文目录


相似论文

  1. 基于图分割的文本提取方法研究,TP391.41
  2. 基于谱聚类的无监督图像分割,TP391.41
  3. 烟草样品中微量金属元素含量测定及模式识别研究,TS47
  4. 改进的谱聚类图像分割方法研究,TP391.41
  5. 基于分形理论的中国股市预警机制研究,F832.51
  6. 基于数据挖掘技术的网络社区发现方法的研究与实现,TP393.094
  7. 基于组群挖掘的服务发现推荐方法,TP393.09
  8. 图像分类识别中特征及模型的若干问题研究,TP391.41
  9. 早期新教传教士以教育、知识传播与医务活动促进传教事业述论,B979.1
  10. 正负域覆盖广义粗糙集与知识粗传播研究,O159
  11. 学术网络、知识传播中的文学译介研究,I046
  12. 基于复杂网络的知识传播动力学研究,G302
  13. 自组织学习及其在汉字识别和图象分析中的应用,TP391.41
  14. 独立成分分析的若干算法及其应用研究,TN911
  15. 胶质瘤恶性进展相关新基因研究,R730.2
  16. 西欧中世纪后期的知识传播,K13
  17. 谱学习与聚类的研究与应用,TP391.41
  18. 维数约简中的若干问题,TP181
  19. 人工智能在游戏中的应用:游戏玩家的实时建模及对手的智能适配,TP18
  20. 清代法律职业者的法律知识与法律实践,D929

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com