学位论文 > 优秀研究生学位论文题录展示

基于特征间合作度的非监督特征选择算法

作 者: 颜廷旭
导 师: 侯越先
学 校: 天津大学
专 业: 计算机软件与理论
关键词: 非监督过滤器 特征间合作度 特征选择 维数约减
分类号: TP18
类 型: 硕士论文
年 份: 2010年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


特征选择作为维数约减领域的一个重要分支,对增加机器学习结果的精确度和提高计算效率有着显著的作用。虽然特征选择算法已在监督条件下被广泛研究,然而在非监督条件下,由于缺少类别信息而使这项任务显得犹为困难。目前大多数非监督特征选择算法的思想都旨在通过消除噪声特征和冗余特征这种间接手段而获得有益特征的目的,但噪声和冗余并不总是能被算法同时消除。本文对特征选择思想做出了重新的解读,认为采用直接选择有益特征的手段不仅自然地可以同时消除冗余和噪声,而且能够显式地对所选特征之间的相互关系进行建模,概念上也更为明确。基于这种思想,本文假设整个特征空间的信息可以通过可互补的特征子集表达出来,进而试图通过一种基于特征间合作度的非监督特征选择过滤器方法以选择出其中一个互补特征子集。通过定义合作度的概念,本文首先对特征之间的相互关系进行描述,并基于此概念区分出互补特征。接着一种基于合作度概念且借助了层次聚类思想的算法框架在文章中被提出,试图选择出一组相互间合作度最大且满足模数要求的特征子集,并以此作为一组可互补的特征子集。本文在随后的篇幅中也给出了关于此算法对抑制引入噪声和冗余的分析,从而在理论上说明了该算法从本质上与消除噪声和冗余特征的思想在根本上是一致的。在对比实验中,该算法与其它主流非监督特征选择方法的效果优劣在九个不同的数据集上加以评估,并从结果中证实了本算法的有效性。最后,文章在总结了全文的同时也给出了该算法可能的改进方向,以及一些可能被进一步加以研究的新课题。

全文目录


相似论文

  1. 基于仿生模式识别的文本分类技术研究,TP391.1
  2. 唇读中的特征提取、选择与融合,TP391.41
  3. 语音情感识别的特征选择与特征产生,TP18
  4. 数据流特征选择策略的研究,TP311.13
  5. 基因组可变剪接特征分析与预测,TP311.13
  6. 智能交通行人检测系统的分类技术研究,TP274.4
  7. 纹理图像的特征选择技术研究,TP391.41
  8. 基于意群的文本分类方法研究,TP391.1
  9. 基于Gabor小波变换的人脸表情识别技术研究,TP391.41
  10. 胸部CT图像的肺结节CAD系统,TP391.41
  11. 基于多特征集成的图像自动标注方法研究,TP391.41
  12. 两类仿生学算法在文本分类中的应用研究,TP391.1
  13. 基于特征提取的特征选择研究,TP391.41
  14. 基于模式分类的成像设备源辨识技术,TP391.41
  15. 蛋白质质谱数据挖掘方法研究,TP311.13
  16. 高维特征非线性快速筛选及其在生物信息学应用,Q811.4
  17. 基于LDAP的智能邮件头信息分析机制的设计与实现,TP393.098
  18. 文本的特征提取及KNN分类优化问题研究,TP181
  19. 遗传算法在林业企业市场营销中的应用研究,TP18
  20. 电缆屏蔽完整性及仿真可信度研究,TM206
  21. 基于CT图像的周围型非小细胞肺癌分型诊断模型研究,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com