学位论文 > 优秀研究生学位论文题录展示

集合多标签文本分类研究

作 者: 张新颜
导 师: 沈学利
学 校: 辽宁工程技术大学
专 业: 计算机应用技术
关键词: 多标签文本分类 条件随机域 类依赖 支持向量机
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 75次
引 用: 2次
阅 读: 论文下载
 

内容摘要


文本分类是基于文本内容将待定文本划分到一个或多个预先定义的类中的方法。文本分类能较好地解决大量文档信息归类的问题并可以应用到很多情况。文本分类按样本所属类别的个数分为单标签分类和多标签分类两种。单标签分类技术只是给当前文本赋予一个预定义的类别(单类别标注);反之,多标签分类技术可能给当前文本赋予多个预定义类别(多类别标注)。多标签分类的一般方法是采用分类排名或阈值方法为每个类学习独立的分类器。由于这些方法没有利用标签之间的依赖关系,所以它们只适合类别独立的情况。然而,在许多领域中标签是高度相互依存的。现在,对于文本分类来说,多标签分类的需求越来越多。本文主要探索多标签条件随机域(CRF)分类模型中的集合多标签分类(CML)模型和集合多标签特征分类(CMLF)模型。与传统的分类器不一样,两种模型学习与特征标签对相关的参数,它们能够参数化标签的共现事件,并以此为基础进行多标签文本分类。CML学习类、类之间的参数,CMLF学习特征、类、类三者之间的参数——捕捉一个个别的特征作用在一对共现标签上的概率的影响。在研究集合多标签的基础上,本文运用支持向量机(SVM)分类方法对文本进行分类能够明显提高分类效率,准确率较高。

全文目录


相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 音乐结构自动分析研究,TN912.3
  3. 时间表达式识别与归一化研究,TP391.1
  4. 基于车载3D加速传感器的路况监测研究,TP274
  5. 不匹配信道下耳语音说话人识别研究,TN912.34
  6. 隐私保护线性规划和支持向量机新算法,O221.1
  7. 基于支持向量机(SVM)理论的个人信用评估研究,TP18
  8. 基于数据挖掘技术的煤与瓦斯突出预测研究,TP311.13
  9. 基于傅里叶变换红外光谱技术的番茄抗氧化水平检测,O657.33
  10. 基于脑电信号的疲劳估计和实时监控技术研究,TN911.6
  11. 田纳西—伊斯曼化工过程的故障诊断,TQ021.8
  12. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  13. 一种于经验数据的软件缺陷修复工作量预测模型研究,TP311.53
  14. 计算机病毒行为检测方法研究,TP309.5
  15. 局部支持向量机算法的研究与探讨,TP18
  16. 基于监督学习的图像局部特征点检测子研究,TP391.41
  17. 基于主动外观模型的人脸表情识别研究,TP391.41
  18. 基于径向投影和半监督学习的视网膜血管分割,TP391.41
  19. 半定规划支持向量机的研究,TP18
  20. 基于专利分析的技术成熟度预测方法研究与实现,G306

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com