学位论文 > 优秀研究生学位论文题录展示
基于半监督学习的时间序列分类研究与实现
作 者: 吴黎霞
导 师: 孟军
学 校: 大连理工大学
专 业: 计算机应用技术
关键词: 半监督学习 隐马尔可夫模型 自训练 协同训练 线性邻居标签传递
分类号: TP181
类 型: 硕士论文
年 份: 2011年
下 载: 18次
引 用: 0次
阅 读: 论文下载
内容摘要
时间序列广泛存在于现实生活的各个领域,包括语音识别、金融管理等。而实现时间序列的分类也是数据挖掘领域的重要内容。传统的时间序列序列方法主要有两类,即基于相似度与基于模型的方法。这些分类方法属于监督的学习算法,需要大量的标记时间序列去训练以得到可靠的分类器;但是大量的标记序列却很难获得,而如果只使用初始标记序列训练分类器,则得到的分类器的准确率会非常低;而相反,现实中未标记时间序列却很容易获得,因此,结合标记序列和大量未标记序列的信息来训练分类器的半监督学习方法成为研究的热点。实现基于半监督学习的时间序列分类为本文探讨的重点,针对基于隐马尔可夫模型(HMM)在标记时间序列缺少的情况下所出现训练得到的模型分类准确率低的问题,研究使用自训练算法的迭代学习过程来扩大标记序列数据集,并在扩大的标记集上训练HMM使训练得到的模型更加准确和可靠。此外,还研究采用协同训练算法的迭代过程来扩大标记集,其中在协同训练中采用HMM和最近邻分类这两个基分类器,在每次的迭代中,这两个基分类器将分别选择数据进行标记。由于标记集中会产生误标记的情况,故研究使用基于粗糙集上下近似的方法来对扩大的标记集进行编辑。另一方面,对线性邻居标签传递这种半监督学习算法在构造各个数据点之间的近邻图时存在的缺点进行改进,利用粗糙K均值聚类对数据集的聚类结果信息来对K最近邻邻居选择方式进行修改和调整,以使构造的近邻图更加合理。通过在UCR时间序列数据集上进行了大量的对比实验,实验结果表明,使用Self-Training及Co-Training过程扩大标记集后训练得到的HMM的分类准确率更高。以Synthetic Control为例,在每类标记个数为4时,使用Self-Training过程提高了8.11%,而使用Co-Training则提高了15.19%;同时,改进后的基于粗糙K均值聚类(K取4)的LNP方法比原LNP方法提高了7.24%。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-13 1.1 研究背景与意义 8-9 1.2 国内外研究现状 9-10 1.3 本文的工作 10-13 2 时间序列相关技术 13-20 2.1 时间序列概述 13-14 2.2 时间序列符号化 14-15 2.3 常用时间序列分类方法 15-20 2.3.1 基于相似度的方法 16-18 2.3.2 基于模型的方法 18-20 3 基于半监督学习的时间序列分类 20-28 3.1 自训练及其协同训练算法 21-22 3.2 基于半监督学习的HMM分类方法 22-23 3.3 实验结果及分析 23-28 4 利用Co-Training扩大标记时间序列 28-38 4.1 粗糙集编辑方法 28-29 4.2 运用Co-Training进行HMM分类 29-32 4.3 实验结果及分析 32-38 4.3.1 使用Co-Training的实验结果 32-36 4.3.2 使用编辑方法前后的实验结果 36-38 5 改进的线性邻居标签传递算法 38-50 5.1 线性邻居标签传递算法 38-39 5.2 聚类方法和粗糙K均值聚类 39-42 5.2.1 聚类方法 39-40 5.2.2 粗糙K均值聚类 40-42 5.3 粗糙聚类的LNP方法 42-45 5.4 实验结果及分析 45-50 结论 50-52 参考文献 52-55 攻读硕士学位期间发表学术论文情况 55-56 致谢 56-57
|
相似论文
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 基于SVM的目标跟踪算法研究,TP391.41
- 半监督学习中协同训练与多视图方法的比较及改进,TP18
- 基于支持向量机的水电故障分类器的设计与实现,TV738
- 半监督学习若干问题的研究,TP181
- 基于半监督分类的入侵检测系统模型研究,TP393.08
- 半监督学习方法及应用研究,TP181
- 半监督分类技术及其算法研究,TP18
- 基于机器学习算法的隐喻识别研究,TP181
- 半监督流形学习理论与应用研究,TP181
- 基于多目标函数改进的多核学习在半监督学习和迁移学习场景中的应用,TP181
- 基于半监督学习的两种聚类算法研究,TP181
- 半监督协同训练算法的研究,TP18
- 半监督降维和分类算法研究,TP181
- 距离测度学习理论与应用研究,TP181
- 监督和半监督典型相关分析及其应用研究,TP181
- 基于成对约束的聚类和降维算法研究,TP18
- 基于图的半监督学习算法研究,TP181
- 流形学习理论和算法及其在生物认证中的应用,TP181
- 基于KL距离的半监督分类算法,TP181
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|