学位论文 > 优秀研究生学位论文题录展示

普适计算环境下基于SVM的信息分类方法的研究

作 者: 杨晓鹏
导 师: 过敏意
学 校: 上海交通大学
专 业: 计算机软件与理论
关键词: 普适计算 支持向量机 序列最小优化算法 半稀疏算法 向量乘法
分类号: TP181
类 型: 硕士论文
年 份: 2010年
下 载: 82次
引 用: 0次
阅 读: 论文下载
 

内容摘要


普适计算环境中,情境信息分析非常重要,它对普适计算环境下的应用能否提供正确服务起着决定性的作用。普适计算的应用要求对情境信息快速而准确的分类和管理,然而收集到的信息往往数量巨大,类别繁多,因此找出一种有效的分类方式并应用于普适计算环境具有很重要的意义。支持向量机分类方法是一种基于统计学习理论的机器学习方法,在非线性和高维样本训练中都表现出特有的优势。支持向量机分类方法以其理论优势,在文本分类应用领域已经取得优秀的效果,同时支持向量机分类方法在人脸识别和图像处理等其他领域也有广泛的研究和应用。本文在研究了支持向量机的多种算法之后,针对向量乘法提出了半稀疏算法,并将其应用于序列最小优化方法,提高了在大规模稀疏矩阵中向量乘法的运算速度,从而优化了SVMTorch分类器的计算性能。通过理论分析,在两个分别含有m和n个元素的向量上进行比较和寻址时,使用传统的稀疏算法的SVMTorch算法需要消耗O(m+n)的时间,而半稀疏算法则可以在O(n)的时间内完成这两个向量的乘法处理,同时不影响支持向量机分类器的精确度。实验结果显示,基于半稀疏算法的SVMTorch分类器计算性能显著优于原始SVMTorch分类器的性能。在WebKB和20-newsgroup两个语料库上,基于半稀疏算法的SVMTorch训练时间分别是原始SVMTorch的54.32%和74.95%。此外,本文还对支持向量机的SVMTorch分类器加以拓展,使它不仅支持多分类单标签的分类问题,同时还支持多分类多标签的分类问题,通过更新SVMTorch分类器的训练和测试检验算法,使其输出结果支持多标签分类运算,并在Reuters-21578语料库上对多分类标签功能进行了验证。为了进一步提高SVMTorch分类器的计算性能,本文使用消息传递接口模型(MPI)将SVMTorch分类器并行化,使其可以在多核处理器及分布式集群上并行计算。本文最终实现了一个基于半稀疏算法的、使用多标签分类功能、并行化的SVMTorch的功能原型,并将其应用于中文网页分类。

全文目录


摘要  3-5
ABSTRACT  5-9
表格索引  9-10
插图索引  10-11
第一章 绪论  11-17
  1.1 研究背景  11-13
    1.1.1 普适计算  11-12
    1.1.2 支持向量机  12-13
  1.2 研究意义  13-14
  1.3 关键技术  14-15
  1.4 本文组织结构  15-16
  1.5 本章小结  16-17
第二章 相关理论和研究  17-31
  2.1 支持向量机简介  17-19
  2.2 支持向量机的算法  19-30
    2.2.1 基于分解的算法  19-23
    2.2.2 序列最小优化算法  23-28
    2.2.3 其他重要算法  28-30
  2.3 本章小结  30-31
第三章 半稀疏算法  31-49
  3.1 传统的稀疏算法  31-33
  3.2 半稀疏算法的设计与实现  33-37
    3.2.1 半稀疏算法  33-35
    3.2.2 半稀疏算法的实现  35
    3.2.3 半稀疏算法的性能分析  35-36
    3.2.4 静态实现与动态实现  36-37
  3.3 半稀疏算法的讨论  37-38
  3.4 实验和验证  38-47
    3.4.1 数据集  38-39
    3.4.2 参数设置  39-41
    3.4.3 性能综述  41-43
    3.4.4 分类精确度  43-46
    3.4.5 训练时间与参数c的关系  46-47
  3.5 本章小结  47-49
第四章 多标签分类及并行实现  49-67
  4.1 多分类问题  49-58
    4.1.1 多分类单标签问题  50-51
    4.1.2 多分类多标签问题  51-52
    4.1.3 SMO对于训练失衡的自适应性  52-53
    4.1.4 基于SVMTorch的多标签分类方法  53-58
  4.2 并行化的SVMTORCH设计  58-63
  4.3 实验数据与分析  63-66
  4.4 本章小结  66-67
第五章 SVMTORCH在网页分类中的应用  67-75
  5.1 系统框架  67-68
  5.2 中文网页的表示  68-69
  5.3 中文网页的分词处理  69-70
  5.4 中文网页的特征提取  70
  5.5 基于SVMTORCH的特征提取  70-71
  5.6 实验结果和分析  71-74
  5.7 本章小结  74-75
第六章 全文总结  75-79
  6.1 全文结论  75-77
    6.1.1 半稀疏算法  75-76
    6.1.2 多标签分类  76-77
    6.1.3 SVMTorch的并行程序实现  77
    6.1.4 改进的SVMTorch在网页分类中的应用  77
  6.2 研究展望  77-79
参考文献  79-83
致谢  83-85
攻读硕士学位期间已发表或录用的论文  85-87

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  14. 基于车载3D加速传感器的路况监测研究,TP274
  15. 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
  16. 基于机器学习的入侵检测系统研究,TP393.08
  17. 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
  18. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  19. 基于AdaBoost算法的人脸识别研究,TP391.41
  20. 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
  21. 城市污水处理厂中A~2O工艺过程的建模研究,X703

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com