学位论文 > 优秀研究生学位论文题录展示

凸优化在大规模机器学习中的应用

作 者: 丁朋
导 师: 王行愚
学 校: 华东理工大学
专 业: 控制科学与工程
关键词: 凸优化 大规模机器学习 核Logistic回归 割平面法
分类号: TP181
类 型: 硕士论文
年 份: 2011年
下 载: 146次
引 用: 0次
阅 读: 论文下载
 

内容摘要


本文研究了凸优化理论在大规模机器学习中的应用,给出了基于Fenchel对偶理论的核Logistic回归并行分类算法(PDS)以及基于割平面理论的大间隔最近邻分类算法(LMNN_PCA)。KLR的决策结果含有概率输出,多分类推广能力好,然而单机下的KLR分类算法依赖于每个训练数据集,因此不能处理大规模数据。核Logistic回归并行分类算法主要采用了对偶分解的思想,即先将训练集分割成若干子集,集群上的客户机对每个子集进行独立训练,利用消息传递的机制,在每一次训练结束服务器主机再对各客户机传递的消息进行汇总,再对各客户机提供修正解的消息,迭代训练即可得到大规模问题的解。主要解决了如何将大规模问题分解为多个子问题以及子问题的求解问题。LMNN_PCA算法主要采用了割平面法,把大量约束条件的凸优化问题转化为小量约束条件的凸优化问题。本文主要进行了以下工作:(1)给出了基于Fenchel对偶理论的核Logistic回归并行算法的理论推导以及对于子问题的处理方法。利用Fenchel对偶理论将大规模凸优化求解问题转化为中小规模凸优化求解问题。(2)给出了基于Fenchel对偶分解原理的KLR分类并行算法的软件实现。先从功能图分析出软件中需要设计的类,然后给出了主程序的流程图(包括服务器端和客户端),紧接着,分析了软件实现中遇到的问题并给出了解决的方法。最后,还设计了一个拓扑结构网络,搭建实验平台,采用标准数据集进行实验。通过实验,得出KLR分类并行算法具有时间上的优越性。(3)提出了基于割平面法的大间隔最近邻分类算法(LMNN_CPA)并通过实验证明了算法的可行性与优越性。因为主问题的约束条件很多,所以采用割平面法来求解主凸优化问题,从而大大降低了约束条件的数量。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-17
  1.1 课题研究的背景  10-12
    1.1.1 凸优化简介  10-11
    1.1.2 大规模机器学习  11-12
  1.2 课题研究的意义  12-13
  1.3 国内外研究现状  13-15
    1.3.1 机器学习中的凸优化  13-14
    1.3.2 机器学习中的并行化  14-15
  1.4 课题研究的内容  15-16
  1.5 章节安排  16-17
第2章 凸优化理论知识  17-24
  2.1 凸优化的定义  17-18
    2.1.1 凸集和凸函数  17
    2.1.2 凸优化的定义  17-18
  2.2 使用导数的最优化方法  18-19
    2.2.1 最速下降法  18-19
    2.2.2 牛顿法  19
  2.3 对偶理论  19-23
    2.3.1 Lagrange对偶  19-20
    2.3.2 对偶定理  20
    2.3.3 Fenchel对偶理论  20-23
  2.4 小结  23-24
第3章 基于Fenchel对偶的核logistic回归并行算法  24-38
  3.1 前言  24
  3.2 核Logistic回归的定义  24-26
    3.2.1 线性核的logistic回归  24-25
    3.2.2 核函数及非线性核的logistic回归  25-26
  3.3 分解模型  26-27
  3.4 基于Fenchel对偶的核logistic回归并行算法  27-37
    3.4.1 问题的引入  27
    3.4.2 线性核的KLR问题并行算法  27-31
    3.4.3 非线性核的KLR问题并行算法  31-35
    3.4.4 子问题P_j~*(d)的求解  35-36
    3.4.5 对于t的求解  36-37
  3.5 小结  37-38
第4章 实验与结果分析  38-52
  4.1 软件设计  38-45
    4.1.1 类的设计  38-39
    4.1.2 主程序的设计  39-42
    4.1.3 软件核心技术  42-44
    4.1.4 makefile文件  44-45
  4.2 软件调试  45-46
    4.2.1 内存调试  45-46
    4.2.2 编译连接调试  46
  4.3 实验部署  46-48
  4.4 实验数据及分析  48-50
  4.5 小结  50-52
第5章 基于割平面法的大间隔最近邻分类器  52-58
  5.1 引言  52
  5.2 基于割平面法的大间隔最近邻分类器  52-54
  5.3 实验  54-57
    5.3.1 实验设置  55
    5.3.2 参数设置  55
    5.3.3 实验结果  55-57
  5.4 小结  57-58
第6章 总结和展望  58-60
  6.1 工作总结  58
  6.2 展望  58-60
参考文献  60-64
致谢  64-65
攻读硕士学位期间所发表的论文  65

相似论文

  1. 基于小波变换的信号稀疏表示及其在图像去噪中的应用,TP391.41
  2. 相位编码信号脉压技术的研究与实现,TN957.51
  3. 抵抗硬拷贝攻击的半色调图像数字水印算法研究,TP309.7
  4. 弱拟法锥条件下非凸优化组合同伦算法,O221.2
  5. 社会关系网络紧密性测度研究,O157.5
  6. 流量控制和服务器选择的联合优化研究及实现,TN919.8
  7. 优化算法在通信信号处理中的应用,TN911.7
  8. 基于OFDM调制的双向中继网络信道估计算法研究,TN919.3
  9. 双足机器人力传感器仿真及平衡检测研究,TP242.6
  10. 基于凸优化的压缩感知信号恢复算法研究,TN911.7
  11. 整数规划算法效率的研究,O221.4
  12. 蜂窝中继系统的无线资源分配算法与切换机制研究,TN929.5
  13. 网络化的视频通信优化控制研究,TN919.8
  14. 认知无线电网络中的中继协作和功率分配算法研究,TN925
  15. 多频多相编码信号及其在非连续谱下的波形优化设计与处理,TN958.5
  16. 基于鲁棒优化的电量分配模型的研究,TM743
  17. 认知无线电网络中的频谱感知算法研究,TN925
  18. 基于松弛PPA的收缩算法,O224
  19. 基于凸优化的稳健接收波束形成,TN911.7
  20. 基于认知无线电的抗干扰通信网络资源分配技术,TN925

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com