学位论文 > 优秀研究生学位论文题录展示

基于非平衡数据分类的贷款违约预测研究

作 者: 周丽峰
导 师: 邹捷中
学 校: 中南大学
专 业: 数量经济学
关键词: 贷款违约预测 非平衡数据 随机森林 并行计算
分类号: F830.59
类 型: 硕士论文
年 份: 2013年
下 载: 15次
引 用: 0次
阅 读: 论文下载
 

内容摘要


如何在发放贷款前有效的评价和识别借款人潜在违约风险,计算借款人的违约概率,是现代金融机构信用风险管理的基础和重要环节,也是数量经济学、金融学等领域中的研究热点问题。现有的贷款违约数据大部分都是非平衡的,以往的研究并未足够注意这一特征也就重视这一问题的深入研究,本文主要研究如何借助非平衡数据分类的思想对银行等金融机构的历史贷款数据进行分析,预测贷款违约的可能性。对于非平衡数据问题,采用基于数据平衡的方法构造随机森林;针对数据较大的问题,采用具有并行特性的随机森林算法。基于上述研究,本文提出了一种改进的带权重的并行平衡随机森林算法(WPBRF)。WPBRF算法在构造随机森林的每个决策树的同时利用OOB数据估计该决策树的预测性能,并据此赋予每个决策树不同的权重;此外,WPBRF算法利用了随机森林算法的可并行计算的特点,减少了单个决策树的训练时间。实验结果表明,WPBRF在准确率和平衡准确率等方面超过了SVM、KNN、C4.5等常见分类算法和随机森林算法。此外,利用随机森林的并行性的WPBRF算法大幅降低了算法的学习时间,提高了算法的执行效率。

全文目录


摘要  4-5
Abstract  5-7
第一章 绪论  7-17
  1.1 课题研究来源及意义  7-11
  1.2 国内外研究现状  11-15
  1.3 本文完成的主要工作  15
  1.4 本文的内容结构  15-17
第二章 数据挖掘和非平衡数据分类简介  17-28
  2.1 数据挖掘简介  17-19
  2.2 常见分类算法介绍  19-24
  2.3 非平衡数据分类  24-25
  2.4 非平衡分类算法的评估  25-27
  2.5 小结  27-28
第三章 一种改进的随机森林算法  28-35
  3.1 随机森林简介  28-31
  3.2 非平衡数据分类的随机森林方法  31-32
  3.3 一种改进的平衡随机森林分类方法  32-34
  3.4 小结  34-35
第四章 实证分析  35-45
  4.1 实验环境  35
  4.2 数据集  35-36
  4.3 评估方法和评估标准  36-37
  4.4 实验结果及分析  37-44
  4.5 小结  44-45
第五章 总结与展望  45-47
  5.1 本文工作总结  45
  5.2 需要改进及进一步研究的问题  45-47
参考文献  47-51
攻读硕士学位期间科研情况  51-52
致谢  52

相似论文

  1. 基于随机森林的植物抗性基因识别方法研究,Q943
  2. 基于CUDA的图像数字水印技术的研究,TP309.7
  3. 基于GPU并行加速的正射影像生成研究,TP391.41
  4. 环境一号卫星CCD影像云去除方法研究及并行化实现,P228
  5. 基于并行计算的医学超声成像技术研究,TP391.41
  6. 基于GPU加速FDTD计算速度的研究与仿真,TN011
  7. 水稻分蘖断层图像重建加速研究,TP391.41
  8. 基于多核计算平台的视频压缩算法研究,TN919.81
  9. 射频波注入磁化等离子体的数值模拟,TL612
  10. 随机数发生器的研究及其设计,TP301.6
  11. 基于多目标智能算法的节能减排发电调度研究,TM73
  12. 基于遗传算法与并行计算的电磁场逆问题研究,O441.4
  13. 非对称多核体系下的阿姆达尔定律性能模型研究,TP338.6
  14. 遗传算法在多核系统上的性能分析和优化,TP18
  15. 目标的快速检测、定位与运动分析,TP391.41
  16. 图像稀疏去噪算法的并行改进研究,TP391.41
  17. 新型电网广域后备保护的算法研究,TM774
  18. 云环境下MapReduce容错技术的研究,TP302.8
  19. 非平衡数据集分类方法研究及其在电信行业中的应用,TP311.13
  20. 微尺度流体流动和混合的LBM模拟,TQ021.1
  21. 基于FPGA的锥束CT重建加速关键技术研究,TP391.41

中图分类: > 经济 > 财政、金融 > 金融、银行 > 金融、银行理论 > 投资
© 2012 www.xueweilunwen.com