如何搭建金融信贷风控中的机器学习模型天善智能
【课程介绍】
风控是金融业务的核心组成部分,而信贷风控又是整个风控领域体量最大、挑战最大的类型。传统的信贷风控主要靠资深从业人员依靠自身的经验设置的专家规则。随着统计学、大数据、机器学习的发展,现代信用风控越来越偏向量化模型的手段来得以解决风控问题。
本课程使用真实场景下的信贷违约数据,从基础的数据分析开始,一步步构建依赖逻辑回归、XGBoost、神经网络模型等方法的风控模型。同时,本课程也会展示信贷风控领域中经常面临的挑战和相应的解决方法。从第三节课开始,每节课都会在真实数据的基础上完成本章节的模块设计。
【课程目录】
【课程目录】
课程大纲:
第一章:数据分析与建模的基础知识
1、数据分析的概念
2、数据可视化
3、数据分析的常用模型
4、数据分析的常用工具
第二章:互联网金融和信贷风控的概述
1、互联网金融的简介
2、常见的个人信贷产品
3、信贷风控中的主要参数
第三章:评分卡模型(A卡):数据的预处理与特征构建
1、数据的质量检验
2、缺失值和异常值
3、特征构建的方法
第四章:评分卡模型(A卡):数据的预处理与特征构建(续)
1、特征的分箱
2、特征信息值与数值编码
3、单变量分析
4、多变量分析
第五章:Logistic Regression(LR)在评分卡模型中的应用
1、LR模型的基本概念
2、基于LR模型的评分卡构建工作
3、从概率到分数
4、A卡模型的作用
第六章:模型的验证、监控与调优
1、模型的区分度
2、模型的预测性
3、模型的平稳性
4、其他常见的监控指标
第七章:机器学习模型在信贷风控中的应用二:DNN模型
1、神经网络模型的概述
2,激活函数与损失函数
3、反向传播法
4、基于Tensorflow构建违约预测中的DNN模型
第八章:机器学习模型在信贷风控中的应用一:XGBoost模型
1、Boosting的概念与XGBoost模型简介
2、XGBoost模型的构造
3、XGBoost模型中的特征重要性
第九章:组合模型在评分卡中的应用
1、单一模型与组合模型的基本概念
2、组合模型的基本方法:Bagging,Boosting和Stacking
3、组合模型与单一模型的对比
第十章:评分卡模型(B卡)的开发
1、行为评分卡模型:基本概念和应用场景
2、行为评分卡中的数据预处理和特征衍生
3、行为评分卡的构建
第十一章:评分卡模型中的前沿问题一:标签缺失的处理
1、什么是标签缺失
2、标签缺失的处理方法
3、标签缺失场景下的模型构建
第十二章:评分卡模型中的前沿问题二:非平衡样本的处理
1、过采样与欠采样
2、SMOTE算法
3、样本权重法