金融风控场景实例

最近更新时间:2021-04-09 18:18:02

查看PDF

示例简介

该场景满足金融信贷风控场景,主要涉及到数据管理、实验管理、工作流、模型管理、推理服务等模块。

该实例使用的数据集为某地信用卡客户贷款违约数据,数据集介绍如下:

数据字段 字段说明
ID 信用卡客户ID号
LIMIT_BAL 以新台币计算的信贷金额(包括个人和家庭/补充信贷)
SEX 性别 (1代表男性,2代表女性)
EDUCATION 受 教育程度(1=研究生, 2=大学, 3=高中, 4=其他 5=未知, 6=未知)
MARRIAGE 婚姻状况(1=已婚,2=单身,3=其他)
AGE 年龄
PAY_0 2005年9月的还款记录(0=按时付款,1=延迟一个月付款,2=延迟两个月付款,8=延迟八个月付款,9=延迟九个月及以上付款)
PAY_2 2005年8月的还款情况(特征值含义如上)
PAY_3 2005年7月的还款情况(特征值含义如上)
PAY_4 2005年6月的还款情况(特征值含义如上)
PAY_5 2005年5月的还款情况(特征值含义如上)
PAY_6 2005年4月的还款情况(特征值含义如上)
BILL_AMT1 2005年9月账单金额(新台币)
BILL_AMT2 2005年8月账单金额(新台币)
BILL_AMT3 2005年7月账单金额(新台币)
BILL_AMT4 2005年6月账单金额(新台币)
BILL_AMT5 2005年5月账单金额(新台币)
BILL_AMT6 2005年4月账单金额(新台币)
PAY_AMT1 2005年9月支付金额(新台币)
PAY_AMT2 2005年8月支付金额(新台币)
PAY_AMT3 2005年7月支付金额(新台币)
PAY_AMT4 2005年6月支付金额(新台币)
PAY_AMT5 2005年5月支付金额(新台币)
PAY_AMT6 2005年4月支付金额(新台币)
default.payment.next.month 是否违约还款(1代表是,0代表否)

该场景涉及到以下几个环节:

  1. 数据准备:在数据管理模块中,上传CSV格式的数据集。
  2. 新建实验:在实验管理模块中,新建实验。
  3. 可视化建模:在工作流画布中,拖拽相应的算子,创建完整的实验。
  4. 发布为服务:在推理服务模块中,将生成的模型发布为服务。

注意事项

该场景只针对CSV(逗号分隔符)类型的数据文件。

数据准备

导入本地CSV类型的金融信贷数据到数据管理,预览并进行分析。

操作步骤

  1. 登录人工智能KingAI控制台

  2. 单击立即开始,进入KingAI平台工作区页面,在左侧导航栏中单击数据管理

  3. 进入数据集管理页面,单击创建>从本地文件

  4. 按平台引导将某地信用卡客户贷款违约数据上传在平台。

    231e0b805779f2a30969896f61a4540a.png

新建实验

操作步骤

  1. 登录人工智能KingAI控制台

  2. 单击立即开始,进入KingAI平台工作区页面,在左侧导航栏中单击实验管理

  3. 进入实验集管理页面,单击新建实验

  4. 填写实验名称,单击确定

74499e28cdad0da78b3a418d6a32117d.png

可视化建模

创建工作流示例

操作步骤

  1. 登录人工智能KingAI控制台

  2. 单击立即开始,进入KingAI平台工作区页面,在左侧导航栏中单击工作流

  3. 点击工作流,然后点击新建工作流

  4. 填写相关信息,工作流名需要合法,且不与已存在的工作流重名,选择对应选项,最后点击确认

金山云-文档中心-可视化建模示例

  1. 在工作流中详细的操作步骤如下:

5.1 工作流中读入数据示例

工作流中多种导入数据方式,此处只展示从工作流自带开源数据集、数据管理、KS3三种:

5.1.1.工作流自带开源数据集:

1)从左侧算子区展开-数据IO-拖动样本数据到空白处

2)右键点击样本数据,点编辑,选择某地信用卡借贷数据

金山云-文档中心-可视化建模示例

5.1.2.导入数据管理中的表格数据:

1)从左侧算子区展开-数据IO-拖动数据读取到空白处

2)右键点击数据读取,点编辑,选择数据集名称,数据类型选训练集“UCI_Credit_Card”

金山云-文档中心-可视化建模示例

5.1.3.导入KS3中的表格数据:

1)从左侧算子区展开-数据IO-拖动数据读取到空白处

2)右键点击数据读取,点编辑,选择数据集名称,数据类型选KS3,然后选择对应的文件

金山云-文档中心-可视化建模示例

5.2 数据预处理示例

5.2.1.数据列筛选

1)除id外其他列全选

金山云-文档中心-可视化建模示例

5.2.2.分层拆分(随机拆分类似)

1)选default.payment.next.month为标签列,拆分比例0.8

金山云-文档中心-可视化建模示例

5.2.3.分层采样

1)选default.payment.next.month为标签列,采样比例0.7

2)除分层采样外,工作流还支持随机采样等四种采样算子,使用方式类似

金山云-文档中心-可视化建模示例

5.3 特征工程示例

5.3.1.主成分分析

1)降维的特征列全选

2)附加的数据列选default.payment.next.month

金山云-文档中心-可视化建模示例

5.3.2.归一化(最大最小归一化、标准归一化两者使用方法基本一致)

1)归一化的特征列选择除ID和default.payment.next.month外的所有列

2)附加的数据列选default.payment.next.month

金山云-文档中心-可视化建模示例

5.3.3.百分位平滑

1)百分位平滑的特征列选择除ID和default.payment.next.month外的所有列

2)附加的数据列选default.payment.next.month

3)另外工作流还提供阈值平滑、箱线图平滑、zscore平滑,使用方法类似

金山云-文档中心-可视化建模示例

5.3.4.相关性分析

1)相关性分析的特征列选择除ID和default.payment.next.month外的所有列

2)附加的数据列选default.payment.next.month

3)另外工作流还提供阈值平滑、箱线图平滑、zscore平滑,使用方法类似

金山云-文档中心-可视化建模示例

5.3.5.onehot编码

1)对default.payment.next.month列进行onehot编码

2)附加的数据列选default.payment.next.month外的其他列

金山云-文档中心-可视化建模示例

5.4 分类模型训练示例

选择GBDT二分类算法算子

金山云-文档中心-可视化建模示例

训练的特征列除default.payment.next.mont外全选

训练的标签选default.payment.next.month

5.5 模型预测示例

GBDT二分类算法模型预测

金山云-文档中心-可视化建模示例

特征列表除default.payment.next.month外全选

模型标签选择default.payment.next.month

5.6 模型评估示例

分类模型评估

金山云-文档中心-可视化建模示例

5.7 模型对比优选示例

5.7.1 构建LightGBM模型

添加LightGBM二分类算法

金山云-文档中心-可视化建模示例

特征列表除default.payment.next.month外全选

模型标签选择default.payment.next.month

5.7.2 添加模型预测(LightGBM二分类)

金山云-文档中心-可视化建模示例

特征列表除default.payment.next.month外全选

模型标签选择default.payment.next.month

5.7.3 添加模型评估(LightGBM)

金山云-文档中心-可视化建模示例

5.7.4 模型比较(GBDT和LightGBM)

右键点击分类模型评估,查看模型报告

金山云-文档中心-可视化建模示例

金山云-文档中心-可视化建模示例

金山云-文档中心-可视化建模示例

5.8 模型注册示例

效果更好的模型2注册并准备发布及部署

金山云-文档中心-可视化建模示例

5.9 评分卡训练示例

评分卡训练步骤:

  1. 导入数据训练逻辑回归模型,特征列选择除ID和default.payment.next.month外的所有列;

  2. 另外将导入的数据进行监督分箱然后将分箱结果进行woe编码;

  3. 将woe编码结果、逻辑回归模型、原始数据输入到评分卡算子;

  4. 进行模型注册

金山云-文档中心-可视化建模示例

5.10 将注册好的模型保存到推理pipeline示例

将上述步骤中的评分卡模型发布到推理pipeline

金山云-文档中心-可视化建模示例

5.11 可视化建模完成,选择资源配置,单击画布中的运行按钮。

发布为推理服务

将金融信贷数据的工作流生成的评分卡模型发布为推理服务。

通过模型管理模块发布推理服务示例

将评分卡模型通过模型管理模块发布成推理服务

ccede5e8c8152735ed7f3910b169ec7f.png

7cfc253405dcbb3576ce96f8a8d584e8.png

通过推理pipeline模块发布推理服务示例

将评分卡模型推理Pipeline模块发布成推理服务

9b7ba565054d930e3181b63cd39dea88.png

573c3cb4028e0370fdc25de0af8e8fd8.png

文档内容是否对您有帮助?

根本没帮助
文档较差
文档一般
文档不错
文档很好

在文档使用中是否遇到以下问题

内容不全,不深入
内容更新不及时
描述不清晰,比较混乱
系统或功能太复杂,缺乏足够的引导
内容冗长

更多建议

0/200

评价建议不能为空

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

问题反馈