信修案件智能指导

内容

  1. 信修问题的需求分析

  2. 数据挖掘模型的构建

  3. 如何落地

需求分析

合理优化信修资源,案件画像,刻画案件是否应该信修及提报信修的时间节点

缺点:并没有充分考虑信修案件的时延性

需求转化

  1. 数据来源: 接单时间在2017年1月至2017年9月的招商案件

  2. 构建特征: 案件基本特征,债务人基本特征,法务操作特征

  3. 最终算法构建: lightGBM + XGBboost ==> Stacking

注:

1.‘特征’的意思就是业务中的所说的影响结果的因素(下文同样意义)

2.下面要展示的就是我们用了哪些特征,用了什么样的策略,落地的方式

特征

建模策略: 尽量精简的特征 + 复杂数据挖掘模型

原因: 1.上线成本低;2.特征多或细意味着模型融入的噪声越多且波动越大

特征构建图

白话的意思是: 我们做策略所考虑的可量化的影响因素

【点我看特征】

机器学习模型(了解)

注:

1.五个名词的意思就是我们的工作

2.模型替我们做了哪些事呢?(答案:自主学习策略,最优策略选择,影响因素重要性选择)

3.直白一点:数据交给机器学习算法(模型),‘算法’自己通过训练的数据学习数据中蕴含的逻辑和复杂关系,然后用于去做一些它擅长的事情,因为他是经过严格训练过的,所以我们相信他能干好!

下面讲点干货

XGBoost

XGBoost 混淆矩阵

lightGBM

截止今天下午2点,第2个问题的model还没出来。

第1个问题的Model已经可以正常工作

关于模型怎么用的问题解释

如有问题请参考在线文档

https://dataxujing.github.io/xx

The End

Thanks for Your Attention!

/