认证服务器ip地址是什么:什么是风控模型？（细说评分模型搭建全流程）

认证服务器ip地址是什么描述：：

科技赋能金融，是这个时代的主流。风险管理，是金融发展的必选命题。

在当代，金融机构在风险管理的每个环节都尽可能地引入计量分析方法，依托大数据进行后台的分析回顾，不断的优化调整，使得金融机构在风险与收益的博弈过程中更快达到平衡，实现局部甚至更多空间的利润最大化。

风控模型，是在风控策略达到平衡之际，实现风险精分差异化的必备武器。

风控模型，广义上代表任何运用数据构建的风险管理模式，狭义上讲，是运用统计、机器学习甚至深度学习等算法开发的数学模型。作者希望通过此长文，为FAL读者朋友们一次性解释狭义风控模型体系。

全文总计22W字，30份配图，共分为6大模块，平均阅读时长2hs，建议读者分模块分时段浏览。

一风控模型概要

二风控建模算法工程师

三速览评分模型搭建

四细说评分模型搭建全流程

1）A、B、C广义三种评分模型

2）数据业务理解

3）数据探索分析

4）定义目标变量

5）样本设计和抽取策略

6）数据清洗

7）特征衍生

8）特征变量筛选

9）模型变量分箱

10）模型拟合

11）模型评估常用指标

12）模型预测概率校准

13）模型违约概率误差校准

五评分模型如何应用于决策

六技术的升华之路

风控模型概要

在社会数据厚度和纬度不断增加的当下，大数据与金融服务的跨界结合越加紧密，互联网技术在金融活动中的应用日益成熟，金融风险管理中信用评估模型体系内部也在酝酿着一场暗流式的较量。

传统信用评分模型

传统信用评估模型的基本思想是比较借款人信用历史资料与数据库中的全体借款人的信用习惯，检查借款人的发展趋势跟经常违约、随意透支、甚至没有债偿能力等各种陷入财务困难的借款人的发展趋势是否相似。

传统信用评估模型的基本算法是运用线性模型中的逻辑回归模型对一些强金融属性（如借款人一个月内多次申请贷款次数）、弱金融属性（如借款人月收入余额）以及关联金融属性（如借款人申请借款时段）数据进行挖掘建模，最终实现借款人违约概率的排序和评分等级。

传统信用评估模型主要从以下5个方面考查用户的信贷资质

传统信用评估模型经过数十年的沉淀发展，技术相对成熟稳定，以美国FICO评分为例，曾促进美国房贷事业的飞速发展。但由于其依赖于金融数据本身，形成一个封闭式的模型闭环，在大数据快速发展的当下，个人消费者出现许多信息纬度，如电子商务、社交网络和搜索行为等，传统信用评估模型的封闭性不断受到挑战，模型解决风险评估的能力也越来越受限。

大数据信用评分模型

大数据信用评估模型的基本思路是一切数据都和信用有关，在能够获取的数据中尽可能的挖掘信用信息。

大数据信用评估模型从大数据采集和大数据分析挖掘两个层面为缺乏信用记录的人挖掘出信用。

通过大数据采集技术，挖掘一个借款人的信用变得更加多元化，比如一个借款人缺乏银行信用卡的数据，但从借款人的航旅出行数据中挖掘出具备较好的信用资质，同样可以完成借款人的信用贷款。

通过多源化的信息采集，一方面传承了传统征信体系的金融决策变量，重视深度挖掘授信对象的信贷历史，另一方面能够将影响用户信贷水平的其他因素也考虑进去，如社交网络数据、用户申请信息等，从而实现深度和广度的高度融合。

以网络数据为例，如IP地址、浏览器版本甚至是电脑屏幕分辨率，这些数据可以挖掘出用户的位置信息、性格、行为以及消费能力，有利于评估用户当下信贷风险。

大数据信用评估模型通过融合多源信息，采用先进的机器学习的预测模型和集成学习的策略，进行大数据挖掘。

首先，上万种数据源被输入到征信系统，其次，寻找数据之间的关联性并进行数据转换，再次，在关联性基础上将变量重新整合为较大的测量指标，每一种指标反映借款人的某一方面特征，如诈骗概率、长期或短期借款人的信用风险和偿还能力等，然后将这些较大的变量输入到不同的分析模型中，最终将每一个模型输出的结论按照投票的原则，形成最终的信用分数。

小结

在当下80的银行和非银机构信用风险评估模型仍以传统信用评估模型为主，不仅因为其技术的成熟和模型的稳定，更因为现阶段大数据征信数据体量并不能完全开发大数据信用评估模型，对于大量极弱金融属性甚至毫无金融属性的数据进行特征关联和转换，对数据广度和厚度本身的要求往往高于模型算法，大数据采集和加工更应该作为基础建设去搭建。

在5G网络建设的大环境下，传统信用评估模型与大数据信用评估模型这一场较量我更相信结果是其乐融融，互补应用。

风控建模算法工程师

风控模型开发人员，相较于数据分析、策略分析人员，对于统计分析方法、大数据机器学习算法都要有更深入的理解。也正是因为工作和业余时间需要花费大量的精力专研模型算法，自然，对于风险业务的关注就会少一些。这也是为什么，普遍做风控模型的工作人员，业务经验能力相对欠缺。

模型开发方向，从技术算法的专业度，分成风控建模工程师和算法研究员。从字面意义就可以发现，风控建模工程师工作核心还是以风控模型的开发为主，更多的工作落脚点在构造有效特征，应用一些模型算法进行数据训练和测试。

风控建模工程师普遍只会花少量时间研究算法本身，甚至不会花时间去研究最新算法。逻辑回归、随机森林、XGboost等主流常规算法，是他们建模首选。而对于算法研究员，更多的精力在研究前沿算法，通过结合自家机构的物理场景，判断是否在未来时期内业务落地应用。

风控建模算法工程师，从业务角度比较，普遍建模工程师比算法研究员更熟悉自家信贷产品的业务，因为其在构建风控特征指标过程中，很重要的衡量标准是其开发的指标是否具有业务意义，但对于业务和风险的整体理解，也仅止于局部，难以与风控策略分析人员相比较。

速览评分模型搭建

风控评分模型的开发流程已经标准化，本文先通过速览形式，带读者朋友们了解一下评分模型搭建流程

样本准备

在正式开始建模前，首先需要搞清楚一点：产品的目标客群是怎样的？建成的评分卡是要用在哪些人身上的？有哪些样本是不适合拿来建模的？举个例子，如果准入规则直接拒绝了25岁以下的客户，那么对应建模时也应该筛选掉这部分样本（非准入客群）。又或者，有一些客户虽然申请了额度，但是并未真正申请放款，那么这些无行为表现客户也不应该包含在建模样本之内。

好坏定义

相信很多没做过建模的读者朋友也听说过好客户、坏客户的说法，但其实在这其中，怎样的客户算好，怎样的客户算坏都是很有讲究的。这个好坏定义首先和评分卡真正关心的客户类型有关，比如说一个反欺诈评分卡的坏客户定义可能是首逾30天以上（FPD30+），而审批评分卡的定义可能是M3+。而具体逾期多少天算坏，就要进行Roll Rate分析了。

观察期和表现期

观察期是指用于生成客户特征的时间区间，用于收集信用历史和行为特征等信息，以提炼能预测未来信用表现的预测变量。

观察期过长可能导致大量客户无法获取相应时间长度的数据，大批样本不能进入模型；观察期过短会导致样本无法生成足够多有效的时间切片变量。表现期是对观察点上客户表现进行监控的时间周期。这些帐户根据截止到表现点的表现被分类成好、坏。表现期需要有足够的长度，从而保证样本群体分类的稳定性，使客户的逾期行为充分表现出来。但也不能够过于长，即使可获得很长时间的历史数据，还需要在完整性（有多少个坏样本需要捕捉）和数据质量之间保持平衡。

细分分析

有的时候，如果面对各种各样的客户通通使用同一张评分卡，可能效果并不是那么的好；但是如果对不同类型（某种维度意义上）客户都使用不同的评分卡，过多的评分卡不好管理，不同评分卡之间得出的结果有时也不具备可比性。

因此，需要找出最佳的群体分组，使得以此为基础建立的一组评分模型可使整个评分系统的预测能力最大化。当然，如果是在样本量比较少的情况下，这一步就可以跳过了。

数据准备

数据准备的过程包括数据清洗、缺失值处理、离群值处理等等，目的是让数据足够干净，而不会因为其中的一些乱码或格式问题影响后续建模。在逻辑回归模型中，合理的缺失值和离群值都是可以不做处理的，因为在进行分箱和WOE转换时可以解决掉这些问题。

其中合理指的是数据本身就是缺失的，比如在填写某些非必填信息的时候客户没有填写导致的缺失，而不是像第三方数据覆盖率不足等原因导致的缺失，类似这种本不应该缺失只是因为各种原因没有获取到数据而导致的缺失，是应该进行缺失值处理的。在这一步，可以筛选掉一部分缺失率过高的变量。

变量衍生

变量衍生是整个建模过程中最重要的一个环节，往往在同样的数据和维度条件下，谁的评分卡模型效果更好，看的就是这一步。变量衍生有各种各样的方法，比的就是谁的脑洞更大。可以简单粗暴的根据业务理解进行变量的组合，生成交叉变量，比如说，不同年龄段的客户的婚姻状况可以给予不同的打分标准。又或者，可以利用一些机器学习算法，比如xgboost，从数据的角度来进行变量衍生。

训练集和验证集

在真正进入建模过程前，还需要预留出一部分样本用作模型的验证，这是为了防止模型的不稳定：在训练集上表现良好、在验证集中却无法很好的预测。然而只要手气足够好，随机抽取验证样本时足够随机，训练集和验证集各指标的分布足够近似，验证集的表现一般不会和训练集有太大的差距，但这并不一定代表模型就是稳定的了。

因此，最好的做法是再预留出一部分时间外测试集，选取与建模样本不同时间段的样本再对模型表现进行验证。比如，如果选取的审批时间在1-3月的客户作为建模样本，那么可以将4月的客户作为测试样本测试模型的效果。

分箱和WOE转换

在进行变量衍生后，我们可能会产生好几百上千个变量，有连续性变量也有分类型（字符型）变量。然而，字符型变量是没有办法直接作为入参参与逻辑回归拟合的，而为了使自变量和目标变量呈正相关的关系往往会对数值型变量也进行分箱和WOE转换。毕竟如果按照原数据入模，会导致评分卡非常不稳定，同时变量的取值和得分的关系也会变得非常的杂乱无章，失去业务上的可解释性。另外，在这一步，根据每个变量的IV值，也可以筛选掉一部分区分能力较弱的变量。

共线性检验

共线性检验也是筛选变量过程中非常重要的一步。共线性指的是模型的变量之间存在较高的相关性，某一个变量可以被其他一部分变量所解释。共线性高会导致回归拟合出来的系数发生严重的偏离。常用的指标为相关系数和VIF。

逐步回归

这是一个基本上完全交给程序的过程，通过不断增加、删减变量，从数据层面挑选使模型的预测能力达到最大的变量组合。然而，虽然已经进入变量筛选阶段的尾声，逐步回归跑出来的变量也不一定就符合要求了，还会有可能出现逻辑回归的系数正负符号不一致的情况。这种时候，就需要结合前面的共线性检验，不断的调整进入逐步回归的变量，以得到合理的最终入模变量。

模型表现

模型表现的评估常见的也就是大家耳熟能详的那几个指标：KS值、Gini、AUC、Lift等等。需要注意的是，模型不能一味的追求高KS，所有变量在建模过程中都针对显着性、相关性、冗余及多重共线性进行测试。如果变量在各维度上不能符合标准，即使会牺牲KS，也将被从模型中剔除。

拒绝推断

拒绝推断是给被拒绝的申请人赋予一个理论上的表现的过程。等价于说：如果申请人被接受了，他们的表现会是什么？由于审批时有一定的拒绝条件，所以被批准的客户群体并不是申请群体的无偏差代表，相反由于审批的选择性导致了被批准客户群体的信用质量高于申请人群体的总体信用质量。如果最终的评分卡只是基于被接受的群体创建，可能会造成一定程度的偏差。

拒绝推断的流程为：先建立一个已有客户模型，使用已有客户模型给拒绝客户打分，再基于已有客户和拒绝客户的群体集合建立新的评估分数。如果之前的审批策略效果不佳，已有客群和拒绝客群差别很小，是可以跳过拒绝推断这一步的。

标准评分卡

在评分卡模型建立的最后，需要将模型转化成一个更加直观、更容易部署的形式，也就是标准评分卡。标准评分卡可以一眼看出每一个入模变量落在哪个区间可以得到多少分。简单来说，就是需要将每个变量每个分箱的系数*WOE变成一个分数，这个过程会使用到三个参数：标准分、标准好坏比、PDO，最终计算出好坏比和分数的一一对应关系。

细说评分模型搭建全流程

1A、B、C广义三种评分模型

首先，我先来聊聊评分模型里的A、B、C卡到底是什么。

评分卡模型是什么？

一个公式！

假定一个客户好为0，坏为1，预测这个客户是好or坏的概率p属于[0，1]

评分卡按照使用阶段分为申请卡、行为卡、催收卡

A卡（Application scorecard）申请评分卡：在客户申请处理期，预测客户开户后一定时期内违约拖欠的风险概率，有效排除了信用不良客户和非目标客户的申请
B卡（Behavior score card）行为评分卡：在帐户管理期，根据账户历史上所表现出来的各种行为特征来预测该账户未来的信贷表现
C卡（Collection scorecard）催收评分卡：在帐户管理期，对逾期帐户预测催收策略反应的概率，从而采取相应的催收措施

伺服器地址和网络通信_实现最佳性能的关键决策

什么是风控模型？（细说评分模型搭建全流程）：认证服务器ip地址是什么

相關推薦