金融系统风控模型怎么建模
❶ 做金融建模需要哪些条件
1、要对金融投资行业感兴趣,这是最最根本的,如果您对此不感兴趣,或者不是很了解,建议您先读读金融建模的相关书籍或者是金融投资理论的书籍(譬如CFA教材)。
2、要有基本的会计基础,即财务分析能力(初级),模型的勾稽关系是基于三大报表直接的钩稽关系的,各个科目的公司嵌套,最终成为一个能够用数字来说明解释问题的模型。
资金的供给者和需求者不直接见面,而是通过金融机构为媒介体进行的间接资金融通。如银行存款,就是资金供给者把资金存入银行,由银行把资金集中起来贷放给资金需求者,银行充当资金供求的中介,这是现代信用制度下典型的间接融资方式。
(1)金融系统风控模型怎么建模扩展阅读:
企业金融性投资既可作为公司理财行为,又是企业经营发展战略的重要组成部分。其目的是多方面的:
(1)通过金融投资,为企业闲置资金寻找获取收益的机会。
(2)通过金融投资,分散企业经营风险。
(3)通过金融投资,提高资产的流动性,增强企业的偿债能力。
(4)对企业来说,金融投资既可用作套期保值又可用作投机牟利。
(5)金融投资还是实现企业扩张的重要手段。一家企业或公司的经营是否成功,其标志之一是看其是否在经营过程中获得了发展,而发展的具体体现包括了向外的扩展,这就是兼并、收购其他企业,并进行公司重组。
❷ 互联网金融风控模型都有哪些
以P2P网贷为例
一、销售环节
了解客户申请意愿和申请信息的真实性,适用于信贷员模式,风控关键点。
风控关键点:不同类型的借款申请调用不同的信用评分规则引擎。
二、贷后存量客户管理环节
存量客户授信调整是存量客户管理中的重要一环
风控关键点:
1、违约情况观察,比如是否发生早期逾期,连续多期不还欠款、联系方式失效等
2、信息关联排查,比如存量客户中是否有与新增的黑名单、灰名单数据匹配
三、贷后逾期客户管理环节
还款意愿差和还款能力不足是客户逾期的主要原因,这个环节主要涉及逾期客户管理与失联客户管理
风控关键点:
1、催收模型、策略优化。
2、失联客户识别与修复失联客户信息。
四、资金流动性管理环节
流动性风险是P2P网贷平台的主要风险,跑路P2P网贷平台的一个重要原因就是发生了挤兑。大数据下的流动性管理其实是实时BI的一个应用。传统BI数据T+1,大数据是实时BI。
风控关键点:
1、资金维度
2、业务维度
❸ 金融风控AI—评分卡模型算法(1)
办理过信用卡的朋友知道,开卡需要先申请(筛选好坏用户),可能还会根据你的信用情况会有不同的额度。这就是银行的信用风险计量体系。对于信用卡有4类评分卡:
1)申请评分卡(A卡)
2)行为评分卡(B卡)
3)催收评分卡(C卡)
4)欺诈评分卡(F卡)
这些评分卡算法一样,只是训练的数据不同,所用的参数也就不同。
蚂蚁金服的芝麻信用也是这样的。
模型的开发主要包含以下几大部分工作:数据获取、数据预处理、探索分析、特征选择、模型训练、模型评估、建立评分系统。
本项目数据来源于kaggle竞赛 Give Me Some Credit 。有训练数据共计15万条。
打开数据文件大概这个样子:
字段描述如下
这部分主要做2个事情:缺失值处理和异常值处理。
pd的describe()函数,可以了解数据集的缺失值情况。
打开DataDescribe.csv
我们可以看大部分数据有15万条,其中月收入只有12万条,缺了近3万条,家属数量14.6万条。
对于缺失值,根据不同的情况我们分类处理:
(1) 如果缺失的不多,比如家属数量缺失不多,可以直接删除含有缺失值的样本。用dropna()
(2) 如果缺失较多,不宜直接全部删除,根据样本之间的相似性填补缺失值。比如用平均值
(3)如果缺失较多,不宜直接全部删除, 根据变量之间的相关关系填补缺失值。比如用随机森林法填补。
(4)如果缺失巨大,就失去分析意义,可以将整个字段删除
平均值填补只要一句话:
随机森林法填补:
调用随机森林:
异常值是指明显偏离大多数抽样数据的数值,或者直接违背常识的数据,比如年龄是负数。对于违背常识的记录直接删除,而对于其他异常数据需要具体分析:
具体采用哪种方式其实最好都试一下,看看最后得到的模型怎么样。因为所有这些操作都是有假设条件的,而你的数据是否满足这些条件,试过才知道。
从图看有异常值不少,不过一般只把异常的0值去掉。
对于及DebtRatio都是百分数类型。其中第一项肯定不能大于100%而且统计一下这部分异常数据不多,果断删掉。第二项债务百分比不敢确定是否可债务大于100%,统计了一下有3w多条,而且取出来看了一下不是很特别,同样可以试一下删除或者放入不管或者填充看看最后不同的效果。
这3个逾期不还次数指标意义相似放一起看,发现有2个数据特别显眼,是96,98。虽然按箱型图的含义所有圆圈都是异常值,但仔细分析这三个指标发现正常值绝大部分是0,这就导致了箱型图的1/4线和3/4线都是0,所以我们通常把头顶2个值作为异常值。我把这部分异常值取出来发现数量不多,只有200多条,理论上可以直接删除或者放在里面置之不理。但是我看了这部分数据发现非常异常。这208条数据有125条是违约用户,违约占比62%,而全量数据里面违约占比7%不到,所以我觉得应该把这部分数据作为一条规则来处理,遇到这三个指标有超过90的数值,直接报告警。那么是否可以把这部分数据留着置之不理呢,后面我试了,发现会对变量之间的相关性有很大影响(后面会详细讲)。
同样这个指标我们把50以上作为异常值。
这个指标pass
月收入可以去掉特别高的数据
家庭成员可以剔除特别高的
第一篇完
❹ 互联网金融风控模型一般是如何搭建的
风控模型是在良好的建立风控体系、风控评定方式、评分机制等基础上,进行有效的数据分析及评分体系,就是建立常用的风控模型方式。目前来看,国内的互联网金融平台搭建风控模型主要有两种方式:一是自己搭建,二是直接使用三方供应商。比如目前互联网金融公司广泛使用的杭州同盾的风控产品和服务。当然,更多的互联网金融公司都会选择将两者结合起来,优化模型,提升效果。
❺ 互联网金融风控模型一般是如何搭建的
很多配资平台都是充值不要手续费的。主要是利息钱了。卖弄玄虚
❻ 互联网金融风控模型,需要多大的数据
1、基于某类特定目标人群、特定行业、商圈等做风控
由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建立对应的风险点及风控策略。
例如:
针对大学生的消费贷,主要针对大学生人群的特征
针对农业机具行业的融资担保。
针对批发市场商圈的信贷。
2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控
身份数据:实名认证信息(姓名、身份证号、手机号、银行卡、单位、职位)、行业、家庭住址、单位地址、关系圈等等。
交易数据/支付数据:例如B2C/B2B/C2C电商平台的交易数据,P2P平台的借款、投资的交易数据等。
信用数据:例如P2P平台借款、还款等行为累积形成的信用数据,电商平台根据交易行为形成的信用数据及信用分(京东白条、支付宝花呗),SNS平台的信用数据。
行为数据:例如电商的购买行为、互动行为、实名认证行为(例如类似新浪微博单位认证及好友认证)、修改资料(例如修改家庭及单位住址,通过更换频率来确认职业稳定性)。
黑名单/白名单:信用卡黑名单、账户白名单等。
3、基于第三方平台服务及数据做风控
互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务
Retail Decisions(ReD)、Maxmind服务
IP地址库、代理服务器、盗卡/伪卡数据库、恶意网址库等
舆情监控及趋势、口碑服务。诸如宏观政策、行业趋势及个体案例的分析等等
4、基于传统行业数据做风控
人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。
5、线下实地尽职调查数据
包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。
虽然貌似与大数据无关,但线下风控数据也是大数据风控的重要数据来源和手段。
❼ 金融风险预测用什么模型
工商银行开发的风控模型。
❽ 消费金融风控模型该如何创建
风控模型是在良好的建立风控体系、风控评定方式、评分机制等基础上,进行有效的数据分析及评分体系,就是建立常用的风控模型方式。目前来看,国内的消费金融搭建风控模型主要有两种方式:一是自己搭建,二是直接使用三方供应商。比如目前消费金融公司广泛使用的杭州同盾的风控产品和服务。当然,更多的消费金融公司都会选择将两者结合起来,优化模型,提升效果。
❾ 互联网金融信贷业务的风险控制分析模型
以前的平安银行副行长赵继臣曾经说过,互联网金融发展到信贷业务,核心一定是风险控制能力。网贷公司想要盈利,就必须自己建立风险控制的分析模型,根据模型来划分不同的客群,针对不同客群的风险进行定价,用收益来覆盖风险。
最近在看《互联网信贷风险与大数据——如何开展互联网金融的实践》,书中所提到的分析模型对风控很有帮助,主要从客户准入管理、存量客户管理和逾期客户管理三个角度去划分。
一、客户准入管理
客户引入管理是金融机构控制风险的第一道门槛,对存量客户和逾期客户的管理有很大帮助。客户准入阶段需要解决两个问题,一个是引入什么样的客户,二是如何授信。
客户准入阶段的模型主要有申请风险模型、初始额度模型、申请欺诈模型。
(1)申请风险模型
申请风险模型对金融机构是最常用也是最重要的,来源于客户资质综合评价,全面评估客户的风险,引入优质客户。该模型的预测变量很大程度上依赖于客户的申请信息、信贷历史信息和无央行征信信息等。
主要从家庭、工作、资产负债、学历、信贷历史、还款历史和新信贷需求等考核。
现在互联网大数据的普及,还可以通过客户流水数据、网络交易行为、浏览行为、评价行为等进行判断,增加 客户风险评价的准确性。
通常来说,如果客户评分高,风险较低,可以直接通过;评分低,风险较高,可以直接拒绝;处于两者之间,则进行二审再做决定。
(2)初始额度模型
初始额度的授信不仅是考虑客户还款能力,更主要的是衡量客户的收益情况。客户的收益主要是来源于客户的循环利息、逾期利息、分期手续费等。
通过客户属性、逾期行为、还款行为、透支情况和额度使用情况等,在一定程度上能够反映客户的收益。
另外电商中的购买行为、分期行为、客户的网络浏览行为及点击行为,对于客户价值的判断也有帮助。
风险低、收益高的客户,初始额度授信高;风险高、收益低的客户,初始额度授信低。
(3)申请欺诈模型
虽然欺诈客户的比例比较小,但如果发生损失,就很难追回,所以这个模型也很重要。
申请欺诈模型,是通过客户填写的申请信息和央行征信信息来判断。这个模型的预测变量主要通过以下这些方面反映:
客户单位名称是否在征信的单位列表中;客户家庭地址、单位地址是否在征信的地址列表中;过去一段时间同一联系人、同一单位地址是否有多次进件;申请人、单位是否曾经发生过欺诈进件。
由于央行征信信息的实效性和完备性,并不能完全满足欺诈模型的需求。互联网上的相关数据,对申请欺诈模型的建立也是有帮助的。这些具体数据包括同一cookie和IP地址是否在短时间内频繁进件;申请贷款的cookie和IP地址是否为客户活跃使用的;申请贷款地点离客户家庭住址和单位地址的距离;客户以前的互联网行为是否活跃;电商数据、浏览数据、电信运营商等记录的客户联系方式。
二、存量客户管理
存量客户即金融机构业已维护的客户群体,其管理主要包含交易欺诈管理、再贷客户营销管理、授信额度管理、流失客户管理等业务,核心目标是为了巩固客户的忠诚度,提高客户价值。
存量客户管理模型体系主要有行为风险模型、交易欺诈模型、行为收益模型、行为流失模型和市场响应模型等。
(1)行为风险模型
行为风险变量是预测客户风险的模型,其预测变量主要由客户的交易行为组合而成。
行为风险模型预测变量可以基于还款行为、消费行为、信用卡取现行为、欠款行为、资金的使用情况等方面来考虑。
另外央行征信数据、互联网交易数据和浏览数据、银行流水数据等,对于行为风险模型的开发也很有帮助。
(2)交易欺诈模型
交易欺诈是指通过盗取他人的账号和密码信息,盗取持卡人的资金的行为。交易欺诈模型是根据客户的历史交易行为预测当笔交易为欺诈的可能性。
交易模型的预测变量比较多,例如通过当笔交易金额、当笔交易币种、当笔交易时间、当笔交易地点、过去N次交易的密码输错次数、过去N次交易的交易失败次数、过去N分钟内的交易次数、过去N分钟小额刷卡次数等进行判断。
(3)行为收益模型
行为收益风险模型是根据客户的历史行为来预测客户未来收益的高低。
客户收益的高低由其户自身属性和行为属性的决定,主要通过性别、年龄、学历、消费行为、取现行为、分期行为、逾期情况、额度使用情况等判断。
低风险高收益的客群,获取的资源相对较多;高风险低收益的客户得到的资源就会少。
(4)行为流失模型
客户是否有流失的征兆,主要看其交易行为是否有异常就可判断。
行为流失模型的预测变量,可以通过以下这些方面来考虑:近N个月的交易金额和交易笔数、额度、信用卡到期时间、也可通过央行征信信息获取客户在其他金融机构持有的信用卡情况、持有他行卡的数、他行卡活跃程度,他行卡的额度。
行为流失模型主要用于客户挽留,通常会结合行为风险模型和行为收益模型,根据风险收益的不同,采取不同的策略。
(5)市场响应模型
市场响应模型通常和风险模型结合使用,筛选风险,响应较好的客户群作为营销的目标客户群。
市场响应模型需要根据营销目标来选择预测变量。例如存量客户再贷营销,预测变量就要看这些方面:最近是否有申请贷款的查询记录、信用卡的额度占用情况、信用卡循环使用情况、收入负债情况等。另外客户最近是否有买车、买房、买奢侈品等大额单笔交易的记录等第三方数据,对于客户是否有贷款需求也很有帮助。
三、逾期客户管理
逾期客户指客户未按约定时间履行还款的约定,客户逾期原因主要是还款意愿差和还款能力不足。
针对逾期客户,主要采用催收策略。催收计量模型是逾期看客户分群的重要依据,能够识别客户的风险情况,根据风险不同采用的催收手段也不一样。
常见的催收计量模型包括账龄滚动率模型、行为模型和失联模型。
(1)账龄滚动率模型
逾期账龄是通过逾期天数定义,账龄越高,客户的风险越高。比如逾期账龄划分:
M1客户:逾期1~29天的客户;
M2客户:逾期30~59天的客户;
M3客户:逾期60~89天的客户;
……
客户评分越低,迁移至下一个账龄的概率越高,客户的风险越高,下个月内还钱的可能性越小。
账龄滚动率模型采用的变量包含客户的行为信息和催收信息,常用的预测变量包括:消费行为、取现行为、额度使用情况、还款情况、催收情况、打破承诺次数。
(2)行为模型
行为模型主要利用客户的交易行为特征和还款行为特征去考察客户未来变坏的可能性,与存量客户管理时所考虑的变量是相同的。
行为模型与账龄滚动率模型结合使用,对客户的评价才会全面、准确,制定催收策略就会更优针对性。
(3)失联模型
失联是需要综合一段时间尝试使用多种方式多个时段,都无法联系上客户,才能判断为失联。
失联模型是基于历史数据,预测客户发生失联的可能性,希望做到提前预知。
失联模型主要关注客户的这些信息:交易情况、贷款余额情况、额度占用情况、最近一次联系客户时间、联系方式变更情况、户籍信息、工作家庭情况、历史催收结果等。
互联网的技术优势降低了风险评估成本,风险控制变得相对容易。互联网金融公司做信贷业务时,能够根据风险分析模型,做好客户分群管理,才能更好的建立竞争优势。
❿ 风控体系如何建设
风险控制的四种基本方法是:风险回避、损失控制、风险转移和风险保留。
一、风险回避
1、风险回避是投资主体有意识地放弃风险行为,完全避免特定的损失风险。
2、简单的风险回避是一种最消极的风险处理办法,因为投资者在放弃风险行为的同时,往往也放弃了潜在的目标收益。
二、损失控制
1、损失控制不是放弃风险,而是制定计划和采取措施降低损失的可能性或者是减少实际损失。
2、控制的阶段包括事前、事中和事后三个阶段。
3、事前控制的目的主要是为了降低损失的概率,事中和事后的控制主要是为了减少实际发生的损失。
三、风险转移
1、风险转移是指通过契约,将让渡人的风险转移给受让人承担的行为。
2、通过风险转移过程有时可大大降低经济主体的风险程度。
四、风险自留
风险自留,即风险承担,如果损失发生,经济主体将以当时可利用的任何资金进行支付。
(10)金融系统风控模型怎么建模扩展阅读
风险控制要从源头上抓起,不是要求完全消灭风险,而是要求能完全驾驭风险。风险贯穿于业务的每一个环节中,发现风险在于最大限度的了解信息。防范风险最关键是控制关键的人和物,做到事前预防,事中控制,事后总结。
在银行信贷行业中,银行风控的主要工作职能贯穿着整个后线系统,从贷前到贷中直至贷后,贷前,即客户申请进件之前的初期审核,重要的一部分是考察客户的经济收入稳定性,这有利于把控客户后期的偿债能力及联系人的可共偿性。
银行要从个人基本材料,征信报告及附加资产证明材料。其中征信报告主要看客户的负债,信用记录,个人基本信息变更频率及近期征信查询记录等,从侧面辅助判断该客户的综合资质及风险。
贷中即客户进件后至合同生效前——主要从正面接触客户,了解借款用途的真实性及流程的合规性,在这一过程,是整个风控体系的重中之重,这是风险控制的最后一道防线,全方位的掌握及合理判断客户的风险点,区分风险的可控性。
风控主要涉及到跟客户之间建立长期有限的联系和逾期催收的内容,跟客户有良好的合作关系可以有效地降低逾期的风险性。