赞
踩
信用卡,花呗,白条等产品,有账单日,还款日
申请消费贷 -> 额度授信->客户使用消费贷消费
申请借款->放款给客户->客户还款
冒名顶替,黑产骗贷
多头借贷,借新还旧
POS机套现,以少换多
针对风控模型,制作数据
四要素认证:银行卡持有人的姓名、身份证号、银行卡号、手机号
■ 用户数据
▶ 用户基本信息、用户行为信息、用户授权信息、外部接入信息。
▶ 用户基本信息(联系人,通讯录,学历...)
▶ 用户行为信息(操作APP时的行为,注册,点击位置...)
▶ 用户授权信息(运营商,学信网,设备IMEI....)
▶ 外部接入信息(P2P信贷,其它金融机构如芝麻信用分...)
■ 策略体系
▶ 收集来用户的信息之后,把用户信息输入到策略引擎
▶ 欺诈规则
▶ 准入规则(年龄,地域,通讯录,行为规则)
▶ 运营商规则(通话规则)
▶ 风险名单(黑名单,失信名单,法院名单)
▶ 网贷(多头,白户...)
■ 机器学习模型
风控模型其中包含了A/B/C卡。模型可采用相同算法,一般以逾期天数来区分正负样本
明确需求
例如:业务需要针对全新客户开放一个小额现金贷产品,抢占新市场。
模型设计
模型设计
规则模型
逻辑回归
集成学习
数据源
时间跨度
代表性:样本必须能够充分代表总体。如消费贷客群数据不能直接用到小额现金贷场景
充分性:样本集的数量必须满足一定要求。随着样本量的增加,模型的效果会显著提升
时效性:在满足样本量充足的情况下,通常要求样本的观测期与实际应用时间节点越接近越好。
如何从原始数据中构建特征
单特征分析
什么是好特征?从几个角度衡量:覆盖度、区分度、相关性、稳定性
多特征筛选
星座是大家公认没用的特征,区分度低于星座的特征可以认为是无用特征
多特征筛选
Boruta算法是一种特征选择方法,使用特征的重要性来选取特征
目前还是使用机器学习模型,少数公司在尝试深度学习
模型的可解释性>稳定性>区分度
业务指标:通过率,逾期率
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。