第四章 信用卡套现风险识别及在银行中的应用
4.1 信用卡套现风险的识别
当前我国对信用卡套现行为的识别比较普遍的是采用评分模型。评分模型是将客户的基本信息和进行过的历史交易相关特征作为根据,将数据挖掘技术和统计方法作为工具和手段,构建出适当的计量模型。其实质是通过分析客户当前及历史的交易信息及交易行为量化出当前信用卡套现的概率,然后对其套现风险程度进行预测。作为银行等信用卡套现行为监测部门,通常会继续将计量模型预测出的概率利用数学变换转化为相应的评分系统进行结果展示,通过划分成不同风险等级的分数档来确定其风险大小。评分模型中常用的方法统计及运筹方法主要有:逻辑回归、神经网络、分类决策树、线性回归、判别分析等。
4.1.1 神经网络模型
神经网络模型是通过模仿动物神经网络行为,归纳其特征后建立的数学模型,关键要素由拓扑结构、神经元特征、学习规则构成。在神经网络模型中应用最广泛、效果最好的方法当属 BP 网络模型,它具有非常显着的持久性和适时预报性。BP 网络模型的拓扑结构由输入层、隐含层和输出层共同构成。其中,输入层的每个节点分别对应预测变量,输出层的节点对应目标变量,而在输入层和输出层之间则是隐含层,各层之间通过激活函数和节点权重连接在一起,形成一个学习网络拓扑结构,然后利用此结构进行反复神经网络学习,直到达到预期目标,所得的权重值便是经过 BP 神经网络自学习得到的最优结果。
4.1.2 逻辑回归模型
逻辑回归模型适用于因变量为二元性属性变量,即因变量取值为 0 或 1.我们可以按照是否发生进行定义,比如发生了就定义为 1,而没发生则定义为 0;另外,自变量可以是连续型变量,也可以是属性型变量。在构建评分卡时,其基本原理是对客户按照是否违约进行 s0~1 分类作为因变量,并对因变量进行 Logistic 变换,即 f(p)=ln ;自变量可以根据业务规则和经验选择,或者利用回归中 Stepwise 方法自动选择。
4.1.3 RFMDA 模型
除此之外,由于信用卡套现行为具有隐蔽性,不易识别,但信用卡逾期风险却比较容易发现,因此从这个角度入手,基于个人信用卡消费分析设定相关指标建立模型对疑似信用卡套现行为进行识别,而其中最直观也是最有效的当属 RFMDA 模型。
RFMDA 模型是在 RFM 模型的基础上,除了最近购买时间(Recency)、购买频率(Frequency)和总购买金额(Monetary Value)三个变量之外,又加入了逾期拖欠风险(De-fault)和疑似套现风险(Arbitrage)两个变量,把与信用卡持卡人相关的风险因素考虑其中,并通过相关指标计算和时间序列分析来判别持卡人刷卡行为是否为信用卡套现的一种比较简明有效的识别方法。
具体说来,由于信用卡都有一定的授信额度,且一般短期内是固定不变的;信用卡还拥有最长 56 天的免息期。出于降低成本提高效率的目的,信用卡套现者通常会选择周期较长的信用卡进行套现活动,也就是说,在月初刷出接近于授信额度的一笔消费,通过某种方式套取出现金,到 56 天免息期截止日将透支额度还清,依此循环。所以我们以 56天免息期信用卡为分析对象。也就是说,如果信用卡持卡人在当月的 1 日刷卡消费,那么下月 25 日之前任何时间还清透支金额就可以享受免付利息。我们假定理想情况下,即排除套现者为了逃避监管分多次化整为零且金额不同进行刷卡的情况下进行分析。
接下来我们从最近消费时间-R、消费频率-F、总消费金额-M、总拖欠金额-D和总套现金额-A 五个维度来分析信用卡持卡人的特征。R、F 和 M 个维度的计算方法仍采用 RFM 模型中的方法。第一步是排序,然后将数据划分为 5 个部分,每个部分的信用卡客户数量相等,并按照 RFM 模型的要求为每一部分的客户赋值 1-5 的数字。其中,按最近购买时间排序时,离现在时间最远的一组客户赋值 1,然后依次向最近时间方向赋值 2、3、4,最近的一组客户赋值 5,记赋值后的数据为 R;同理,对于消费频率和总消费金额两个维度,将排序后数值最小的一组客户赋值1,然后向频率变高和金额变大的方向赋值 2、3、4,最大的一组客户赋值 5,记其赋值后的数据为 F 和 M.通过赋值,R、F 和 M 的取值范围就都限定在 1 到 5 之间,也就是说三个取值越高则持卡人价值越高。而对于 D 和 A 两个指标,采取与 RFM 类似的计算方式,也就是按照拖欠金额和疑似套现金额从大到小排序,然后平均分为五个组,最大的一组赋值为 5,最小的一组赋值为 1,那么未发生逾期拖欠金额的持卡人 D 值为 0,未发生疑似套现交易的持卡人 A 值为 0.这样,D 为 5 的逾期风险最高,A 为 5 的套现风险最高。综合来看,D 值和 A 值均高的为高风险套现客户,D 值和 A 值均低的则为低风险套现客户。
4.2 银行审计工作非现场审计系统介绍
随着我国银行信用卡业务的不断发展壮大,作为银行风险的第三道防线,审计工作在风险把控方面起到了至关重要的作用。而在当前大数据环境下,信用卡业务涉及的数据量之大也史无前例,因此银行审计部门通过设立一些关键性的监控指标设计一套审计系统,并将相关技术运用于信用卡业务的检查和监测,对信用卡业务在指标完成以及业务风险等方面建立数据采集及分析的逻辑,对发卡审核、客户交易、内部操作等各项相关业务进行持续监督,从而识别信用卡的套现行为,给银行信用卡等部门提供线索和资料,以期控制信用卡套现产生的风险,减少银行资金方面的损失,维护银行的良好信誉,而这种高效准确的审计方法便是非现场审计。
非现场审计首先是一种与现场审计相对应的审计方法。它主要是采用非现场的审计方式,利用计算机及网络技术,通过对后台收集的银行的全部业务数据进行汇总和分析,经相应处理后给出结论,是一种比较高效快捷的审计方法。而非现场审计系统则为非现场审计搭建了一个强大、通用的数据分析操作平台,为非现场审计业务的顺利开展提供了有力支持。非现场审计思路的提出及应用创新了审计方法,优化了审计流程,扩大了业务范围,使审计工作更及时准确有效,同时又节约了审计成本,效果十分显着5.
运用非现场审计系统主要是用于审计监测,即在银行业务生产(交易)系统的基础上,使用计算机编制、运行与业务相关的审计模型,按照生产系统中的制度、流程、风险治理要求给出相应标准,将审查事项与之进行比对得出结论,同时为现场审计提供样本和线索。
其中建立非现场审计分析模型,是实现非现场审计技术在审计业务中应用的根本。非现场审计分析模型是指在 SAS 统计分析软件的基础上利用 SQL 语句编写的程序固化结果,其中充分包含了科学的分析技术和优秀审计人员的审计经验。该模型确定后可以在全系统范围内共享使用,具有统一的作业标准可供参考,同时保证审计工作高效准确。审计分析模型使用的工具有十余种,常用的有数据关联、数值计算、回归分析、趋势分析等。