基于SAS Enterprise Miner平台的联网审计风险控制系统的应用

来源：学术堂作者：姚老师
发布于：2017-02-11 共1868字

本篇论文目录导航：

【题目】数据挖掘背景下联网审计风险控制探析
【第一章】新时期联网审计风险问题研究绪论
【第二章】数据挖掘与联网审计相关理论概述
【第三章】联网审计的风险控制
【4.1】联网审计系统建设的目标和思路
【4.2 4.3】基于SAS Enterprise Miner平台的联网审计风险控制系统的应用
【结论/参考文献】联网审计风险管理系统构建研究结论与参考文献

　　4.2 基于 SAS Enterprise Miner 平台的联网审计风险控制系统的应用。

　　对于大型商业银行内部审计部门的，我们选择某银行的信用卡营销活动作为审计业务的审计对象，期待可以从以往的信用卡使用者中挖掘出可以继续发放额度较高且风险比较小的信用卡用户的数据。

　　4.2.1 数据挖掘案例实施的步骤和情况我们选用数据挖掘工具为 SAS Enterprise Miner Workstation 13.2 版本。下面介绍运用 SAS Enterprise Miner13.2 对某银行的信用卡客户数据进行挖掘的相关步骤和情况。

　　（1）打开 SAS Enterprise Miner Workstation 13.2 客户端，打开文件选项进入新建项目界面，输入项目名称和 SAS 服务器目录。

　　（2）点击下一步后，核对好新建项目的信息，如图 4.4 所示。点击完成即可进入数据挖掘的主界面。

　　（3）点击主界面新建 SAS 数据的逻辑库，并将被审计业务的原始数据导入 SASEnterprise Miner 软件的特有数据形式 SAS 数据表。

　　（4）下一步新建数据源，选择 SAS 数据表 Purchased_credit .

　　对于数据集 purchased_credit 中的元素我们选择 purchase 为目标（即数据挖掘的所想要得到的最终结果对象）（5）下一步我们设置好相关指标后新建数据挖掘的流程图 CreditAudit,并对其中审计数据集的 purchased_credit 中元素进行初步探索结果。

　　通过观察初步探索的结果我们可以发现审计数据集的 purchased_credit 中有十个变量（元素）并有 1461 个观测数值，变量名分别为：区别不同被审计数据的人员的id 号；代表已工作年限的 age;信用卡所欠的金额 creddebt;债务占收入的比 debtinc;所受教育的程度 ed 等等。

　　（6）对于 SAS 数据表 purchased_credit 中 1461 个观测数中我们选择 60%位训练集，40%为验证集，并假设对这些以前持卡的人员，如果营销成功则可盈利 95 元，如果失败就亏损 5 元，同时进行数据挖掘。我们选取的数据挖掘模型是决策树、梯度Boosting、回归、神经网络、自动神经网络，通过每一步的设置和连接，最后我们得到了如图 4.9 所示的数据挖掘流程图。

　　4.2.2 数据挖掘案例实施的结果和分析（1）我们通过探索流程图中模型比较的结果，便可得到五种模型的 ROC 图如图4.10 所示。图左部分为训练集的 ROC 图，而右部份为验证集的 ROC 图。

　　ROC 曲线指受试者工作特征曲线[47]（receiver operating characteristic curve），是反映敏感性和特异性连续变量的综合指标，是用构图法揭示敏感性和特异性的相互关系，它通过将连续变量设定出多个不同的临界值，从而计算出一系列敏感性和特异性，再以敏感性为纵坐标、（1-特异性）为横坐标绘制成曲线，曲线下面积越大，诊断准确性越高。在 ROC 曲线上，最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。ROC 曲线与坐标轴的面积越大，表示对整个模型的贡献度越好，对于图 4.9可以看出神经网络模型对该数据集的适用结果相较于其他四中模型是不太理想的。而决策树模型对数据集的适用记过相较于其他四中模型是比较好的。通过观察下文的表4.2 我们也可以得出同样的结论。

　　（2）打开累计预期总利润选项，可得到累计预期总利润评分排名叠加图。

　　（3）打开 CreditAudit 流程图中模型比较的结果中提升度选项可得提升度评分排名叠加图。无论是图 4.11 的累计预期总利润的评分排名叠加图，还是图 4.12 的提升度的评分排名叠加图（注意箭头处的数据）都可以看到对 20%左右的人进行营销，那么银行的就可以信用卡发行可以利润最大化，且信用卡发行所承担的风险最小。

　　（4）由 CreditAudit 流程图中模型比较的结果中可以得到以下的五个表。

　　（5）当然这还不是我们最终想要的结果，我们想要取得是对哪些 20%左右的人进行营销呢？最后我们在图4.9流程图最后一步的SAS代码模块的代码编辑框中输入下列代码：

　　proc sort data=emws1.score_train out=emws1.train;by descending em_eventprobability;where em_eventprobability>0.6;run;proc export data=emws1.trainoutfile="C:\Users\PURE \Desktop\train.sav"dbms=sav replace;run;在运行了上述代码之后我们便可以从计算机我们选定目的文档"C:\Users\ PURE\Desktop\train.sav"处提取出我们想要信用卡营销成功率在 0.6 以上的 SPSS 数据格式sav 文件的人员名单了。

　　4.3 本章小结。

　　本章分别从宏观和微观两个方面通过对某银行联网审计风险控制系统的构建，取得了银行联网审计风险控制系统的模型初步构建。然后重点研究了通过对某银行信用卡营销数据进行内部审计意义上的数据分析（即数据挖掘），借助于 SAS EnterpriseMiner 平台顺利的应用了数据挖掘中的五种算法（模型）于审计数据上，最终获得的想要的审计结果，降低了审计的风险进而增加了企业的价值。

返回本篇论文导航

相关内容推荐