摘要:本文从开展国库统计分析大数据应用的可行性入手,剖析了国库统计分析大数据中存在的问题,如数据资源分散,形成信息孤岛;部分业务数据统计标准口径不一,信息资源无法共享;业务系统处理能力和信息安全水平有待提高;传统统计思维亟待转变,信息价值未充分挖掘等。为此,本文提出培养大数据理念,建立大数据国库统计工作机制;制定统一的业务数据标准,搭建高效的综合数据平台;全面提升系统性能,建立信息安全保障体系;注重人才培养等建议。
关键词:大数据; 国库; 统计分析; 数据标准;
以云计算为基础的大数据时代的到来,正深入影响人类的生产和生活。大数据隐含着巨大的社会、经济、科研价值,其使用范围不断延伸,发展空间不断拓展。运用大数据开展国库统计分析,对于提升国库统计分析能力具有重要的意义。
一、开展国库统计分析大数据应用的可行性
国库统计分析始于20世纪90年代,从最初的对各级预算收支数据简单计算列表,发展到现在通过数据整理、汇总、归纳、对比、绘图,挖掘国库资金运行特点和规律,反映经济运行中存在的问题,已成为国库管理工作的重要组成部分。就当前国库制度建设、系统设置和数据特点、机构体系及人员配置而言,运用大数据开展国库统计工作具有可行性。
(一)国库制度建设逐步推进,数据质量更有保障。
以往,地方财政部门常常用“以拨代支”的方式将国库资金调入财政专户,导致财政库存虚降,国库数据无法真实反映财政库存情况,同时,部分预算收入因未能及时缴库甚至沉淀在财政专户中,难以及时纳入国库统计,也破坏了国库数据的全面性和完整性。2015年,新出台的《预算法》明确规定“政府的全部收入应当上缴国家金库”,并对财政专户进行了最严格的规定,此举一方面,有利于全面清理、整顿财政专户;另一方面,有利于将以往未能及时缴库的部分预算收入及时纳入国库统计,提高国库数据的真实性、全面性和准确度。
(二)国库系统不断完善,数据内容更加丰富。
从系统配置看,国库系统渗透国库工作的各方面,涵盖集中存储、加工和处理各级国库的所有业务数据。包括:国库会计数据集中系统(TCBS)、国库信息管理系统(TMIS)、国库信息处理系统(TIPS)(简称“3T”系统)和地方特色业务系统(出口退税无纸化系统、政府补贴发放系统等)(详见图1)。
图1 国库系统
其中,TIPS作为国库核心业务系统与外部门信息传输的重要渠道,实现了国库与财政、税务、海关和商业银行之间的信息交换和业务电子化处理。省级、市和县覆盖率达到100%,有利于信息的完整性;TCBS系统作为国库账务处理系统,与TIPS、TMIS相连接,实现了“3T”间的信息共享。规范的操作流程标准,确保了各级国库会计核算业务统一处理,实现了风险多环节控制、收支及时到账,并完整记录每笔资金的原始信息及账、簿、报表数据的集中存储,由此保障了获取数据的真实性和及时性。TMIS通过采集TCBS等系统的相关信息,按国债管理、收支统计、纳税分析、现金管理等各模块加工处理、提取有用的信息,为国库统计分析工作提供了数据筛选、汇总、整理功能。
从数据特点看,国库系统所处理的数据量大,内容丰富,蕴含着大量有价值的信息。以TIPS为例,通过进入凭证查询界面进行税票信息查询,随机抽取一条税票信息,该信息包括了纳税人基本信息、申报和缴税数据、征收机关、收款人等内容。可以看出,国库系统集中存储的数据不仅数据结构多样,有数值、逻辑、文本、日期、序列型等,且数据源广,可按日、月、年获取信息,数据更新及时,实效性强,满足了大数据的“5V”(1)特点。
(三)机构体系较为健全,人员配备相对充足。
根据《中华人民共和国国家金库条例》规定:“国库机构按照国家财政管理体制设立,原则上一级财政设立一级国库”。国库设总库、分库、中心支库和支库。各级国库根据工作需要逐级设置统计分析处、科、组及岗位,并指定专人负责。同时,国库业务实现了“中央、省、地、县”四级联网,各级国库统计分析工作人员除能及时准确编报统计报表外,还能根据掌握的数据反映一些经济热点问题。综合而言,当前较为完善的国库统计机构体系及相对充足的人员配备对于推进大数据应用奠定了良好的基础。
二、国库统计分析中大数据应用值得关注的问题
受原有制度、系统建设、人员资源等各方面条件束缚影响,大数据应用给传统国库统计分析带来发展机遇的同时,不可避免也带来一些挑战。
(一)数据资源分散碎片化,形成信息孤岛。
一是国库内部部分信息资源分散在各系统中,国库统计分析主要通过TMIS查询数据,由于TMIS对接TCBS对接,部分TIPS所含的信息无法直接获取;二是外部门间数据和信息相分割,对于各项宏观、行业数据(如进出口额总量、房地产)主要通过查询相关政府部门官网发布的统计资料,再进行手工提取录入,数据获取方式易出错,且相对滞后;三是对于一些专题调研分析,我们一般通过传统抽样方法,对被调研对象发放调查问卷获取数据,但一旦被调查对象未积极配合,则统计调查的结果可信度也大大降低。倘若国库相关资料数据库建立较为完善,部分数据直接从数据库提取,就可以尽量减少人为因素干预,统计数据的质量较有保证。
(二)部分业务数据统计标准口径不一,信息资源难以共享。
早期,由于政府各部门间缺乏统一规范的标准,使得同一统计科目数据可能不一致,信息很难相互共享。例如,国库部门与财政部门存在部分支出科目统计口径不一。
(三)业务系统处理能力和信息安全水平有待进一步提升。
虽然以往发生的系统故障影响均相对较小且都已及时升级完善,同时为应对突发事件,当前国库部门也已建立了针对TCBS、TIPS及其他国库业务系统在办理业务方面的应急处置机制,但随着国库业务办理实现电子化,二代TIPS的推广和社保业务的开展,用户和业务量不断增长,对系统性能、运行维护、数据存储以及安全防护等方面均提出了更高要求。
(四)传统统计思维未转变,信息价值未充分挖掘。
当前,国库统计分析仍然沿用传统的统计分析思路,先根据经济理论或社会经验提出假设,然后按照统计研究的目的进行数据的收集整理,再利用统计方法建立模型,最后通过所得到的结论对假设进行验证。例如,以往按经验认为“国内增值税”与“工业增加值”关系紧密,就选取这两变量历史数据,进行模型估计,检验假设是否成立。而按大数据统计分析思维,则无需要事先设定研究目的和假设条件,直接从税务、工商、银行、水电等部门获取企业用水、电、气等记录和财务数据,并通过数据挖掘技术建立模型,发现规律、形成结论。由于现阶段我国国库数据的利用仍以报表、报告为主,传统分析方法和手段较为落后,国库数据的价值未得到充分发挥。
三、政策建议
由于大数据应用对于进一步提升国库数据分析能力,强化人民银行履职水平具有重要的作用,笔者认为可以从以下几个方面入手,建立健全国库大数据分析体系。
(一)树立大数据理念,建立大数据国库统计工作机制。
一要积极主动转变传统国库统计分析思维,培养大数据理念。国库统计分析工作要从原有的因果关系分析扩大到相关关系分析,从最初的只关注国库收入、支出、库存等全局性宏观数据,扩展到主要行业等中观层面的数据,最后回归到微观层面,即关注企业、居民等数据,力求从这些个体数据中挖掘提炼出关键信息,进而反映宏观经济发展的特点。二要立足于我国目前国库组织管理结构及大数据特点,开展国库统计分析。国库系统应建立一个自上而下,包含组织保障、综合数据平台建设、数据应用、用户授权管理等一系列工作机制,做到从制度上、技术上、人员上等各方面保障大数据在国库统计分析工作中的应用及推广。
(二)制定统一的业务数据标准,搭建可共享的高效综合数据平台。
首先,统一大数据应用标准是关键,当务之急是需要各个政府部门、企事业单位、机构组织在国家大数据战略框架下加强沟通协调,统一业务数据标准;其次,大数据一般来源于信息网络系统,收集的数据不仅包括结构化数据,还包括难以用二维逻辑表来表现的数据,如图像、音频、视频等,因此,随着数据类型的不断扩大,要注重建立统一的交换接口,以实现部门间信息交换的顺畅便捷;最后,面对来源于内部的和外界的海量数据,可搭建一个基于Map Reduce和Hadoop等分布式基础架构的综合数据仓库(见图2),并运用云计算技术等高速数据处理技术对国库数据进行挖掘,实现国库收支统计分析、重点行业分析、现金管理分析、地方债分析、纳税分析等。
(三)全面提升系统性能和安全系数,健全信息安全应急保障体系。
随着国库集中收付制度改革不断推进,国库业务量也在呈几何级数增长,一方面,国库系统应引进大型计算技术,并积极与云计算深度结合,全面提升国库系统性能,保证国库业务的顺利开展。另一方面,由于国库数据仓库将集各种信息源于一身,保障数据的安全就成为重中之重。一要在日常业务中及时做好数据备份和恢复工作;二要设立国库数据突发事件领导小组,并建立应急预案,加强日常应急演练工作,防止不法分子的潜在攻击;三要做好岗位设置,对大数据的采集、使用、公布进行用户授权管理,注重个人隐私、商业机密及各项涉及国家安全、经济金融安全等相关敏感数据的保管,保障信息的安全应用。
(四)注重综合型人才培养,加强国库统计分析人员队伍建设。
一要引进科技人才。由于大数据应用需要广泛借助云计算和虚拟化技术,传统的国库统计队伍和工作方式将难以为继,因此需要及时引进大数据维护人员、建模人员。二要注重对国库相关人员内部培训,可以通过邀请专家授课、召开经验交流会等多种培训形式,促进国库统计人员了解并熟悉大数据理论,提高数据处理、挖掘、计算的能力,从而培养一批既懂国库业务又懂信息化应用,能够满足大数据时代需求的现代化国库统计工作者。
图2 国库系统大数据开发应用
参考文献
[1] 刘贵生.现代国库论[M].北京:中国金融出版社,2014.
[2]中国人民银行国库局,中国金融学会国库专业委员会.中央银行经理国库理论与实践(2015)上册[M].北京:中国金融出版社,2015.
[3] 西南财经大学,中国人民银行国库局.国库改革与发展[M].北京:中国金融出版社,2015.
[4] 刘贵生等.国库观察与思考[M].北京:中国金融出版社,2015.
[5]李国杰等.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].战略与决策研究,2012,(6).
[6]高常水等.大数据在政府部门的应用[J].物联网技术,2014,(6).
[7]谢资二.大数据在政府统计中的探索与应用思考——以南通市综合数据管理平台建设为例[J].统计科学与实践,2013,(10).
[8]辽宁省国家税务局课题组.国税系统大数据开发与应用研究[J].地方财政研究,2015,(2).
[9]中国人民银行国库局,中国金融学会国库专业委员会.中央银行经理国库理论与实践(2019)下册[M].北京:中国金融出版社,2020.
注释
1指Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实)。