伴随着经济统计发展,经济统计的经验累积,目前的经济统计所需要统计的数据已经非常庞大,数据统计者在进行数据统计时,如果仅适用数理知识的采集,并不会对数据进行深入挖掘,造统计结果不准确。统计数据的数量逐渐增多,数据类别也同样增加,对此,如果仅仅是使用以往的数据统计方式,并不能准确、全面的实现数据分析并统计的工作。数据挖掘技术是目前全新的统计方式,其具备良好的数据统计方式,能够横向的对数据进行挖掘,进而更好的对经济数据进行统计,更好的满足社会对经济统计数据的需求。
一、数据挖掘技术概论。
数据挖掘技术简单的说就是对数据信息进行深入挖掘的一种技术,在实际的使用过程中,能够将复杂的数据库变得更加的简化,进而从中发现能够利用的数据信息,并加以分析和整理,进而达到庞大且散乱的数据得到充分的利用。目前我国的经济数据统计信息量非常庞大,并且还带有数据不完整、随机性强的特点,这些都造成常规的数据统计方式和系统无法充分的分析并统计经济数据。数据挖掘技术能够将这些具备随机性强、完整性低的原始数据进行分析和统计,最终形成一套能够合理利用的统计数据形态,以便于数据使用者更好的对数据进行应用和提取。这样能够将数据进行更准确、更全面的收集、分析和加工的技术被称为数据挖掘。
数据挖掘的特点是能够自动的将有价值的数据发现并收集,然后对其进行处理、加工,将大量的信息处理、加工之后对其进行分析和统计,进而实现数据的有效性、准确性和实用性。
二、数据挖掘技术在经济统计中的应用效果。
1.综合性应用能力较强。数据挖掘技术已经被许多的统计工作所合理应用,并且发挥着至关重要的作用,其中也包括经济统计。数据挖掘技术不仅仅是一种数据挖掘能力强、具备统计能力的技术,还能够根据数据使用者的要求将数据进行分类和统计。因此,数据挖掘技术在经济统计中,能够有效地将数据进行开发、整理和分类,给统计数据的使用者提供更好的便利服务。
2.较强的有效性。数据挖掘技术目前在我国应用的实践并不长,但是其在经济统计的工作中的实际应用效果非常好,并且还具备稳定的工作性能,不仅仅是能够对经济数据进行整理、分析和统计,还能够更加有效的对挖掘出更多有价值的信息,在实际的应用中能够表现出较高的有效性。
3.数据挖掘技术能够更有效的应用于宏观型的数据库。目前,我国的经济统计多数还是使用的传统的经济统计方式,收集和统计的数据信息并不能形成一个有机整体,在进行数据的管理时,仍然会出现许多的问题。对此,就需要利用新技术来提升经济统计的有效性。宏观经济统计数据库能够给数据挖掘技术提供相当合适的统计平台。对于经济统计来说,其统计的数据必须要准确无误,这就需要有大量且可靠的数据资源,宏观经济统计数据库的特点便在于此,所以数据挖掘技术能够更有效的应用于宏观型的数据库。
三、数据挖掘技术的数据挖掘流程。
数据额挖掘的整个流程主要为在数据库中中利用数据挖掘算法收集相关的数据,然后围绕着数据挖掘进行的预处理,进行多次重复的对数据进行统计和处理。整个数据发掘过程是由多个挖掘步骤所组成的,数据挖掘仅仅是整个挖掘技术的一个主要步骤。数据挖掘收集的主要步骤有以下四个。(1)定义目标阶段。根据数据统计者的要求定义数据挖掘目标。定义目标的适配度会直接影响数据挖掘的最终效果,对此,就需要具有应用领域知识的专家和数据挖掘经验的技术人员共同写作对目标进行定义。一方面需要对各种算法进行对比,最终确定最行之有效的算法之一,另一方面确定数据挖掘能够充分的满足实际工作要求。(2)数据准备阶段。数据准备阶段是数据挖掘技术中最为重要且过程最长的阶段。这个阶段主要分为三个步骤:数据挑选,数据处理和数据变化。数据挑选主要是指从数据仓库或数据库中挑选所有相关的数据,将这些数据定义为目标数据。数据处理是指对目标数据进行初步的处理,然后挑选出挖掘出符合要求的数据。数据变换是指对挖掘出服务要求的数据进行精简,即从数据处理中挖掘出的数据进行更深层次的挑选,最终挑选出完全符合数据统计要求的数据。(3)数据挖掘阶段。这一阶段是主要的数据挖掘阶段。首先是预定算法,换而言之就是采用怎样的条件挑选数据,并进行挖掘。
然后针对算法完成数据挖掘工作。在完成之后,便可以进行数据挖掘模块的计算。这个阶段是相关领域专家和数据挖掘分析者最为关注的一步,也能够被称为实际上的数据挖掘。(4)评估阶段和结果显示。根据数据使用者的要求将数据进行分析并将结果显示,将有价值意义的数据显示出来,并且将挖掘出的数据进行价值评估,对于无意义的或存在重复的数据删除。如果最终挖掘出的数据无法满足数据使用者的要求则返回到上一步,重新筛选。
四、数据挖掘在经济统计中的发展方向。
目前数据挖掘的发展方向可以从多个方面展开:(1)根据数据使用者的要求开发出各种数据挖掘系统。具备较强功能性的数据挖掘系统仍然难以处理各种数据,对此就需要针对要求制定出各式各样的数据挖掘系统,例如空间数据库挖掘和关系数据库挖掘等。(2)提升数据挖掘显示结果的确定性、可表达性和有效性。需要已经挖掘出来的数据能够充分表明数据库的主要内容,并且能够运用于实际的相关领域当中。对具备缺陷的数据需要进行分析,以相似的数据或者有规律数据的形式展现出来。(3)数据挖掘结果简化。挖掘出的数据最终使用者并非是数据挖掘的专家,所以挖掘结果一定要简化。
(4)交互式、多抽象层数据挖掘。交互式数据挖掘能够准许用户对数据进行精确挖掘,数据的焦点具备动态改变的特点,从多个角度多个抽象的层次灵活的收集数据、挖掘数据。(5)数据挖掘的保密性和安全性。因为最终的经济统计结果需要一定的安全性和保密性。对此,就需要加强数据挖掘结果的保密性和安全性,以免数据造成泄漏,隐私被别人侵犯。
五、结语。
经济统计工作对我国的经济发展有着至关重要的作用,伴随着挖掘技术在经济统计中的应用,对数据统计的分析也更显高标准化和高质量化。对此,提升数据挖掘技术的应用效果,能够有效的提升统计工作的统计结果质量,让其具备可靠、真实的特点,进而给政府提供指定社会战略发展目标的有力证据,帮助工业企业确定经济发展目标。数据挖掘技术在经济统计中具备巨大的社会效益和经济效益。
参考文献:
[1]夏昌华。统计分析的新模式-数据挖掘技术[J].统计与咨询,2012,14(2):269 -270.
[2]张宗峰,姚猛,藤立臣等。数据额挖掘及英在官方统计中的应用前景[J].江苏统计,2010,28(10):832.
[3]郑建国。基于统计的数据挖掘技术在CRM系统中的应用统计[J].河北工业大学。2010,10(03):11-13.
[4]王福根。数据挖掘技术在建模、优化和故障诊断中的应用[J].红外与激光工程。2013,35(10):621-629.
[5]马妮娜。数据库新的应用技术-数据挖掘技术[J].中国电子商务杂志。2012,6(16):20-22.
[6]张岐山。数据挖掘技术及其应用[J].管理科学文摘,2014,23(07):23-25.