一、引言
目前,大数据(big data, mega data),也称巨量资料,是那些需要由新模式来处理的信息资产。这些信息资产,具有更强的决策力、具有流程优化能力,还具有海量性、高增长率和多样化的特点,成为了全球关注的热点。另一边,上个世纪 50 年代起以美国信息公开运动为起点,全球进入信息社会,几十年来各种信息方便了人们的生活和工作。信息公开使数据和资料的可获得性大大提高,同时,数据的处理和存储越来越快、越来越方便,数据的积累也越来越便利。我们看到,数据资料及其增长状态每一秒都发生着变化,在教育、医疗、金融、商业、传媒、交通和服务等各个领域都得到很好的应用,并激发出巨大的能量。由此我们可以得知,大数据在给企业经营和政府管理等活动创造有效机制的同时,也必将带来生活、工作、决策和思维上的重大变革。
社会科学研究方法是一门方法论学科,对行政管理专业学生来说,在本科学习和毕业工作中,都会涉及到很多方面的实证资料,包括大数据时代越来越多的数据,也会涉及到一些大数据分析。研究方法一直是行政管理本科专业的核心课程和必修学科之一,量的研究包括研究选题、研究设计、资料收集、资料分析、研究报告的撰写这些基本环节,并且环节与环节间都是融会贯通的。其中,还需要指导学生根据课题研究的方法适用性,在研究设计环节运用社会统计学的知识,取舍变量、设计问卷、确定抽样方案;在资料分析环节会应用统计软件,要完成一项量的社会研究,需要结合研究方法、社会统计学、社会科学统计软件三方面的知识和技能。但在高校行政管理专业中,由于定量研究抽象、统计基础薄弱,研究方法教学的展开和教学效果几乎都不十分理想。提高行政管理本科生的研究方法教学效果、提高学生应用社会科学研究方法的理论知识与方法解决实际问题的能力,是许多专业教师一直在思考的问题。
毋庸置疑,信息社会背景和大数据的发展,给人类自然科学技术和人文社会科学带来重大发展变革,还给我们的研究方式带来新的变化和要求。笔者认为,在大数据时代,研究方法教学的必要性和重要性更加凸显,因为从数据的处理流程来看,大数据的处理和实证研究的过程是相通的,即“资料收集 -- 预处理 -- 分析 -- 显示 -- 解释”.本文从大数据对研究方法教学的影响及对策两个角度探讨大数据时代社会科学研究方法的教学问题。
二、大数据对社会科学研究方法教学的影响
大数据对社会统计学的不少理论、观念与方法具有多方面的影响,甚至冲击,对统计学的影响和冲击同时对社会科学研究方法也产生了挑战和机遇。这些新的变化,一方面对研究方法和统计学科的结合发展具有划时代的意义,需要社会统计学解决更多、更复杂的问题;另一方面也对研究方法的教学工作提出了更高的要求,要求进行教学改革和理论与方法的创新。其影响具体表现在以下三个方面:
1. 获取资料方式多元化
以往我们的数据主要是由社会调查和向有关部门调研获得的。在统计调查中,除了在较大经济实力支持下、对国计民生具有重要意义的数据收集采用普查,在大多数情况下,社会科学的研究多采用抽样调查的方法得到数据。而在大数据的背景下,结合其大量性、高速性、多样性的特征,统计数据的产生方式呈现多样化,我们研究过程中获取资料的方式也变得多元化。数据量大,并且呈现几何级数增长。但在教与学的过程中必须认识到,海量的数据虽然获取便利,但有价值的、能被研究者利用的数据可能不多,与传统的数据相比,到手数据的价值体现得并不明显。从这个意义上说,获取资料方式多元化,也让调查数据的整理工作更为复杂,这也许是我们教学工作需要重点加强的一个方面。
2. 研究对象结构复杂化
以往通过统计调查和实验得到的数据是结构化数据,例如:时间序列(Time series)数据。结构化的数据可以很方便地用二维统计图和统计表格直观地表现出来,对应的是我们教学中描述统计的部分。而大数据时代的数据,如前所述,海量数据结构复杂,除少量数据具有结构化特征外,更多的是非结构化数据,很难用二维图表表示,比如视频、图像。在大数据时代,数据的收集是自然发生的,漫无目的的,获取数据之前没有特定的目的,这区别于我们的研究设计工作--调查前首先要确定收集数据的目的和用途。因此数据的价值密度低,面对各种结构的研究资料,就像公安机关根据监控视频破案一样,也许看了海量的视频,到头来一无所获。但是另一方面,这些“大数据”--海量的监控视频,由于量非常大,通过公安机关的各种分析后,也许最终能为研究案情带来很多意料之外的用途和价值。这就是数据的复杂化,或说是我们研究对象结构的复杂化,对资料的整理、显示和分析等都提出了更高要求。
3. 统计思维和统计分析方法受到冲击
社会科学研究方法是一门方法论学科,我们的教学围绕着实施一项社会科学研究的完整过程来进行。在研究过程中,涉及统计学科的工作包括统计设计、收集数据、整理与分析和统计资料的积累应用。大数据背景下,数据资料异常丰富,也许我们直接面对的就是数据的总体,而不仅仅只通过抽样调查获得样本;数据的多样性、结构复杂性也给统计带来许多新的要求。由此看来,会在统计思维和统计方法两方面产生影响。第一,对现有的传统的社会统计思维的影响。传统的社会统计思维面向样本、面向结构化数据、面向简单数据,采用的处理思维方式包括:平均思维、推断思维、相关思维、对数思维、指数思维等,这些统计思维直到今天都在为经管类从业人员和研究学者使用,对分析数据和解释数据产生巨大的影响,是统计学科的核心内容。但是大数据时代我们面对的是研究对象总体,而非样本,因此,有些传统统计思维可能用得少、用不上,比如,由样本推断总体的推断思维。
第二,对现有统计方法的影响。在社会科学研究方法课程中,要给行管学生介绍的统计学原理和方法包括基于大数定理和中心极限定理、推断统计、参数估计、相关与回归分析、因子分析与聚类分析、层次分析等。英国数据科学家维克托 Viktor 在《大数据时代》一书中指出:放弃对因果关系的渴求,而取而代之关注相关关系。[2]大数据复杂的特点决定了变量与变量之间复杂的关系,较传统的思维方式来说,大数据时代下倾向于做相关分析,找出变量之间因果关系的回归分析也许不那么重要。也就是说未来的研究会只注重要知道变量间关系 “怎么样”(相关关系),而不需要知道哪个变量导致哪个变量的“为什么”(因果关系)。另外,由样本推断总体的推断思维对应的方法,比如假设检验、参数估计等方法也会弱化。
三、适应大数据时代要求的研究方法教学改革设想
维克托 Viktor 在《大数据时代》一书中用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。基于以上论述,笔者认为行政管理本科阶段的社会科学研究方法可作出以下调整与改革:
1. 强化研究方法教学的实践性
社会科学研究方法这门课程本身就是一门实用性很强的学科。增强学生应用方法解决实际问题的能力,帮助学生养成规范的研究习惯,提高学生综合运用统计知识的水平,是教师教学和学生学习的最终目的。由于数据无处不有、无处不在,所以人人都会接触到数据和统计,只不过科研人员对数据和统计运用得相对复杂些。在大数据时代,我们所面对的数据具有总体特征,面对研究对象,需要进行全面深入分析,才能得到有价值的结论。
因此,大数据时代的教学首先应该加强应用性教学,凸出实践性,而不是过多强调数学、概率论、统计学,因为很多统计学原理是基于大数定理、中央极限定理、运用推断思维,并且用于小样本研究的。具体来说,加强教学的实践性,从研究流程来梳理,包括:
(1)加强资料收集手段的教学。大数据时代下,数据和资料的产生方式发生很大变化,因此,需要增加部分大数据方面的数据、资料的来源和收集方法的教学内容。(2)加强资料的统计整理教学。对目前的统计分组教学这部分内容,应适当向学生补充一些数据的统计分组、分类内容的教学,以适应大数据结构复杂的特点。(3)加强资料的透视化方面的教学。这是基于大数据的非结构化特征提出的,因为我们很难将新形式的数据用传统的数据表格等二维形式予以直观化表现。因此,除了目前常用的几类统计图、统计表格外,教学过程中还可以补充介绍一些比较复杂的数据透视化技术方面的内容和方法,也是现在学界提出的“科学可视化”(Scientific Visualization),同样可以提高学生对数据处理的认识和分析能力。
2. 培养学生大数据统计思维
美国统计学家 C.R. 劳提出,“统计,与其说是收集整理数据引出答案的一组规则,不如说是一种思考或推理的方法。”在传统的定量研究与分析的教学中,加强学生统计思维的培养,提高学生处理数据和运用数据分析实际问题能力,是完成和做好社会科学研究的重要一环。在大数据时代,统计思维的培养更为重要。
大数据本身大量、复杂的特性,要求研究者有很好的统计思维,否则容易真假数据混杂。同时,在一个研究中,以前的做法往往是根据一个理论前提,先假设变量之间某种关系存在,然后根据统计假设,有针对性地设计因变量(交互项等)、计算变量之间的相关关系;在确定现象之间的相关关系后,往往下一步是根据相关关系建立回归方程(linear regression),通过不同的方程、模型,探求现象之间的因果关系。这种“先假设,后关系”的分析思路适用于小数据。当我们面对的数据资料是大数据时,不仅数据量庞大,而且变量与变量之间的关系复杂:可能是线性关系,更可能是非线性函数关系。所以我们教学中,要注重培养和转变学生的统计思维,即寻找变量与现象之间的相关关系,根据变量与现象之间的相关关系进行关联预测,包括简单相关和复相关,达到触类旁通的教学效果。
3. 突出性统计知识的基础性教学
我们的研究方法教学中,数据分析部分与概率和数理统计理论联系密切,不少同学反映,统计学的概念抽象,运用起来困难,这种难学问题在高校行政管理本科学生中很普遍,授课教师也感到统计学教学开展不容易、教学效果不理想。[] 因此,在这一部分的教学内容中,要针对统计学的特点,结合行政管理的实际,注重基础内容的教学,特别是要深入浅出地把基本概念、范畴、原理和公式等讲透,最好结合实际案例,举例说明如何应用在我们的研究当中,如何通过哪一种原理能够分析出何种现象,使学生更好地理解并掌握这些内容。在教学中应突出基础性,加强基本概念、基本原理和基本方法的教学,为学生的数据分析打下坚实的基础。
4. 加强复合型人才培养
对于行政管理本科专业的研究方法教学来说,应该考虑到课程知识的联系性和实际管理活动中现象的联系性。在教学中建立联系,要注意教学内容整体与局部的关系,引导学生从整体(整个研究过程)到局部(每个研究环节)再到知识点(具体研究方法)进行学习。也就是说,要先弄清教材内容框架,梳理清楚各个章节之间的逻辑关系;在学习每一章时,应先介绍该内容在研究中的地位,与前后几个研究环节之间的联系,然后再弄清本章的内容组成、各部分之间的联系;最后再去帮助学生掌握每一节的具体内容和知识点。另一方面,还要强调整个研究过程的流畅性。
研究方法本来就不是什么晦涩的课程,我们的教学侧重经验研究,主要做量的研究,它的目的是通过收集资料,发现有用的信息;通过数据,试图找到客观现象发展变化的内在规律或趋势。因此也就相应有一系列的流程,应循序渐进地进行教学。同时要明确:
仅仅具有研究方法是不够的,如果对社会、经济、政治现象认识不清,如果对有关现象缺乏准确的把握和理解,即便背熟了方法,也未必能做到灵活运用;只有能够深刻理解大数据并懂得如何利用、分析大数据的人,只有经过仔细剖析,真正理解其涵义,才能有效解读、分析和解决实际问题。这提示我们教育工作者,教学应该通过基础知识、基本原理和统计思维的教学,努力培养学生的数据意识和数据素养,提高学生对整个研究过程的把握,同时要增加统计软件使用课程,使学生具备多方面的知识和技能,为学生未来的可持续发展奠定较好的基础。
参考文献:
[1] 杨旭 , 汤海京 , 丁刚毅 . 数据科学导论 [M]. 北京 : 北京理工大学出版社 ,2014.
[2][ 英 ] 维克托 ? 迈尔 ? 舍恩伯格 . 大数据时代 : 生活、工作与思维的大变革 [M]. 杭州 : 浙江人民出版社 ,2012.