摘 要: 随着大数据时代的到来,高等教育自学考试历经30余年发展,积累的海量考生成绩数据尤显珍贵。然而,面对庞大的考生成绩大数据,大部分高校仅仅停留在较为简单的原始数据的备份、数据查询和数据报表统计阶段,没有体现出数据与自学考试各专业、学科和课程之间的内在联系。在自学考试日常考务管理、开考计划安排和决策工作中,缺乏数据的支持,仅凭借以往经验来采取较为传统的管理方法。高等教育自学考试要向更高层次发展,就需要运用数据挖掘技术从自学考试大数据中找出各数据间的关联性,并将有用数据信息转化为知识表示,合理地利用这些有价的、隐藏的数据信息,为自学考试各专业开考计划的设置、教学管理及领导决策等提供支持服务。可以促使自学考试实现高效、规范、科学的管理,有利于推动自学考试改革的创新和可持续发展。
关键词: 大数据; 数据挖掘; 自学考试; 成绩分析;
一、引言
自学考试历经三十多年来的发展,积累了大量的考生成绩数据信息。由于我国自学考试考务管理工作还处于比较初级的阶段,考务工作人员对自学考试的数据信息没有进行深入的研究和利用。当前自学考试的课程管理、专业管理和成绩管理仍处于凭主观经验决策的阶段,管理决策过程缺乏有力的数据支撑。本文通过将数据挖掘技术引入自学考试的历史成绩分析,研究在大数据的信息背景下,自学考试管理人员如何充分利用丰富的成绩大数据资源。通过数据挖掘技术,发现大量数据项间的潜在关联。同时,对数据挖掘结果进行分析解释,并最终为自学考试领导者进行决策提供理论依据,为考生提供更好的学习服务。
二、数据挖掘技术的发展现状
1、数据挖掘技术国外发展现状
数据挖掘是近些年来新兴起的一个热门学科,数据挖掘(Data Mining)是知识发现(KDD–Knowledge Discovery in Database)的重要环节之一,指从大型数据仓库提取隐含的、未知的而对决策有潜在价值的知识和规则。1国外对于数据库的了解与研究要追溯到二十世纪八十年代后期,自从1989年首次提出知识发现KDD以来,KDD已经逐渐成为科研和行业应用的热点,成为了一门受不同领域学者关注和研究的交叉学科,相关的研究和应用非常广泛。自1989年,国外就涉猎数据挖掘技术领域方面的研究,研究的组织机构或大学很多,研究的主要侧重点在于应用方面的研究,截至目前,已经取得了较为显着的研究成果。
2、数据挖掘技术国内发展现状
国内关于数据挖掘方面的研究与应用的起歩相对于国外比较晚,在90年代中后期オ形成基本研究框架,研究的人员主要集中在大学,也有部分分布在研究所或公司。现主要侧重算法方面的研究,其中在应用领域方面的研究也十分广泛,以政府、商业、教育、金融、科研、医疗应用领域方面的研究居多。数据挖掘研究具有广泛的应用前景,大数据的挖掘能够有效的降低决策风险,提高管理者的决策水平。但是,当前数据挖掘技术在教育层面上的研究还处于初级阶段,尤其是在自学考试方面的研究属于冷门领域,研究的课题不多。数据挖掘技术与自学考试的有机结合体现了其蓬勃的生命力,未来,这种趋势将以前所未有的速度继续向前发展。
三、自学考试成绩管理中存在的问题
高等教育自学考试是教育部考试中心统一管理的一项全国性考试,有完善的考务考籍管理流程,对考生的历次成绩的管理就是其中的重要组成部分之一。自学考试历经30多年的发展,累积了海量的考生原始成绩大数据,而这些庞大的数据每年正在以指数速度增长。无论是对于考生学习情况的掌握还是从管理的角度来看,考生的历次考试成绩大数据都是有价值的数据,它能直接准确反映考生学习情况,这些大数据可以为改进自考专业计划和实施考务工作提供重要依据。人们也能够从这些丰富的自考成绩大数据中获得更为实用、更具有价值的信息。然而,目前这些大数据只有极少部分被应用,绝大部分数据还处于闲置状态。自学考试考生成绩的管理和深入研究工作并没有引起各管理部门的足够重视,各管理部门对考生成绩的管理工作还是以数据查询、汇总报表为主,对隐藏的成绩数据与各学科、专业和课程之间的内部的关联性没有深层次的联想和研究。在自学考试日常考务管理、开考计划安排和决策工作中,缺乏数据的支持,仅凭借以往经验来采取较为传统的管理方法。
四、数据挖掘技术在自学考试成绩分析中应用的必要性
大数据顾名思义是指体量特别大、数据类别特别多的数据集,并且在可承受的时间范围内,无法利用传统的数据分析处理技术对其全部内容进行抓取、管理和处理。2近年来,随着信息技术的发展,大数据的应用随处可见,例如高校就业情况的调查,国内各城市购买力分析等,大数据与我们的生活息息相关。自学考试考生成绩数据信息量庞大,是数据挖掘技术可以大有作为的一个重要应用领域。当前,自学考试成绩数据绝大部分还处于未开发或者是未完全开发状态,随着经济、社会的快速发展,如何从海量的自考成绩数据中快速提取有用的信息,成为制约大数据普及应用的首要问题。这些数据可能来自于不同地区、不同高校、不同专业,在规模上和结构上都没有统一的形式和标准。数据库存储的数据越来越趋于海量化、非结构化和多样化,传统的数据分析手段在实时性和分析结果的多样化上已经不能满足实际工作的需要,而数据挖掘技术作为一种成熟的数据分析方法,能有效的解决自学考试数据储存、分析和应用的问题。
五、基于数据挖掘技术的自学考试成绩分析应用的路径选择
1、数据挖掘技术在提高自学考试通过率方面的应用
随着社会信息技术的快速发展,数据正以前所未有的速度在不断地增长,让“数据说话”逐渐成为新时代发展的新主题,大数据时代的序幕已经悄然拉开。大数据在深刻影响着人们的生活和工作的同时,也在给社会各行各业的发展带来前所未有的变革与挑战。教育行业也不例外。传统的教育理念下,大多数的自学考试教学活动是基于老师以往的教学经验开展的,但是有些经验往往缺乏科学性的指导。通过对自学考试学生成绩大数据的深入挖掘和关联分析,可以制定出更加符合自考学生实际学习情况和自考辅导教师实际教学情况的教学方式和学习方法,从而有利于提高自学考试各科的通过率。
2、数据挖掘技术在满足学生个性化学习需求方面的应用
现在随着计算机网络技术和数据库存储等技术的发展,尤其是数据处理,数据挖掘技术进一步发展,我们可以运用信息技术的先进手段对考生成绩进行分析和研究。考务人员可以使用数据挖掘的方法分析考生历次课程成绩间的内部联系,既可为考务管理提供依据,也有针对性的对考生进行特征上的逻辑分类,让考生能够对自己的成绩分布有一个更直观全面的了解,方便考生根据自身学习情况报考课程;根据考生的各项特征运用聚类算法对考生进行群体划分,找出具有共性的考生。考务管理人员可以根据考生的群体分布,有针对性的进行开考计划设置,考生也可以根据自己的学习状况,有选择性的参加考试,数据挖掘技术的运用能够使个性化学习和个性化考试成为可能。
3、数据挖掘技术在优化自学考试课程结构方面的应用
自学考试是按开考专业进行课程管理的考试,各专业内部课程之间的联系十分紧密,但由于自学考试专业过多,考务管理人员往往无法将专业课程之间的内部联系链接在一起,只能依靠以往工作经验,进行自考开考课程设置,这不仅无法体现自考专业的个性化特征,也将影响考生的考试积极性。从管理的角度来看,通过数据挖掘技术深入研究学科之间的内部联系,并将其应用于考务管理工作中,不仅可以使考生认识到课程之间的先后递进关系,还能够根据当前自身的学习和考试情况,有选择性地参加考试。对于管理部门来说,将收集到的大量成绩数据深度挖掘,分析成绩之间的内部联系,调整优化课程设置,从而能够更加准确的寻求自学考试的发展规律和方向,使之真正适应考生的学习节奏。
4、数据挖掘技术在实现自学考试精确化、科学化管理方面的应用
自考考务管理系统中存储了大量考生的考试成绩信息,但这些大数据长期以来一直没有得到有效的利用,考务工作人员仅停留在对数据库中存储的归档,成绩信息进行简单的数据查询和报表打印,还远远谈不上对数据的研究利用。开考计划的安排也缺少数据上的参考依据。因此对考生的成绩数据进行深入分析,发现隐含关系,是非常必要的,它能为优化考试设置和考生参加考试提供直接而准确的信息。同时,通过基于关联规则的数据挖掘技术的应用,可以充分考虑到各学科、各专业、各课程之间的关联关系,改变了以往开考课程设置无依据,随意性强的状态。一方面,根据考生成绩挖掘系统给出的数据报告,有针对性的设置考试计划。对开考课程进行优化配置,一定程度上能够提升考生的考试通过率;另一方面,通过大数据分析,自考辅导教师可以随时随地了解学生的基本学习情况,预测学生未来(下转第46页)学习上的表现,也可以进一步促使教师对教学过程进行自我反思,及时发现潜在问题,从而优化自学考试教学过程。推动自学考试学习评价由依靠经验评价向依据数据挖掘技术的客观评价方式转变。通过深入挖掘自学考试学生成绩大数据并对其发展规律进行总结,将促进传统教学方式的变革,对提高自学考试教学效率具有重要的指导意义。总而言之,通过挖掘自学考试成绩的数据信息,有利于实现自学考试管理的精确化、科学化,使自学考试管理方式变得更加便捷。同时,还能够为自学考试课程的设置、教学的管理等方面带不来不可估量的价值。
六、结束语
随着互联网络技术的飞速发展,大规模非结构化数据快速积累,数据挖掘技术在自学考试中的应用越发广泛,大数据的发展对于自学考试事业的繁荣和发展具有划时代的意义。高等教育自学考试要向更高层次发展,就需要运用数据挖掘技术从自考大数据中找出各数据间的关联性,并将有用数据信息转化为知识表示,合理地利用这些有价的、隐藏的信息为自学考试各专业开考计划设置,教学管理等领导决策提供支持服务。但是,我们在利用大数据进行有益尝试的同时,也必须清醒地认识到大数据在带来机遇的同时也可能给人们带来挑战,例如,数据挖掘也涉及数据的私有性和安全性问题。大数据作为一把双刃剑,我们在应用中只有和专业知识相结合才能做出科学的判断,才能促使自学考试实现高效、规范、科学的管理,推动自学考试改革创新和可持续发展。
参考文献
[1]Han Jiawei, Kamber Micheline.《数据挖掘:概念与技术》[M].机械工业出版社, 2012.
[2]曾泽林,段明秀.基于密度的聚类算法DBSCAN的研究与实现[J].科技信息,2012(10):162-163.
[3]赵岩.数据挖掘中的关联规则技术研究[J].西安电子科技大学,2008,(1):1-67.
[4]刘海燕.谈数据挖掘在高校成绩分析中的应用[J].才智,2014,(22):81.
[5]褚志涛.关联规则挖掘在开放教育教学管理中的应用[J].南京广播电视大学学报,2019,(1):63-65.
注释
1陈涛,王万荣.基于关联规则的数据挖掘技术在教学评价及学生成绩关系之间的应用研究[J].安徽科技学院学报,2013,27(6):62-65.
2隋菱歌.应用智慧化技术推动金融服务创新[J].《长春金融高等专科学校学报》,2016(1):59-64.