1 绪论
1.1 研究背景。
随着计算机和网络的高速发展,大数据理念和大数据技术的出现,大数据的收集、分析、挖掘等为现代社会和商业等都产生了巨大的影响,大数据强大的分析洞察能力对海量目标数据的分析,可以“洞察”出隐藏在数据背后的真实规律,以此指导我们更准确地决策。美国政府也看到大数据的重要性,白宫聘请前PayPal 和 eBay 的执行官 DJ Patil 做为首席数据长,曾给政府提出如何使用大数据的专业建议[1]。
我国对大数据研究早已提出指导性方针,《国家中长期科技发展规划纲要2006-2020》、《“十三五”实施国家大数据战略》中都提出把大数据作为基础性战略资源,全面促进大数据的发展实施行动,加快数据资源共享的开放、开发应用程度,帮助产业快速有效的转型升级[2]。
同时中国人口老龄化到来、新生儿出生率降低,导致了语言类教育培训行业的客户总量的减少,而互联网下的语言类教育培训企业的快速增加,加剧了语言类教育培训企业之间的激烈竞争。如果语言类教育培训企业再按原有的企业运营模式,恐怕很难长久的生存或发展壮大。马云阿里巴巴创办人,他在台演讲时提到,未来的时代不再是 IT 时代,而是 DT 的时代,DT 就是 Data Technology 数据科技[3]。不只大企业、政府,连餐饮业都开始引进大数据技术,来帮助餐厅营运成长,包含菜单改善和数位化点餐系统。因此,语言类教育培训 TC 企业要跟上时代的步伐,借鉴国内外其他行业和教育培训行业中应用大数据的技术、经验,通过对语言类教育培训 TC 企业内部大数据的分析,提高服务质量和管理效率;通过对语言类教育 TC 企业外部大数据的分析,扩大市场份额;最终提升企业的竞争力,以实现企业的长远发展。
1.2 研究目的及意义。
1.2.1 目的。
首先,旨在提升语言类教育培训 TC 企业的竞争力,使企业能够长远发展。利用 TC 企业内部大数据优化课程产品,帮助学员更快更好的学到知识;提升教师的教学质量;更方便的管理师生提高教学管理效率。利用 TC 企业内、外部大数据精准定位潜在客户,对潜在客户进行“用户画像”,及时有效的开展营销,跟踪,直至转化为 TC 企业的真实客户,达到扩大客户群体,提升市场份额的目的。最终通过对上述历史数据的分析,加以科学利用,为 TC 企业带来良好的收益,为 TC 企业的发展带来更广阔的一片天空。
其次,大力发展语言类教育培训领域业务流程及数据应用与需求深度融合的大数据解决方案。形成大数据在语言类教育培训企业方面的产品体系。
最后,也为了推动大数据在教育培训企业中发挥其优势和作用。通过大数据技术和理念在语言类教育培训 TC 企业中的成功应用,为其它语言类教育培训企业起到指导借鉴的作用。大力推动大数据发展和应用,运用大数据推动经济发展、提升服务能力。
1.2.2 意义。
全球范围内,运用大数据推动经济发展正成为趋势,我国也相继制定实施大数据战略性文件,并且由政府大力推动大数据的发展和应用。又由于我国互联网和移动互联网使用用户人数居全球第一,具有丰富的数据资源和市场应用优势,同时大数据的关键技术研发又取得突破性进展,相继出现一批以互联网为基础的创新企业和创新应用。坚持以创新为驱动促进发展,加快大数据在我国的深化部署,加大大数据的应用,是政府对企业现代化的内在需要和必然选择。
信息化的时代,数据在企业中的作用越来越大,甚至影响企业的发展。大数据技术的开源性,使得企业利用大数据分析成为可行。将“大数据”应用到语言类教育培训 TC 企业的意义在于使用科学的数据分析,能够帮助传统的 TC 企业提升洞察力,建立差异化的竞争优势。企业运用科技手段快速推进,实现企业目标。
在国内将大数据分析应用于语言类教训培训企业还属于首例,也缺乏具体的实践应用经验,希望通过此次应用研究,能够推动大数据在其它语言类教育培训企业中的应用,也为其它企业指明方向。
1.3 国内外研究文献综述。
1.3.1 国外文献综述。
2007 年,萨尔曼·可汗(Salman Khan)[4]建设的“可汉学院”的 MOOCs 教育方式,带来了革命性的变化。2012 年后,美国顶尖大学相继创建网络学习平台[5]。现在世界上主要的 MOOCs 平台有[6]:在线大学(dacity)、课程时代(oursera)、哈佛与麻省理工共同创建的在线课程项目(edX)等。这些平台的建立,不但提高学校的知名度和社会美誉度,还对传播优质教育资源、促进人类教育发展做出贡献。美国科罗拉多州教育部在全州开发数据系统(SLDS),目的是将全州的学区和所有公立高校的学生数据与福利、收入和劳动力等数据进行整合,对州际学生的表现进行比较、对各阶段的学业成绩进行关联以及就业与学业数据进行关联分析等[7]。大数据作为一门学科[8],在美国白宫发表的《大数据白皮书(2014)》中写到“数据科学可以为生活中每个方面带来革命性的影响”。吉姆·格雷(Jim Gray)[9],图灵奖获得者,他指出大数据续实验、理论、计算之后的第四范式。这一范式研究的特点并不在意数据的杂乱,而是强调数据的量,不强求数据的精准性,不追求数据的因果关系,而是看重数据的代表性和规律的总结。大数据具有强大的潜力和能量[10],克里斯·安德森(Chris Anderson)作为《连线》的杂志主编提出“理论的终结”,他认为用因果关系验证猜想的范式已经过去,取而代之的是无需理论指导的纯粹的相关关系研究取代。数据挖掘[11] 随着算法和参数的不断调整,使挖掘和预测的结果更为准确。它不需要定制问卷和逐一调查,具有及时性。2016 年, 弗朗斯?科尔多瓦(France Cordova)[12]作为美国国家科学基金会(NSF)主任,就 “驾驭面向 21 世纪科学和工程的大数据”与“推进人机互动前沿的设计、开发和试点新型的校内外学习环境”列入前二位,同年还颁布 “为未来而学习;重新构想技术在教育中的角色”的《2016 国家教育技术规划》(简称NETP2016)的主题[13]。目前美国建立全国性或地方性的自组数据合作体,如高校财政合作体、美国高校数据交换协会、学生继续学业数据交换合作体等数据共享联盟[14]。比恩科夫斯克 M (Bienkowski M)[15]提出教育培训领域的大数据包括企业里的一切事物,教师、学员的所有行为都可以把它整理成数据。美国的布鲁金斯学会研究机构的报告[16]指出:教师通过大数据“洞悉”出的学生学习表现与相关学习途径的信息,就可以分析出学生已懂内容和针对每个学生学习时最有效的技术,不用依赖于阶段性测验的结果;通过海量数据的分析,教师还可以用更微妙的方式研究学生们的学习状态。安东尼·G·皮奇亚诺(Anthony G.Picciano)[17]教授所说:“大数据是给人们提供了拟定教育问题解决方案时的一部分决策参考。维克托·迈尔-舍恩伯格(Viktor Mayer-Sch?nberger)[18]说,大数据能够影响人类的能力,将使得人类可以用一个全新的方式来与周围的世界相处,即通过增加数据的数量来获得对世界更深刻的洞察。大数据接下来可能对无人驾驶的汽车、医疗、学习这三个领域产生更大的影响。在学习方面,所有孩子获得同样的书本和教学。低效率的教学就是在浪费脑力、知识和我们解决问题的能力。利用大数据去分析学生在发展学习能力时遇到的问题,就可以进行个性化的学习,就可以释放知识和理解力的力量,让每一个孩子充分开发潜能。大数据未来的趋势是怎么样让每个人使用大数据,而不只是用专业的大数据公司。
1.3.2 国内文献综述。
管佳[19]指出随着移动互联网的不断发展,互联网用户逐渐过渡到使用碎片化时间进行学习。马晓云[20]提出基于合理的 LMS(Learning Management System)的在线学习管理系统可以实现个性化精准服务、动向预测及热点追踪的功能。刘士新[21]提出通过 ICT(Information Communication Technology)信息共享技术,改革传统的课堂授受模式,建成多媒体教室(课堂面授)、语言实验室(课堂实践)和自主学习,使课内外相结合的课程学习体系。杨忠君[22]提出教师应该由依靠教学经验逐渐转向借助数据教学,由关注整体到强调个体,以及由着眼当下到预测趋势等转变,并不断提升自身的数据素养。所以需要教师充分利用大数据发现学员成绩低的原因。大数据思维和技能只有被教师真正运用到教学实践中,教师的教育和培训才算有效。魏顺平[23]提出大数据时代下要通过挖掘学员登录、资源浏览、学习体验等教育数据的价值,如学员登录、学员浏览模式、师生论坛交互与学员行为等影响因素综合分析,统计出“学员在线时间长度”,用来表示学员网上学习的深度。通过对某一资源的浏览总次数和人均资源浏览次数、学生的考试成绩、论坛中发帖总数与人均发帖数等指标反映学员在网上点击资源和发帖交流的频度。或者教师通过某一课程模块浏览情况的数据,分析出学生学习过程的静态信息进一步得出自主学习路径的最佳方法,还可以帮助教师获得学生学习过程的动态信息。这些数据可以为教师提供依据,用来分析学员,有针对性的为学员进行教学,提升教学质量。陈池[24]提出在线教育平台的大数据,可以为决策者提供面向平台的数据可视化、面向系统优化的统计分析。程舒通[25]提出对网站结构优化是 Web 挖掘的重要组成部分,通过使用学生的浏览数据对网站结构进行优化,方便客户操作,吸引更多的客户使用本系统。祝郁[26]通过课堂中使用信息化设备和通过设备收集到的数据进行分析,证明教学的有效性,能帮助教师提升教学行为;而且教师在实时关注学员学习的即时状态过程中,可以在“个性化”层面上深入探索与思考。通过大数据的收集、分析还可以提升教师的工作效率。林静[27]提出基于大数据也能在学校管理方面起到至关重要的作用。李文莲[28]提出企业的商业生态正在被“大数据”以各种方式和路径影响着,它已成为企业商业模式创新的基础条件。“大数据”由于能记录客户的各种行为,所以能为企业提供精准的价值主张,可以分析出客户的真实需求。面向服务的公司(Customer-Facing Companies)可利用数据细分和定位客户,但客户的真实需求又具有隐蔽性、复杂性、易变性和情景依赖性,仅依靠结构化的静态历史数据,已经很难获得真实需求。但通过“大数据”就不同,企业可以获得客户的真实需求。杨丹[29]提出大数据可以更加准确的预测客户的需求,还可以进行更深入的洞察客户行为。大数据技术的应用,使教育培训企业可以在人海中更准确的定位目标人群,从而保证精准营销的效果,这样就可以做到被动等待客户转为主动争取客户。目标人群的确定,是精确营销的基础,企业只有找准目标人群,才能根据目标人群的特征制定有效的精确营销方案,否则一切努力都是徒劳。
1.4 研究的主要内容和方法。
1.4.1 主要内容。
本文主要的研究目的是揭示国内语言类教育培训 TC 企业发展现状和存在的问题;通过实践检验大数据在 TC 企业中应用的结果;最后根据查阅的文献资料和有关大数据的技术书籍,进而给出解决问题的应对方案。本文的研究主要集中于大数据在 TC 企业中的应用,对于大数据生成、获取技术以及依赖计算机技术进行数据预处理、数据存储技术不再进行讨论。
拟从语言类教育培训 TC 企业的四个方面进行研究:
(1)通过利用大数据工具对访问 TC 企业北京学校课程产品的日志文件进行数据挖掘,从而达到对 TC 企业北京学校的课程产品进行优化的目的。
(2)运用 TC 企业已有的大量线上直播课程的教学视频、互动的信息和学员课后对直播课课程视频回放数据的分析,帮助教师提高教学质量。
(3)通过 TC 企业 Web 日志的大数据分析,确定近期的客户数量,减少因临时改变学员数量而产生的各种资源协调和大量沟通;TC 企业通过在公司网站相应页面增加 google 公司的隐藏收集页面相关数据的代码,收集 PV、UV 等各指标分析网站常规指标,对 Web 网站日志的大数据进行分析,重新设计页面跳转关系改善网站设计;系统中设立论坛,可以让学员互相解决问题,减少教师工作时长;系统通过对所有学生的作业进行分析,可以很好的对学生的学习进行管理,利用大数据提升教学管理效率。
(4)还有就是利用系统日志、本地 Cookie 等数据精准定位客户、精准营销扩大市场份额。
拟结合前文的综合论述,进行总结,同时重申论文的研究目标以及对语言类教育培训 TC 企业的展望。
1.4.2 主要方法。
本文研究的主要方法使用了文献分析法、调查法、比较法、案例实证法。文献分析法,通过搜集、鉴别大量文献,分析教育与大数据相关的理论知识。
通过对相关研究成果深入的学习分析,得出语言类教育培训 TC 企业可以利用大数据的各个方面和发展趋势。调查法,通过资料收集、面对面访谈等信息提出 TC 企业中存在的问题。比较法是一种自然科学或社会科学的研究方法。它是认识事物的一种基本方法,是通过观察,分析,找出研究对象的相同点和不同点。通过调查法收集资料,再通过比较法找出目前 TC 企业中的问题,结合文献分析法中学习的理论知识,提出解决问题的相应方案。案例实证法是 TC 企业运用大数据解决问题后,通过这个结果来证明大数据理论和技术能为 TC 企业带来更大的竞争优势,促使企业的长远发展。
1.5 技术路线及创新点。
1.5.1 技术路线。
1.5.2 创新点。
根据国内、外的研究成果证明大数据在教育行业的技术应用已经产生了巨大价值,但研究者们只是单纯的对学生端和教师端进行教与学的研究。而基于大数据在企业中的研究多为客户管理和精准营销。刘凤娟[30]曾提出国内大数据在教育企业中应用的研究都尚处于起步阶段,而大数据在语言类教育培训企业的应用在国内还属首例。
本文对大数据应用于语言类教育培训 TC 企业的课程产品设置、教师教学质量和扩大客户市场占有率方面进行研究,认为大数据在语言类教育培训行业中应用也一样能产生它的价值。但是由于语言类教育培训行业的特殊性和复杂性导致无法完全照搬照抄教育行业中应用大数据技术的所有事项,所以企业运用大数据来解决上述问题将是一个漫长的、摸索的匹配过程。首先,运用大数据的日志理论和技术针对课程产品设置具有一定的创新性。其次,运用大数据的用户画像理论和技术进行精准营销具有一定的创新性。
本章小结本章阐述了研究论文的选题背景、研究的目的及意义。介绍了国内外关于大数据在教育行业中的研究文献。介绍了研究语言类教育培训 TC 企业的主要内容和研究方法,介绍了研究技术路线和创新点。