摘 要: 本文基于企业互联网招聘数据,对2018年以来我国企业的招聘形势和特征进行了分析。总体看,受经济下行压力加大等多种因素影响,近年来特别是2018年以来我国企业招聘意愿趋于谨慎,招聘岗位数量呈逐步下行态势。从行业结构上看,服务业在企业招聘中占比高达85%左右,已经成为我国新增就业主渠道;从企业性质看,民营企业招聘占比高达八成以上,是我国就业创造的主力军,同时,民营企业、国有企业以及创业企业招聘占比均有小幅上升,而外资企业占比从2017年以来则出现小幅下滑。此外,本文发现,招聘大数据不仅与PMI从业人员指数等调查统计数据保持较高相关性,与传统就业统计数据相比,招聘数据能够更灵敏、准确地反映工业增加值等主要经济指标走势变化。
关键词: 招聘; 大数据; 就业; 工业增加值;
就业是民生之本、财富之源。党中央、国务院高度重视就业工作。2018年12月召开的中央经济工作会议,明确将“稳就业”列为“六稳”之首,并将就业优先政策纳入宏观政策层面。加强就业形势监测,做好就业形势研判,是做好“稳就业”工作的必然要求。传统上,就业形势分析主要依赖各类统计调查数据,但由于统计制度尚不完善、相关专业人才不足,当前我国就业统计数据仍存在指标设计不完善、数据质量欠佳、发布时间滞后等多种问题,难以全面科学地反映我国就业形势的变化(张一名、徐丽,2016)。而随着现代信息技术的快速发展,各类市场主体在求职、招聘过程中产生了大量的数据资源,这类数据经过适当的收集、清洗、整理后,能够有效地弥补统计调查数据存在的部分短板,并已在就业、经济形势等研究分析中受到越来越广泛的关注和应用。本文在对当前就业领域主要大数据资源及相关应用介绍的基础上,重点基于招聘大数据对我国当前就业形势及基本特征进行分析;并通过对招聘数据与相关经济、就业调查数据的相关性的比对分析,对招聘数据的质量和可靠性进行检验;最后还描绘了未来本领域的相关研究方向。
一、大数据在就业形势分析中的应用现状
现代信息革命特别是大数据技术的快速发展,让我们可以近乎实时地收集各类行政记录数据和私营部门行为数据,从而极大地扩展了现代经济研究中可资使用的数据范围和研究范围。目前,针对大数据在现代经济研究特别是实证研究中的应用,国内外已经有了大量的相关文献。例如,麻省理工学院的“十亿价格项目” (The Billion Prices Project,BPP)的研究人员与互联网零售商合作,基于每天收集的网上零售商品价格构建了价格指数,该指数与官方发布的消费者价格指数具有高度的相关性(Einav & Levin,2014)。Glaeser et al.(2015)通过将谷歌街景数据与美国社区调查中的普查街区家庭收入中位数关联,并采用V-支持向量机法形成基于谷歌街景数据的家庭收入预测,该方法在验证集中表现出了强大的预测能力。Varian(2014)专门探讨了基于大数据的计量经济方法模型。张涛、刘宽斌(2018)等也探讨了大数据在宏观经济预测中的应用。
就业作为宏观经济和社会发展的重要组成部分,近年来基于大数据的相关分析研究也在快速增长。总的来看,目前就业大数据研究中所涉及的数据源主要包括互联网舆情数据、互联网搜索引擎数据以及企业互联网招聘数据等。其中,对就业互联网舆情的分析主要采用机器学习(ML)、自然语言处理算法(NLP)等提取互联网中就业相关舆情数据,并通过对互联网就业舆情的情绪分析,判断未来的就业走势。除互联网就业舆情外,不少研究人员基于对互联网搜索引擎中就业、失业相关词条的搜索量变化情况分析就业走势。2005年Ettredge等即开始探索互联网就业相关搜索数据与失业率之间的关系(Ettredge et al.,2005),并发现就业搜索相关变量与官方失业数据之间存在显着的正相关关系。任泽平等(2019)也基于百度相关搜索指数对当前我国就业形势进行了分析研判。进一步地,Choi & Varian(2012)分析了谷歌趋势中就业/失业相关搜索数据与初次申请失业救济人数之间的关系,发现加入谷歌趋势相关数据后,模型能够更好地预测衰退时期的初次申请失业救济人数。而随着越来越多的求职招聘行为由线下转为线上,基于求职招聘大数据的就业形势分析也受到越来越多的关注。例如,基于智联招聘集团的求职招聘数据,中国人民大学中国就业研究所与智联招聘集团合作开发了中国就业市场景气指数(CIER),以反映中国就业市场的整体走势及景气程度,已经成为相关政府部门的重要决策参考。
二、从招聘大数据看当前我国的就业形势
本文对就业、经济形势的分析也主要基于企业互联网招聘数据。与CIER指数仅使用智联招聘数据不同,本文使用的招聘数据来自佰职科技(北京)有限公司,该数据覆盖了2017年以来全国413家招聘网站、2135家求职BBS以及1221家大型公司招聘网站的招聘数据。具体而言,针对企业互联网招聘信息,首先对招聘文本数据进行结构化处理,提取招聘文本中的招聘人数、招聘岗位、薪资待遇等结构化信息。再采用深度学习算法对所采集的数据进行清洗,以修正原始数据中存在的缺失、矛盾问题,并剔除不同招聘平台中的重复招聘信息,确保数据质量。基于该数据,可以对我国近年来企业招聘总体形势以及相关行业、人员等结构特征进行分析。
从对2018年以来我国企业互联网招聘数据的分析看,当前我国企业招聘情况总体呈以下几个方面特征。
图1 2018年以来我国企业互联网招聘岗位同比变化情况
(一)企业招聘趋于谨慎
2018年以来,由于受经济增速下行及中美经贸摩擦等多种因素影响,企业发展面临的不确定性和风险因素明显增多,企业发展信心受挫,在招聘新员工等方面也逐步趋于谨慎。图1的招聘数据显示,2018年以来,我国企业互联网招聘岗位规模呈逐步下行态势,同比增速由2018年1月份的38.3%下滑至2019年6月份的-22.6%,下降了近61个百分点。在2018年1月至2019年6月的18个月期间,企业互联网招聘岗位量出现同比收缩的月份达16个月。此外,从企业招聘的薪酬待遇来看,2018年以来也出现了明显的波动下行态势。监测数据显示,2019年6月,企业招聘平均意愿薪资为6314元,较2018年1月份下降了14.9%,这也从另外一个侧面验证了当前企业招聘意愿总体偏低,就业市场压力明显加大。
(二)服务业已成为我国新增就业主渠道
从招聘行业结构看,2017年以来,服务业相关行业招聘量占企业互联网招聘总量的比重总体在85%左右波动,这表明,随着近年来服务业不断发展壮大,服务业已经成为我国新增就业岗位的主要来源。但同时需要注意的是,由于受宏观经济环境以及相关政策调整的影响,近年来我国金融业、房地产业以及软件业等服务业行业招聘岗位数量均出现较大幅度萎缩,加大了就业面临的总体压力。这也意味着,在我国稳就业的总体战略布局中,确保服务业就业需求总体保持稳定是稳就业工作的重中之重。在制造业方面,2017年以来,制造业企业招聘岗位规模占企业互联网招聘总量的比重总体维持在12%左右;其中,由于市场需求疲软,2018年以来,汽车以及机电设备制造等行业招聘岗位规模出现较大幅度下滑。
(三)民营企业是我国创造就业的主力军
从招聘的企业性质来看,民营企业招聘岗位量占企业互联网招聘岗位总量的比重由2017年的83.7%小幅攀升至2019年上半年的84.2%,进一步夯实了创造就业岗位的主力军作用。在此期间,国有企业招聘岗位占比也有小幅上升,由2017年的4.8%上升至2019年上半年的5.0%。此外,随着创新创业环境不断改善,大众创业、万众创新蓬勃兴起,创业企业的就业带动能力日益凸显,招聘岗位占比由2017年的0.6%稳步攀升至2019年上半年的1.1%。但与此同时,由于受中美经贸摩擦等因素影响,近年来外资企业招聘需求占比出现一定程度下滑,由2017年的10.9%下降至2019年上半年的9.7%。
三、招聘大数据的质量及可靠性检验
虽然本文已经基于佰职科技公司的招聘大数据,对近年来我国企业招聘的发展态势和主要特征进行了简单分析,但招聘大数据是基于对企业互联网招聘文本数据进行结构化处理,并经过相关算法清洗后获得。由于不同的机构在数据采集范围以及相关数据采集、清洗的算法方面都存在较大差异,所以要将招聘数据应用于就业形势分析,必须对相关的数据质量及可靠性进行检验。因此,本文还要通过对招聘大数据与就业、经济相关统计数据的相关性分析,对所使用的招聘大数据的质量和可靠性进行简单的检验。
表1 企业互联网招聘岗位同比增速与主要就业统计指标相关系数
图2-1 企业互联网招聘岗位同比增速与调查失业率人员指数散点图
图2-2 服务业从业人员指数散点图
从招聘数据与主要就业指标的关系看,招聘大数据与调查失业率相关性较弱,与采购经理人指数中的从业人员指数相关性相对较高。简单的相关分析显示,2018年1月-2019年6月,企业互联网招聘岗位增速与统计局调查失业率的相关系数为0.130,不仅绝对值相对较小,同时符号也与理论的预期相反(从理论上讲,招聘快速增长时,就业压力较小,从而失业率也应较低,招聘增速与调查失业率之间应存在负相关关系)。但另一方面,除关注调查失业率指标外,我国的学者以及政策制定者在分析就业形势时,通常还会关注采购经理人指数中的从业人员指数等指标。对此,本文也分别计算了招聘岗位增速与制造业从业人员指数及服务业从业人员指数之间的相关关系,从结果来看,招聘岗位增速与采购经理人指数中的从业人员指数之间存在较强的相关关系。具体看,2018年1月-2019年6月,招聘岗位增速与制造业从业人员指数间的相关系数达0.315,与服务业从业人员指数间的相关系数达0.397,这表明招聘岗位增速与采购经理人指数中的从业人员指数走势具有较强的一致性。此外,本文进一步计算了制造业招聘岗位增速与制造业从业人员指数以及服务业招聘岗位增速与服务业从业人员指数之间的相关系数。2018年1月-2019年6月,制造业招聘岗位增速与制造业从业人员指数相关系数达0.388,而服务业招聘岗位增速与服务业从业人员指数之间的相关系数,则达0.405。
从与工业增加值的相关性看,招聘岗位同比增速与工业增加值同比增速间相关度较高,且显着高于其他就业统计指标与工业增加值间的相关水平。2018年1月-2019年6月,招聘岗位同比增速与工业增加值同比增速间的相关系数达0.536。与之相比,调查失业率与工业增加值同比增速之间的相关系数仅为0.053(同时,该相关系数符号与理论预期也相反),制造业从业人员指数与工业增加值同比增速之间的相关系数也仅为0.255。这表明,与其他主要就业指标相比,本文所采用的招聘大数据能够更加有效、灵敏地反映经济形势特别是工业发展态势的变化,具有较高的质量和可靠性,从而提升了将企业互联网招聘大数据用于分析就业、经济形势的信心。
表2 工业增加值同比增速与相关就业指标相关系数
图3-1 工业增加值同比增速与企业互联网招聘同比增速散点图
图3-2 调查失业率散点图
四、结论及对未来研究的建议
本文基于企业互联网招聘大数据,简要分析了当前我国的就业、招聘形势。分析表明,受经济下行压力日趋加大、企业发展内外部风险不断积聚等多种因素影响,近年来特别是2018年以来,我国企业招聘总体趋于谨慎,招聘岗位数量呈逐步下行态势。但分析也表明,随着我国经济发展方式和经济增长动力加快转变,服务业已经成为我国新增就业的主要渠道,同时,随着营商环境不断改善,民营企业就业创造的主力军作用日益巩固,创业企业的就业带动能力日益凸显。此外,本文还进一步研究了企业互联网招聘大数据与相关就业统计指标以及工业增加值等经济指标的关系。结果显示,招聘大数据与PMI从业人员指数等调查统计数据具有较强的相关性,同时,与调查失业率等就业统计指标相比,招聘大数据能够更灵敏、准确地反映工业增加值等主要经济指标走势变化,这表明本文所采用的招聘大数据具有较高的质量和可靠性。
招聘大数据在就业形势等领域的分析应用总体处于初步阶段,仍有很多领域有待进一步的研究。(1)当前,我国已有多家企业、机构在从事招聘数据的采集、开发工作,但在数据采集的范围、数据清洗的规则以及数据算法等方面都存在较大差异,数据质量参差不一。对此,应积极推动建立科学合理的招聘数据的采集、清洗标准体系,进一步提升数据质量,确保分析结果的可靠性;(2)随着我国稳步推进产业转型升级,加快构建现代产业体系,企业的劳动力需求特征和结构都在发生深刻的变化,并有可能导致劳动力供需结构的错配。对此,可以基于就业招聘数据,加强对劳动力需求长期结构性特征的分析和研判,并用以指导相关人才、就业政策的制定;(3)就业作为宏观经济的重要领域,调查失业率等统计指标一直以来是宏观经济态势分析的主要参考指标。本文的分析也表明,与传统的就业统计指标相比,招聘数据在反映工业增加值增速变化等方面具有更高的灵敏度。对此,未来可以考虑将招聘数据纳入相关宏观经济预测模型或景气模型,用于宏观经济形势的分析研判和政策制定。
参考文献
[1]Edward Glaeser et al.Big Data and Big Cities:The Promises and Limitations of Improved Measures of Urban Life[R].NBER Working Paper,No.21778,2015.
[2]Hal Varian.Big Data:New Tricks for Economics[J].Journal of Economic Perspectives,2014,28(2).
[3]Hyunyoung Choi & Hal Varian.Predicting the Present With Google Trends[J].Social Science Eletronic Pubilishing,2012,88(s1):2-9.
[4]Liran Einav & Jonathan Levin.Economics in the Age of Big Data[J].Science,2014,346(6210).
[5]Michael Ettredge,John Gerdes & Gilbert Karuga.Using Web-based Search Data to Predict Macroeconomic Statistics[J].Communications of the ACM,2005,48(II):87-92.
[6] 任泽平,熊柴,周哲.中国就业形势报告:2019[R].恒大研究院,2019.
[7] 张涛,刘宽斌.“大数据”在宏观经济预测分析中的应用[J].财经智库,2018,3(3):65-83.
[8] 张一名,徐丽.我国就业统计指标及数据配套问题研究[J].中国劳动,2016(6):12-16.