2.3.2课题组数据集的关联规则分析
本文在聚类分析的基础上,采用关联规则分析法来探讨科研绩效评估结果与科研人员的最高学位、职称、年龄之间的关系。数据表见表2,其中,表1中簇1栏中项目组人员的评估结果为优,簇2栏中项目组人员的评估结果为良。对科研人员的年龄进行了分段,A1表示科研人员年龄<=30岁,A2表示31-35岁,A3表示36-40岁,A4表示41-45岁,A5表示46-50岁,A6表示51-55岁,A7表示56-60岁,A8表示61-65岁,A9表示>=66岁。
通过关联规则Apriori算法挖掘出项目组科研人员数据表中各个属性之间的关联规则,并设定Smin=0.05,Cmin=0.20,得出如下的关联规则,如表3所示。表3中X表示最高学位和职称,Y表示评估结果。
从表3中的关联规则可知:拥有博士或硕士学位的人员科研经验丰富,评定结果为优的可信度和支持度较高;具有教授或副教授职称的人员具有丰富的科研经验,评定结果为优的可信度和支持度较高。从加强学校科研团队建设目标出发,应该吸收学位低的人员参与科研活动[7],同时要培养职称低的人员,丰富他们的科研经验,提高他们的科研能力。
3 结语
本文对江苏科技大学2011-2015年间获批的国家级项目数据集进行了数据挖掘,结果表明材料学、海洋工程、机械工程、管理科学与工程、养蚕学是江苏科技大学自然科学的优势研究学科,自动化、物理学、生物学等学科在快速发展,计算机科学、电子学等其他学科还需要提高。同时对项目组科研人员数据信息进行了关联规则分析,发现了受教育程度和职称是影响科研人员科研绩效的主要因素,从而可以实现科研团队的优化配置,提高科研能力。通过以上分析,为凝练江苏科技大学优势科研领域,确定科研创新团队、重点项目、标志性成果等的培育对象提供了参考决策依据;为有的放矢地支持重点科研领域建设、提升学校核心竞争力奠定了一定的基础。
参考文献
[1]冯文霞,王广安。数据挖掘在服务成本预测方面的应用研究(SDCF-DM)[J].软件, 2013, 34(4): 46-48
[2]曾洪周。数据挖掘在国土资源档案馆中的应用[J].兰台世界, 2007, (12), 11-12.
[3] Pang-Ning Tan, Michael Steinbach.数据挖掘导论[M].北京:人民邮电出版社, 2010.
[4]杨雪霞。数据挖掘技术在高校图书馆管理系统中的应用研究[J].软件, 2011, 32(4): 16-18.
[5]刁雅静,卢健。基于权重的关联模式分析改进在网站优化中的应用[J].江苏科技大学学报(自然科学版), 2012, 26(3),305-308.
[6]徐立波。高校科研业绩积分管理系统研究[J].软件, 2014,35(2): 10-12.
[7]秦勤,段秋红,何永强。科研绩效评估中的数据挖掘研究[J].河南工程学院学报(自然科学版), 2010, 22(4), 60-62.