5 高校图书馆微博影响力测评分析
5.1 基于灰关联度分析法的测评。
灰色关联分析是一种多因素统计分析方法,是以各因素的样本数据为依据,用灰色关联度来描述因素间关系的强弱、大小和次序。它的实质是整体比较,是有参考系的、有测度的比较。[32]
按照关联度进行排序,综合各个指标的特性与优点,排序结果更加科学、客观、可靠。具体方法为:首先选取各个指标中最大的数值作为参考数值,记作0X,然后分别计算各行其他数据1X,2X……nX与其参考数值之间的绝对差值,从每项指标的差值中,分别选出一个最大值和最 小 值 , 记 作 ( ) ( )XkXki-0max和 ( ) ( )XkXki-0min. 最 后 再 从( ) ( )XkXki-0max和 ( ) ( )XkXki-0min的数值中选出一个最大值和最小值,分别记作 ( ) ( )XkXki-0ikmaxmax和 ( ) ( )XkXkii-0kminmin,结果见表5.1.
分辨系数r 取0.5.
关联度最高的 3 个高校图书馆微博账号分别是清华大学图书馆、同济大学图书馆和武汉大学图书馆,也就是有较大的影响力和辐射力,关联度较低的 3 个高校图书馆微博账号为中央民族大学图书馆、东北大学图书馆和吉林大学图书馆。
5.2 基于主成分分析法的测评主成分
分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多的具有一定相关性的指标1X ,2X ……mX(比如m个指标),重新组合成一组较少个数的互不相关的综合指标nF ( n < m)来代替原来指标。[28]
将录入 Excel 中的数据标准化后导入 spss21.0 进行降维分析,得到的各指标相关系数矩阵(见附录 C:表 C1)、方差解释表(表 5.3)和因子载荷矩阵(表 5.4)所示。
特征值在某种程度上可以看成是表示主成分影响力度大小的指标。由表 5.3可知,第一主成分的特征根值为 9.526,方差贡献率为 56.032%;第二主成分的特征根值为 2.675,方差贡献率为 15.733%;第三主成分的特征根值为 1.083,方差贡献率为 7.695%;第四主成分的特征根值为 1.258,方差贡献率为 7.401%,前 4 个主成分累计方差贡献率为 86.861%,表明前 4 个主成分的数值变化就可以基本代表上述 17 个原始变量的变化。
从表5.4可以看出,运行天数、关注数、粉丝数、微博条数、原创微博、转载微博、多媒体微博、总转发数、总评论数、总点赞数、每天发布条数、原创微博率、转载微博率、多媒体微博率、单条微博评论数在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;单条微博转发数和每天发布条数、多媒体微博率在第二主成分上有较高载荷,说明第二主成分基本反映了这些个指标的信息;原创微博率和单条微博点赞数在第三主成分上有较高载荷,说明第三主成分基本反映了这些指标的信息;转载微博率和多媒体微博率在第四主成分上有较高载荷,说明第四主成分基本反映了这两个指标的信息。
所以,提取4个主成分是可以基本反映全部指标的信息,故选取4个新的变量来替代原来的17个变量。但这4个新变量的表达式还不能从输出窗口中直接得到,因为相关系数矩阵是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。用表5.4(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到2个主成分中每个指标所对应的系数。[33]
将得到的特征向量与标准化后的数据Z(见附录C:表C2)相乘,就可以得到主成分线性表达式:我们根据主成分综合模型即可计算综合主成分值,并对其按综合主成分值进行排序,即可对各样本进行综合评价比较,结果见表 5.5 所示。更加细化的第一主成分排序结果见表 5.6 所示,第二主成分排序结果见表 5.7 所示,第三主成分排序结果见表 5.8 所示,第四主成分排序结果见表 5.9 所示。通过综合主成分排序表和第一、第二、第三、第四主成分排序表可以直观的看出 17 个指标变量的变化结果。
对比表 5.1 与表 5.5 中通过两种不同分析方法得到的排名情况可以发现,表5.1 中排名前四和后四名的图书馆微博账号,在表 5.5 中的情形也是一样的,说明得到的排序结果具有一定的科学性和合理性。对比综合主成分表、第一主成分表、第二主成分表、第三主成分表和第四主成分表的排序,不难发现,五个表得出的结果基本相似,存在较小浮动。说明除了粉丝数可以作为重要的影响力衡量指标外,微博发布数、原创微博数、多媒体微博数、单条微博转发数、单条微博转发数等相关指标对高校图书馆微博的影响力的扩大都有着很重大的影响作用。
5.3 基于聚类分析法的测评。
聚类分析法是将物理或者抽象对象的集合分成相似的对象类的过程,就像本文构建的对高校图书馆有影响力的是 17 个指标,不是每一个指标对高校图书馆微博的影响都是同等重要的,需要提取出主要影响指标。这些指标之间不是相互独立的,彼此之间有一定的联系,所以先要对 17 个指标进行聚类,然后从每一类中再选出一个代表型指标。这样在保证信息没有损失的前提下既减少了指标数量,又保证了指标质量。聚类分析法又分很多种,笔者选取聚类分析法中的系统分析法,之所以选择系统分析法是由于对 17 个指标进行标准分类是需要在对这一领域有专业能力和长时间的经验积累的基础上进行的,目前聚类分析法在高校图书馆微博影响力研究方面还没有相关文献和相关指标的分类,所以笔者选取系统分析法,通过 spss21.0 中的样本分类,让系统自己分类,从分析结果中观察聚类情况。系统分析法又分为最短距离聚类法、组间联接聚类、Ward法聚类三种方法,如果聚类的结果是组内距离小、组间距大就说明分类是合理的,三种方法出来的效果基本相似,可以随意选取,笔者选取了 Ward 法聚类对17 个指标进行聚类分析。首先将统计好的数据(附录 B:表 B1)导入到 spss21.0进行聚类分析,得到 Ward 法聚表和更直观展示聚类结果的冰柱图、树状图。
根据图5.1和图5.2显示,这30所高校图书馆微博账号可以分为四类:
第一类(4个):武汉大学图书馆、同济大学图书馆、清华大学图书馆、四川大学图书馆;第二类(4个):复旦大学图书馆、华东师范大学图书馆、厦门大学图书馆、重庆大学图书馆;第三类(12个):中国科学技术大学图书馆、兰州大学图书馆、南京大学图书馆、南开大学图书馆、东南大学图书馆、北京理工大学图书馆、中山大学图书馆、西北农林科技大学图书馆、吉林大学图书馆、湖南大学图书馆、中国人民大学图书馆、北京大学图书馆;第四类(10 个):东北大学图书馆、中央民族大学图书馆、西安交通大学图书馆、山东大学图书馆、哈尔滨工业大学图书馆、西北工业大学图书馆、北京航空航天大学图书馆、上海交通大学图书馆、华南理工大学图书馆、浙江大学图书馆。
可以发现冰柱图和树状图聚类的结果非常理想,组内距离都很小,控制在五次迭代之内,然后组间距离非常大。通过以上分类并借助附录 B:表 B1 中数据可以发现,第一类中的各高校图书馆微博账号都具有较高的粉丝数、微博条数、原创微博数、转载微博数、多媒体微博数、总转发数、总评论数、总点赞数,开通微博的时间早、运维天数长,这四所学校的相关数据是 39 所高校中最高的,影响力也是最强的,其中清华大学图书馆的数据是四个当中最高的。第二类中的各项数据没有第一类的四所学校数据量高,但相对于其他高校还是占据前列的,影响力较强。第三类中的学校仍然逊于第一和第二类中的各项数据,粉丝数目明显减少,发布的博文数量相对较少,这样引起的关注度低,评论数、转发数、点赞数都不太理想。第四类中的学校是需要很大努力的,相关数据是四类中最低的,这些学校中有的开通微博时间相对较晚,发布的博文不太多,粉丝数不多,影响力弱。通过以上内容的分析,可以看出一个影响力较高的微博账号,应该具有较高的微博条数,原创微博数、多媒体微博数、转发微博数、关注其它微博数。
5.4 小结。
本章节笔者通过灰关联度分析法、主成分分析法、聚类分析法 3 种方法对17 个影响力指标的合理性进行检验,由于 17 个指标都对高校图书馆微博影响力的提升起到促进作用,无法确定哪些是最重要影响力指标。灰关联度分析法和主成分分析法通过验证指标合理的基础上,根据指标的特性对相关样本进行排序,发现 17 个指标对高校图书馆微博影响力作用的强弱,有助于找出指标中那些对影响力大的几个主要指标。对比发现两个测评方法的结果基本相似,证明测评结果还是比较理想的。之后运用聚类分析法进行聚类,通过聚类找出每一个类中的主要影响指标,通过聚类测评发现,测评的结果与灰关联法和主成分分析法的结果不谋而合,粉丝数并不是唯一对高校图书馆微博影响力存在较大影响的主要指标,本文提出的运行天数、原创微博数、多媒体微博数、单条微博被评论数、单条被转发数等指标都对微博影响力的提升有很大的促进作用。