引言
从 1945 年美国学者万尼瓦尔 ·布什( V.Bush) 在发表了着名论文《诚如所思》( “As WeMay think”) 算起,情报学真正作为一个学科诞生已有近 70 年的历史[1].随着学者们研究的不断深入和信息技术等技术手段的不断发展,情报学的研究内容和方法也在不断的发展变化。对情报学的研究热点及前沿进行研究分析,不仅能深入揭示情报学学科当前的研究现状、特点和轨迹,而且有助于研究人员更好地把握本领域的研究前沿和演进趋势。本文借助 Citespace 信息可视化分析工具,对近五年来 CSSCI( 中国社会科学引文索引) 来源文献中情报学相关论文进行分析,以期对我国情报学的总体发展脉络和演化进程有一个较为全面、客观的认识和把握。
一、数据来源及研究工具
( 一) 数据来源
本文研究数据来源于 CSSCI 来源期刊数据库。选取数据库为 2009 - 2013 年来源文献数据库,学科类别为“图书、情报和文献学”,学位类别为“情报学”,文献类型为“论文”,构造检索式:LY09,LY10,LY11,LY12,LY13,: LX = 论文^XK =图书馆、情报与文献学^XW = 120502 $ ,检索时间为 2014 年 1 月 13 日,最终命中文献 3700 篇,其中,2009 年 857 篇,2010 年 956 篇,2011 年 883篇,2012 年 818 篇,2013 年由于文献入库时滞问题,为 186 篇。
( 二) 研究工具
本文采用了由美国 Drexe1 大学陈超美博士开发的科学知识图谱工具 Citespace 进行可视化分析与展示。科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。它通过空间表征法显示各知识领域间的关系,特别是通过揭示由科学文献和引文路径的复杂交织所反映出的科学交流[2],实现了知识领域的可视化( Knowledge Do-main Visualization) .通过 Citespace 提供的知识图谱绘制功能及数据聚类分析功能,可以较好地解决抽象知识表征难的问题,进一步协助研究人员挖掘和阐释研究数据背后的深层含义。
二、情报学研究热点与前沿问题分析评价
( 一) 情报学研究热点可视化分析
所谓研究热点,是指在一段时期内,有内在联系的、数量相对较多的一组论文所探讨的科学问题或专题。关键词是作者对文献核心的精炼,在学科领域里高频出现的关键词常被视为热点研究领域[3].另外,中心性高的关键词易成为关键词网络图谱演进的拐点,也在一定程度上代表学科的研究热点。因此,借助 CitespaceIII 的关键词聚类功能,可以对情报学研究论文中高频关键词及高中心性关键词进行可视化分析,从而确定近五年来我国情报学领域的研究热点。
1. 基于高频关键词
在 Citespace 中,选择节点类型为 keyword,演算路径为最小生成树,阈值选择为每个年度片段中前 50 个高频关键词( Top50) .点击运行后,修剪阈值设置为出现频次为 75 次以上的关键词,同时,将含义相近的关键词进行合并或清洗处理( 例如“文献计量”关键词归入“文献计量( 学) ”中) ,得到如下视图。图谱中,每个圆形节点代表一个关键词,圆圈的直径代表了该关键词出现频次的高低。从中我们可以看出,近五年来,我国情报学的研究热点主要集中在以下几个子领域,分别是竞争情报、情报学、文献计量( 学) 、引文分析、知识管理、本体、社会网络分析、h 指数、信息检索、共词分析、图书馆和信息服务等。尽管如此,从关键词频次的年度变化情况来看,每一年度的研究热点也在不断迁移。2009 年,情报学的研究热点主要集中在竞争情报、情报学( 理论与方法) 、知识管理、引文分析、文献计量学以及本体方面; 2010 年,研究的热点虽然仍集中在这六个领域,但引文分析、本体的研究热度逐步增加,而知识管理领域的研究逐步呈现出下降的趋势;2011 年,竞争情报、文献计量和情报学( 理论与方法) 仍是不变的研究重点,但值得注意的是,社会网络分析逐渐进入研究学者的视野,成为当年高频关键词第四位; 2012 年,共词分析和图书馆研究的研究逐步增加,而知识管理的研究淡出了高频关键词前六位; 到了 2013 年,随着“大数据”概念的提出,情报学领域学者们也开始关注大数据环境下,情报学学科发展和情报事业面临的新机遇和新挑战,大数据以及知识图谱可视化方式的研究成为当年备受关注的研究领域。
2. 基于高中心度关键词
在图谱中,节点的中心性是用来测度网络节点中心性的指标,它是指网络中经过某个节点并连接两点的最短路径占这两点之间的最短路径线总数之比[4].中心性测量为发现不同学科的连结点或进化网络中的支点提供了一种途径。节点中心度较高,一般认为与其他节点间存在紧密联系,是连接不同研究领域的关键节点。根据 Citespace运行结果对应的网络汇总表( Network summary ta-ble) 进行数据分析,我们可以看出,近五年来我国情报学研究中,中心度在 0. 01 以上( Centrality >0. 01) 的关键词共有 15 个。其中,文献计量学、技术竞争情报、专利分析、信息可视化、CitespaceII、技术预见、可视化、实证研究、知识图谱 9 个关键词中心度排在最前列,中心度均超过 0. 04,是我国情报学研究中的重要节点。知识管理、影响因子、图书情报学、学术影响力、引文分析和研究前沿 6个关键词中心度在 0. 02 -0. 04 之间,也是情报学研究中的相对热点领域。
(二) 情报学研究前沿分析
所谓研究前沿,是科学研究中最值得关注、最有发展潜力的研究主题或研究领域,是未来的、潜在的研究热点。Citespace 中所定义的研究前沿,强调的是新趋势和突变的特征,并采用 Kleinberg突变词检测算法来识别研究前沿专业术语概念。
突变词算法可以用于监测一个学科领域内研究兴趣的突然增长,通过考察词频的时间分布,将那些频次变化率高、频次增长速度快的“突变词”(burst) 从大量文本中抽取出来,用词频的变化趋势,而不仅仅是词频的高低来分析学科领域的前沿领域和发展趋势5.在研究前沿分析时,点击“burst terms”选择 plain text,识别出我国情报学领域有 4255 个关键词存在突变跃迁现象,并选取( C,CC,CCV) 进行阈值设置。将前中后时段阈值分别设置为( 3,3,20) ,( 3,3,25) ,( 3,3,30) ,选择pathfinder,然后,查看 citation burst history 或导出视图的网络汇总表( Network summary table) 进行数据分析,对突变率排在 top20 的关键词进行过滤筛选,得到近五年来我国情报学研究的突变词列表,如下表所示。可以看出,近五年来,科技期刊、数字图书馆、CitespaceII、微博、主题图、聚类分析以及被引频次研究等 20 个领域成为我国情报领域内研究兴趣增长较为显着的领域,亦即情报学的研究前沿。
为更加动态的了解这五年来情报学前沿的变化过程,我们将这五年划分为四个时区,然后再次分别进行 citespace 突变词检测并运行程序,根据网络汇总表结果对其中各个时区的突变词按突变率进行过滤筛选,最终得到每个时区片断中的阶段前沿,如下表所示:从中我们可以看出,2009 -2010 年,我国情报学的潜在研究重点主要集中在信息管理与信息组织、以及科技期刊评价方面; 2010 - 2011 年,机构知识库、形式概念分析方法、信息生态系统以及专利情报成为新的研究前沿,得到研究者的迅速关注; 2011 年 - 2012 年,随着主题图等技术的逐步深入,知识组织领域的研究重新回归视野,此外,信息博弈论、信息服务机构等方面的研究得到情报学领域学者的迅速关注。
通过的近五年我国情报学领域热点和前沿问题的数据分析,我们可以看出,情报学的发展是与时俱进的,与现代化技术和政策的变化密切相关。
科研人员更多的尝试将先进的技术方法应用于情报学的理论研究中,更重视实证研究,并与社会发展中出现的新问题紧密结合,从而开拓出情报学发展的领域。
三、结语
本文通过利用 CiteSpaceIII 科学知识图谱工具,对 CSSCI 数据库中 2009 -2013 年的情报学领域相关研究论文进行了定量分析,研究了这五年来我国情报学的研究热点和前沿。最终得出结论,近五年来我国情报学研究的热点领域主要集中在竞争情报、情报学、文献计量( 学) 、引文分析、知识管理、本体、社会网络分析、h 指数、信息检索、共词分析、图书馆和信息服务等方面,未来的发展前沿将集中在科技期刊、数字图书馆、citespace、微博、主题图、聚类分析以及引文分析等领域。并根据时间的演进,在各时区研究热点和前沿上呈现出一些阶段性重点。希望通过对近五年来我国情报学领域研究重点和前沿的梳理与可视化,为研究人员更好地把握本领域的研究现状和动向提供参考。
参考文献:
[1]王知津,李明珍。 情报学的不朽篇章---纪念《诚如所思》发表 60 周年[J]. 情报理论与实践,2005( 1) .
[2]刘泽渊,陈悦,侯海燕等。 科学知识图谱: 方法与应用[M]. 北京: 人民出版社,2008.
[3]赵蓉英,许丽敏。 文献计量学发展演进与研究前沿的知识图谱探析[J]. 中国图书馆学报,2010( 5) .
[4]马海群,吕红。 基于中文社会科学引文索引的中国情报学知识图谱分析[J]. 情报学报,2012( 5) .
[5]朱亮,赵瑞雪,寇远涛等。 基于 CiteSpaceⅡ的“共引分析”领域知识图谱分析[J]. 数字图书馆论坛,2012( 12) .