借助文献计量学方法对学界关于某一研究内容或主题进行测度,可以定量地客观评价该主题研究内容的进展情况及其在学界的影响力。为加强对档案检索研究情况及规律的把握,笔者运用文献计量学方法,对《中国期刊全文数据库》收录的1980-2011年间有关档案检索的研究论文进行统计,分析我国档案检索的研究成果及其特点,以期为该领域的理论研究和实践提供参考。
一、数据获取和处理方法
笔者以中国期刊全文数据库作为数据平台,以“主题and题名=档案检索”为检索表达式进行检索,时间跨度为1980-2011年。经仔细筛选,剔除一稿多投情况,并去除简讯、文摘、简报等,最后以学术性较强的专业论文作为统计对象。
二、相关数据统计分析
1.论文年度分布
本次检索获得关于档案检索的论文共1541篇(见“表1”)。从结果来看,我国档案检索研究的论文最早发表于1980年,自1980年至1996年期间,该类论文年度数量呈总体增长趋势。究其原因,这一时期随着一系列行业标准如《档案着录规则》(GB3792.5-85,1985年)、《中国档案分类法》(一、二版)、《中国档案主题词表》(一、二版)的出版及档案利用工作的不断深化,档案检索在档案利用工作中的重要地位渐次凸显,从而引发了业界的高度关注并形成研究热潮。1999年以后,该领域年度产文呈平稳运行态势,各年度之间波动幅度不大。由“表1”可以看出:1980-1992年为我国档案检索研究论文的缓慢增长期,1993-2001年为快速增长期,2002-2011年增长速度再次趋于平缓。这说明,自改革开放以来我国档案检索研究历经了初步发展--快速发展--相对成熟三个阶段,文献的增长由最初阶段的不稳定,转变为呈指数方式的快速增长,而后又过渡到了以线性方式稳步增长阶段。这与普赖斯逻辑曲线增长四阶段理论中的前三阶段基本相同.值得注意的是,论文增长率变小,并不意味着学科没有更大的发展空间,而是该领域进入相对成熟阶段的表现。至于这个“相对成熟时期”到底会持续多久,过渡到下一个阶段需要多长时间,则需要看相关研究的进展情况。
表1 1980-2011年档案检索研究论文年度分布
2.论文作者分布
(1)核心作者分布对作者群的统计分析,能反映出核心作者的分布情况,这对进一步了解档案检索研究的现状和发展趋势具有重要意义。
1980年以来,除37篇论文着者不详外,共有1110位作者(按第一作者统计)发表了1504篇关于档案检索研究方面的论文。数据显示,发表1篇论文的作者数为952人,占作者总数的85.77%,此数据明显高于洛特卡定律中1篇论文着者占所有着者数量的60.79%的经典学科参考值。这一方面说明该研究领域的核心作者比较集中,另一方面也反映出档案检索研究领域曾出现过热点现象,从而引起学者们的广泛关注和追逐。
根据普赖斯定律,核心作者的最低发文量为:N=0.749×(ηmax)1/2,其中“ηmax”为最高产作者的论文数。据统计,我国档案检索研究领域的ηmax为29篇,N按照取整选择即为4,则发表4篇及以上的39名作者为档案检索研究领域的核心作者。这39位作者仅占作者总数的3.51%,其发文量达286篇,占总发文量(除去作者不详的37篇)的19.02%,接近文献计量学中核心作者发文数应占发文总量20%的下限,说明我国档案检索研究的核心作者群正初步形成。该核心作者中发文超过10篇的有6位,共发文113篇,占核心作者发文量的40%,其平均发文量约为19篇,他们构成了我国档案检索研究的领头人(见“表2”)。在核心作者群中,既有资深的专家学者,又有年轻的高校教师,形成了较为合理的团队结构。相信在不断继承前辈研究成果的基础上,经过不懈努力,在新的历史条件下,我国档案检索研究会向着更高的水平发展。
表2 1980-2011年档案检索研究核心作者
(2)作者地区分布本研究中,除去129篇作者地区不详,其余1412篇论文第一作者的分布地区涵盖了我国31个省、市、自治区及港澳台地区和国外(见“表3”)。
表3 1980-2011年档案检索研究论文地区分布
就“表4”的数据来看,我国档案检索研究的作者主要集中在华东和华北两区,分别产文435篇和314篇,依次占发文总量的30.81%和22.24%;发文量最少的是西北和华南两区,分别为50篇和30篇,依次占总论文量的3.54%和2.12%.据此可见,我国档案检索研究作者的区域分布存在严重的不平衡,论文高产区多是社会经济发达、学术氛围浓厚、高等院校和科研机构集中的地区。这些地区人才密集,知识信息传播快,接受先进理论和技术也快,因此学术研究成果显着,具体到档案检索领域也是如此。相反,地理位置处于劣势的地区,社会发展到学术研究都较其它地区落后,加上学术人才缺乏,导致其论文数量与发达地区之间差距明显。
(3)论文期刊分布
对来源期刊的统计分析不仅可以揭示档案检索研究领域的核心期刊,同时也为该领域研究提供重要信息源。经统计,这30年中我国档案检索研究的1541篇论文分别发表在253种学术期刊上。根据布拉德福定律,核心区期刊所载文量占总论文量的1/3,故本研究领域核心区所载的论文数应约为514篇。根据统计结果可知,核心区期刊数为7(见“表4”),且全部为档案学领域的核心期刊。其余2/3的文章分布在246种期刊上,其中非档案学刊物有220种,但总载文量只有317篇,仅占总篇数的20.57%.这说明到目前为止,档案学界对该领域研究的重视程度最高,同时表明档案检索领域尚缺乏与相关学科的交叉渗透。而档案检索学科从形成之初便受到图书馆学、情报学等相邻学科的影响,因此档案检索学科要想健康发展,就有必要借鉴其它信息检索,特别是图书情报学科的检索技术与方法来加速自身的发展。
表4 1980-2011年档案检索研究论文期刊分布
(4)论文主题分布
档案检索学科的研究领域目前主要涉及以下方面:①档案检索的一般问题;②档案检索语言;③档案着录与标引;④档案检索工具;⑤档案计算机检索系统;⑥档案检索法;⑦档案检索工作组织;⑧档案资源共享中的检索;⑨网络环境下的档案检索.因此,本文把档案检索的主题划分为10种大致与之相对应的类别。
主题分布直接反映了档案检索研究的重点、热点及档案界对相关问题的关注,是了解档案研究内容的重要途径.30多年来,我国档案检索研究主要集中在档案着录和标引、档案检索工具两方面,分别发文446篇、348篇,二者占文章总量的51.52%;而发文较少的则为档案检索工作组织、档案检索理论以及电子档案检索及EAD,分别只有32篇、35篇和37篇,合占总发文量的6.75%.二者相比,前两大主题受到的关注远超过后者,反映出各主题之间存在很大的差异(见“表5”)。就档案检索利用而言,无论手工检索还是计算机检索,其首要任务即为档案信息的存储,而着录标引工作是档案存储的前提;其次,要实现档案的高效查找,则必须以构建科学完备的档案检索工具为前提,故而这两个领域成为我国档案检索研究的重点。此外,其基础理论研究文章偏少,一方面固然与档案检索研究强调应用有关,但也反映出该领域理论研究的薄弱与滞后。没有完备、成熟且与时俱进的理论作为指导,档案检索学科及实际工作将会受到严重制约。因此,必须注重该学科的理论建设。在信息技术高速发展的今天,网络信息检索及电子文件的利用日益成为档案工作的主流,但是关于网络环境下档案检索以及电子档案检索的文章仅占发文总量的5.64%,这种研究与需求之间的差距必须引起我们的高度注意。
表5 1980-2011年档案检索研究论文主题分布
就档案检索利用而言,无论手工检索还是计算机检索,其首要任务即为档案信息的存储,而着录标引工作是档案存储的前提;其次,要实现档案的高效查找,则必须以构建科学完备的档案检索工具为前提,故而这两个领域成为我国档案检索研究的重点。此外,其基础理论研究文章偏少,一方面固然与档案检索研究强调应用有关,但也反映出该领域理论研究的薄弱与滞后。没有完备、成熟且与时俱进的理论作为指导,档案检索学科及实际工作将会受到严重制约。
因此,必须注重该学科的理论建设。在信息技术高速发展的今天,网络信息检索及电子文件的利用日益成为档案工作的主流,但是关于网络环境下档案检索以及电子档案检索的文章仅占发文总量的5.64%,这种研究与需求之间的差距必须引起我们的高度注意。
三、研究特点及展望
纵观我国档案检索研究的相关成果,可以发现,我国档案界在对档案检索领域进行研究时,大体上遵循着以下思路:首先,将档案检索的全过程作为研究对象加以系统研究;其次,除继续研究手工检索外,对计算机甚至网络环境下的档案检索也进行了研究;第三,在研究一个档案机构检索问题的基础上,进而研究包括目录中心在内的档案资源共享的检索。
本文的统计对象仅为期刊论文,未涉及档案检索研究的专着、教材、论文集以及课题等数据,因此不能完整反映改革开放以来档案检索研究的全部情况。
但通过上述分析可知,我国近年的档案检索研究已经进入相对成熟阶段,其核心作者与核心期刊已初步形成,但在作者地区与研究主题分布方面很不平衡,尚处于一种自在状态,缺乏学科自觉与自为。档案检索研究如何构建自身的学科范式,由学科自在走向学科自为,进而走上成熟发展之路,彰显档案检索学科的独特价值,还需要有志于该领域研究的档案学人不断深入探索。(本论文图标略)