一分材料出一分货,十分材料出十分货,没有材料便不出货"1].由此可以看出,研究资料对学术研究有着多么重要的意义。
------要对有用的资料敏感
季羡林先生在《中华蔗糖史》中曾说:"我们做学问的人大概都有-一个经验。有些资料在此时此地很难说有用没有;但是,在另一个地方,当你遇到有关的问题时,则无用的资料立即变为非常有用。韩文公所说的'牛溲马勃,败鼓之皮大概指的就是这种情况吧。"[2]对资料敏感,往往体现于读书看报时,--眼掠过之际,发现某资料会对某种研究有重要的参考价值。下面举几个例子:
例一:图书馆职业精神
美国图书馆事业发展得好,沈宝环先生曾经说有三条原因:一是图书馆员的敬业精神,二是社会对图书馆的支持,三是先进技术条件的支撑[3].图书馆员的敬业精神到底是怎样--个状况呢?在没有看到具体案例之前,《北京青年参考报》2010年刊登的一篇文章引起了我的注意。该文讲华盛顿卖饼人卡尔。洛斯因心肌梗塞猝死的消息竟然上了华盛顿某大报头版,之后,数百名顾客不约而同地来到第17街与K街路口。上他原来的卷饼摊的地址,挂出卡尔。洛斯的遗像,送上--朵朵鲜花以示悼念。卡尔。洛斯的卷饼保质保量,饮料货真价实,而且知道顾客的不同口味和喜好,如了解中国人有甜、咸的不同口味。他视顾客为朋友,经常与顾客聊天。有的顾客称他的卷饼摊是"话疗站"[41.这个报道,我就觉得很有价值,与图书馆职业问题有关,于是就保留起来。我认为,卖饼人去世上大报头版的事情恰恰佐证了美国人的职业观看重的不是职业的地位而是敬业态度,而且,不仅美国图书馆员有敬业精神,其他行业的人也这样,这就不得不使我们深思其原因是什么。
例二:古代书业
黄宗羲的《明儒学案》卷四《崇仁学案四》收录了夏尚朴(1466--1538,号东岩)学案,摘录了夏氏《东岩集》文字,其中有云:"予昔有志于学,而不知操心之要,未免过于把捉,常觉有一-物梗在胸中,虽欲忘之,而不可得。在南监时,一-日过东华门墙下,有卖古书者,予偶检得《四家语》,内有黄檗对裴休云:'当下即是动念,则非伫立之顷。'遂觉胸中如有石头磕然而下,无复累坠,乃知禅学诚有动人处。"s]夏尚朴是正德辛未(1511年)进士,曾官至南京太仆寺少卿(正四品官员,掌牧马之政令,隶兵部)。
东华门是明代南京皇城的东门,作为明故宫遗迹至今犹存。我读到这一段文字,马上觉得这是有关明代南京书业市场的重要史料,并将其记下。
例三:佛经传入中国时间
以前我研究古代佛教藏书制度,对佛教传入中国的时间有大致了解。历史中影响较大的一个观点认为,佛教是在东汉明帝永平年间传入中国的,如晋袁弘《后汉纪》、刘宋范晔《后汉书》就记载了"汉明求法"的历史故事z;另-一种观点是现代的,认为佛教尤其是佛经是在两汉之交传入中国的,现代学者根据的是《三国志。魏书》三十裴注引鱼豢《魏略。西戎传》的一条记载:"昔汉哀帝元寿元年,博士弟子景卢受大月之王使伊存口受《浮屠经》"[6].元寿元年为公元前2年。这条记载,在《世说新语、文学篇》注、《魏书。释老志》、《隋书经籍志》等都有引用。1987年我在撰写硕士论文《六朝隋唐佛教藏书考》的时候,就采用了现代学者的观点。
但1927年日本学者藤田丰八却认为,至少在秦朝佛教就已经传到中国了,理由是《史记:秦始皇本纪》里记载了始皇三十三年(前124)"禁不得祠","不得"与"浮屠"音同,即是梵语buddha的对音,嗣因忌"屠"字,改成"浮图"(或"佛陀")[7];"祠"者,庙寺之谓也。始皇帝下令禁止民间设立佛寺,可见当时已有礼佛拜佛现象。以往隋代费长房的《历代三宝记》(因是一。部佛经目录,又被人简称为《长房录》)里出现过佛教秦有说,称始皇帝"三十四年所有典籍悉皆焚烧,唯医方药术不在熱限,降此悉灰。缘是周代圣教灵迹,及阿育王造舍利塔、传记,湮绝靡知所承。又始皇时,有诸沙门释利防等十八贤者,?经来化。始皇弗从,遂禁利防等。夜有金刚丈六人来破狱出之。始皇惊怖稽首谢焉。"8j该书成书较晚,所记甚详,难免让人想到顾颉刚先生历史总是层累制造出来的观点,因而学者们怀疑它的真实性。但藤田丰八的研究算不算提出了-一个旁证?不管怎样,从语音学角度,破解"不得"与"浮屠"(佛陀)同,其方法让人耳目--新。
后来,也有许多学者从语言翻译的角度否定这一说法。王力先生强调学术研究上要牢记一。条原则,就是"例不十,法不立"[9],佛教秦有说还需更有力的证据来证实。
一、积累资料方法之一:抄录
抄录即见有用资料辄记录、保存起来。梁启超说,抄录是极旧、极笨、极麻烦但又是极必要的读书方法,真正做学问的人总离不了这条路。大学者能旁征博引、分析细密,不是靠记忆而是靠抄录或笔记,经过铢积寸累、困知勉行得来的。"大抵凡一个大学者平日用功,总是有无数小册子或单纸片。读书看见一段资料,觉其有用者即刻抄下(短的抄全文,长的摘要记书名、卷数、页数),资料渐渐积得丰富,再用眼光来整理分析他,便成一篇名著。"[10]
抄录的时候,要为每段抄录文字标识出关键词、详细出处等。清代的俞正燮(就是写过《癸巳类稿》和《癸已存稿》,对棉花、缠足、围棋等历史考证详核的那位大学者),他足迹走遍半个中国,"得书即读,读即有所疏记。每一一事为一一题,巨册数十,鳞比行箧中。积岁月,证据周遍,断以己意,一。文遂立。"]这里的"每一一事为一题"就是说俞正燮抄录或笔记时,每段资料要先确定一个主题词(或关键词),有了主题词(或关键词),资料才便于有序保存和快速检索。
或许有人认为,现在有了互联网、数字图书馆,想找什么用搜索引擎一~搜就解决问题,抄书者可谓愚不可及也。梁启超没见过电脑,但他下面的一番话好象是对电脑时代年轻人说的。他说,注意力是创新的要件,抄书做笔记是促醒注意及保存注意的最好方法。"当读一一书时,忽然感觉这一段资料可注意,把他抄下,这件资料,自然有一~微微的印象印入脑中,和滑眼看过不同。经过这一番后,过些时碰着第二个资料和这个有关系的,又把他抄下,那注意便加浓一度。经过几次之后,每翻一书,遇有这项资料,便活跳在纸上,不必劳神费力去找了。"[12]他还说:"无笔记则必不经心,不经心则虽读犹不读而已。"[13]"经心"而不是"精心",一字之差,意义大变。电脑时代,网上阅读把人的思维越来越零碎化、符号化、机械化,我们的双眼被大量信息流牵引奔跑,已经不能驻足思考,不能安静想象,经心之物也越来越少。如果我们读书时认真抄录,顺便还能将自己的心得记录下来,经过这样一番手脚后,那种知识思想方可算;是自己的了。所以,抄录的读书方法不应废,只是以前我们用笔抄,现在我们可以用打字输入的方法抄,工具变了,方法的本质未变[8]
另外,抄录下来的资料,最好要标引上主题词或主题短语,同时还要详列出处,以便写作引用。如下面几个例子:
例一:对外来文化的态度
圣雄甘地说:"我不想让我的房子四面高墙耸立,不想让我的窗户密不透风。让所有土地孕育的文化都尽情地吹送到我的房屋周围。但我却不想被其中任何一个吹得站不住脚。"(联合国开发计划署。2004年人类发展报告:当今多样化世界中的文化自由[R].本书翻译组,译。北京:中国财政经济出版社,2004:85.)
例二:读古代原典的重要性
《瓦尔登湖》虽为文学作品,但内容却是写实的,记述作者梭罗(HenryDavidThoreau,1817一1862)避开城市喧嚣,在瓦尔登湖自耕自食生活的体验。本书中有一篇"阅读"内容,讲述了现代人努力读古典著作的重要性。他认为读古典著作最好读原典,甚至花费光阴学会一种古代文字,"即使只学会了几个字,它们却是从街头巷尾的琐碎平凡之中被提炼出来的语言,是永久的暗示,具有永恒的激发力量。有的老农听到一些拉丁语警句,记在心上,时常说起它们,不是没有用处的。有些人说过,古典作品的研究最后好像会让位给一些更现代化、更实用的研究;但是,有进取心的学生还是会时常去研究古典作品的、不管它们是用什么文字写的,也不管它们如何地古老。
因为古典作品如果不是最崇高的人类思想的记录,那又是什么呢?它们是唯一的,不朽的神示卜辞"(83页)。本书还提到:"书,最古老最好的书,很自然也很适合于放在每一个房屋的书架上"(85页)。"没有学会阅读古典作品原文的人们对于人类史只能有一点很不完备的知识"(85页),([美]亨利。戴维。梭罗。瓦尔登湖[M].徐迟,译。上海:上海译文出版社,2011.1.)
例三:"图书馆学"英文对应词
中文"图书馆学"在英文中有意义不尽相同的对应词汇:librarianship和libraryscience.一般而言,libraryscience可译成"图书馆学"或"图书馆科学",偏重学科的训练;librarianship除可译成"图书馆学",还可译为"图书馆事业",即除学科训练之外,还加有图书馆专业之经验与活动的含义。通常在应用上,两者相通,不过美、加喜用libraryscience,英国喜用librari一anship.(卢秀菊。图书馆学之理论基础与研究范围[J].资讯传播与图书馆学,1999(1):7一17.)
例四:维基百科的软肋一精确性
自2001年创办至今,维基百科始终将自己定位为包含人类所有知识领域的百科全书,内容包罗万象:从波士顿蜜糖惨案到加拿大犀牛党、从比尔盖茨的家到仅仅持续了45分钟的英桑战争,从冰岛的伊斯兰教概况到第一只环游澳大利亚的猫科动…很显然,传统的百科全书永远不会涉及这样的词条。作为世界。上最大的"自由的百科全书",精确性一直是维基百科的软肋。曾编纂过《不列颠百科全书》的一一名学者就把维基百科比喻成公共厕所:你永远不知道最后一个用它的人是谁。然而,2005年12月美国《自然》杂志的研究表明,目前维基百科的准确度几乎可以媲美《不列颠百科全书》。
《自然》杂志从维基百科和大英百科全书中随机抽取了同样的条目,评定的结果显示:
维基百科和大英百科各有162个、123个常识性错误,并各有4个严重错误。不过,当时《不列颠百科全书》发布长篇文章反驳,称这个研究错误百出,"没有任何值得一一提的地方。"(柳丝,等。《不列颠百科全书》沉浮录[EB/OL].新华网。国际先驱导报,(2012一03一26)[2012一04一04].http://news.xinhuanet.com/her一ald/2012一03/26/c一131483221.htm.)
二、积累资料方法之二:批注
抄录是抄书之大意或原文,而批注则是阅读中将心得批注于书上。如图书馆学专业学生都知道古代集部书有别集、总集之分。总集的发展历史、编纂方法究竟如何,专业书籍通常语焉不详。我在读《四库全书总目提要》时,见"集部"列唐代天宝时芮挺章编的"《国秀集》三卷",其提要里有如下语:
唐以前编辑总集,以己作入选者,始见于王逸之录《楚辞》,再见于徐陵之撰《玉台新咏》。挺章亦录已作二篇,盖仿其例。然文章论定,自有公评,要当待之天下后世。何必露才扬已,先自表章。虽有例可援,终不可为训。至《旧序》一篇,无作者姓氏,陈振孙《书录解题》谓为楼颖所作。颖,天宝中进士,其诗亦选入集中。考梁昭明太子撰《文选》,以何逊犹在,不录其诗,盖欲杜绝世情,用彰公道。今挺章与颖,一则以见存之人采录其诗,一一则以选己之诗为之作序,后来互相标榜之风,已萌于此。知明人诗社锢习,其来有渐,非一一朝一夕之故矣。以唐人旧本所选,尚有可采,仍录存之。而特著其陋,以为文士戒焉[14].
唐诗选本,非后世始为之。今可考知者,唐人编选诗歌总集已有137种之多,其中唐人选唐诗之总集也有40余种[1s],今存者仅有十一二种,其中芮挺章《国秀集》三卷,选开元至天宝三载(744)90家220首诗,今存85家211首。天宝三载,国子进士楼颖为之序,故四库馆臣讥之"互相标榜".《总目提要》这段文字涉及了古代总集的编纂历史与编纂方法问题,可谓珍贵难得。于是我就在旁白处做出批注日:"此条涉及总集编纂方法。总集录时人之作与不录时人之作来历。"又《四库全书总目提要》"集部"中有"《极玄集》二卷"(《总目》中"玄"作"元",避康熙名讳所致),其提要曰:
唐姚合编……取王维至戴叔伦二十一人之诗,凡一百首,今存者凡九十九。
合自称为"诗家射雕手",亦非虚语。计敏夫《唐诗纪事》,凡载集中所录之诗,皆注曰右姚合取为《极玄集》,盖宋人甚重其书矣。二十一人之中,惟僧灵一、法振、皎然、清江四人不著始未,祖咏不著其字,畅当字下作一方空,盖原本有而传写佚阙。其余则凡字及爵里与登科之年,一一详载。观刘长卿名下注曰"宣城人",与《唐书》称"河间人"者不同;又皇甫曾注"天宝十二载进士",皇甫冉注"天宝十五载进士".以登科先后为次,置曾于冉之前,与诸书称兄弟同登进士者亦不同。知为合之原注,非后人钞撮诸书所增入。总集之兼具小传,实自此始,亦足以资考证也16].
姚合为唐诗人,元和十一年(816)进士,授武功主簿,官秘书少监。世称姚武功,其诗派也称"武功体".他所编纂的唐人诗歌总集《极玄集》二卷,有元至元建阳刻本、明万历毛晋汲古阁本传世。1958年中华书局出版《唐人选唐诗》(十种),收录此集。
《极玄集》中,每位诗人姓名下都注其字及爵里与登科之年,故《总目提要》称"总集之兼具小传,实自此始,亦足以资考证也。"这句话也非常重要,是总集发展史不可多得资料以及总集编纂方法之案例。所以,我在旁白处批注一句:"总集兼具小传。总集编纂方法。"清人严可均编总集《全上古三代秦汉三国六朝文》,每位作者名下皆有小传,其法竟可寻祖于姚合。
三、积累资料方法之三:备忘
备忘就是在备忘录里记下有用资料的线索,备以后检索、阅读。如我每年都有一个"借书记录",有些泛读书,其中有用的资料没有来得及抄录,会特别标示出来,以便下次再借阅:
C3/33社会科学研究的思维要素。肯尼斯。赫文,托德多纳,著。李涤非,潘磊译。
[有关概念、假说的论述很好。]
C91一03/37a社会工作研究方法:质性和定量方法的应用。[美]劳伦斯。纽曼,拉里:克罗伊格,著。刘梦,译。
[此书关于"理论"问题有精到论述,还须再阅查。]
K815.1/12社会思想名家。[美]刘易斯。A.科塞,著石人,译。
[此书关于哈贝马斯的理论有精到概括,还须再阅查。]
C232/10法治进程中的"民间治理":民间社会组织与法治秩序关系的研究马长山,著。
[对政府市场双失灵以及国内民间组织不足分析颇好。]
C91一53/23(4)社会理论论丛。张一兵,周晓虹,周宪,主编。
[书中有公民社会与社会资本的论述。]
C53/699刘文典诗文存稿。刘文典,著。诸伟奇,刘兴育,编。
[此书提到的古书标点事,早矣。]
C55/25(10)文学与文化。南开大学文学院《文学与文化》编委会,编。
[本书中对文集形成的历史的论述。]
K825.8/7a励耘承学录,刘乃和,著。
[书中有《陈垣与北京图书馆》一文,介绍陈垣职图书馆之事。]
G122/149.1文化交流的轨迹:中华蔗糖史季羡林,著。
[谈到糖史资料的收集方法、写作方法,对陈寅恪写作方法有借鉴,见521页。]
四、积累资料方法之四:编目录
编读书目录,会加深记忆,也有助于今后重新检索。这主要针对的是古代文献研究者而言的,尤其是对做某一个专题研究而言的。目录如何编写,可以借鉴图书馆的编目方法,略揭其内容以资研寻。如施廷镛先生编的一条书目:
《金石存》十五卷,吴玉措撰,清嘉庆乙卯年间抄香室刊本,八册是书采集前代金石遗刻,疏其年月,具全文而加以考证。自序谓较之欧阳洪赵所储不过十一,而以编经史之疑,订传注之失,考古文篆隶行楷讹俗递变之由,亦已略:
具云。前有李宗恩叙自叙题词及校刻例言,卷末有周渠跋。
吴玉措,字山夫,清江苏山阳人,康熙中由廪贡官凤阳训导,深于小学。潍县韩梦周曾为之传。传见《理堂集》。著有《别雅》、《说文引经考》二卷、《六书述部叙考》、《山阳志遗》、《金石存》十五卷、《天发神忏碑考》四卷[17].
这条书目有书名、卷数、作者、版本、册数、内容大要、作者简介等。有关此专题的书目积累多了,就形成了一个非常有价值的专题书目成果。古代戏曲与小说研究大家吴晓铃(1914一1995)先生,提起学术研究方法说,研究戏曲的基本工作有三种:
编目录、写提要、辑曲论,这些烧制砖瓦的工作结束了,就可以搭建巍峨大厦了。如他在民国期间所作的一条书目如下:
《红拂记》二卷三十四出存明万历间富春堂刊本(北平图书馆藏),明玩虎轩刊本(长乐郑氏藏),明容与堂刊李卓吾评本(通县王氏藏),明末六十种曲本等。
明张凤翼撰凤翼字伯起,号灵墟,江苏长洲人。嘉靖六年生,万历四十一年卒,年八十七。
与弟献翼、燕翼并有才名,时号三张。嘉靖四十三年举人,会试不第,晚年以鬻书自给。(见《列朝诗集》、《明诗纪事》、《近事丛残》、《曲品》、《顾曲杂言》《三家村老委谈》、《剧说》、《曲论》等。)[18]
吴晓铃先生"编目录"使用的就是我们图书馆学的提要法。这条书目记卷数(或折数)、录版本、标存佚、注藏家、写小传、附引目,已经很完备了。如果这样一条一条的书目积累多了,将其汇集起来,就成了一部有提要的《古戏曲书目》。而吴晓铃先生的"写提要",其实是记述戏曲内容的梗概,使未读过原书者可以略知剧情大要,有类西方的书评(bookreview)及中国报刊上的"内容简介",如《乐府考略》等书,这是戏曲文献所特殊需要的一种提要。吴晓铃先生说到的"辑曲论",就是将戏曲评论作品收集在一起,如将《曲品》、《剧说》、《雨村曲话》等汇集在一起。
我们平时读书,觉得有价值的现当代学术著作,读完之后也可以编一条目录。特别是遇到其他学科领域的学术著作含有本专业的资料的,通过编目录就可以保存下来,时间久了,就会形成一一部与本专业关联的经眼书目。以下是我编制的四则与图书馆学有关联的书目案例:
例一:图书馆学理论
黄俊盂,江宜桦,编。公私领域新探:东亚与西方观点之比较[M].台北市:台大出版中心,2005.8.
索书号D0H842(清华图书馆)本书有关"公共哲学"的提法,对"公共文化"概念有比较意义。其中蓝弘岳的《东亚中的"公共"概念一历史源流与展开》一文(77~115页),探讨了东亚尤其是中国、日本的"公共"的概念与西方"公共"(pub一lic)概念的缘起与内含的差异。我猜测,《史记》里提到的"公共"一词,历经唐宋、明清,基本上具有动词属性,其意为大家共有"之意,而西方之"公共"(public)基本为名词乃为一领域性、空间性的含义。要了解"公共图书馆",则应对"公共"一词讨津溯源。
例二:道藏历史
杨寄林,译注。太平经[M].北京:中华书局,2013.4.
索书号B952/7a(上)(北大图书馆)本书分上、中、下三册,上册的前言对《太平经》的编著与流传、体例与内容、作用与价值作了详细的论述。该文对道教典籍的形成、收藏、分类、流传的历史有重要参考价值,如对早期《太平经》装帧形式"清首""丹目"的介绍,部书帙卷数厘定方法的说明等,都值得一一阅。
例三:西方书籍史
曹顺庆,主编。中外文化与文论(第27辑)[M].成都:四川大学出版社,2014.11.
索书号I0一03/25(27)(北大图书馆)该连续出版物由中国中外文艺理论学会、四川联合大学中文系汉语言文学研究所主办。本辑中收录的高树博《书籍史与形式史》一一文(110~120页),对弗兰克:莫莱蒂(FrancoMoretti)的书籍研究史成果有介绍。莫莱蒂用定量的方法,研究19世纪图书馆空间大小与小说、外国小说数量的关系,认为书籍的发展史与空间形式存在反比关系。莫莱蒂认为:图书馆越小,其藏书的经典性也高,所谓"差一些"的文本就遭到了放逐。如果一户人家只有一本书,它便是宗教经典;一个图书馆只有一个书架,它将被经典填充;一个地区如果只有一个图书馆,那就是小说的地盘。该文的主要参考文献是FrancoMoretti,AtlasoftheEuropeanNovel1800一1900,LondonandNewYork:
VersoPress,1999.
例四:地方文献
洪焕樁,编著浙江文献丛考[M].杭州:浙江人民出版社,1983.2索书号K295.5/4a(北大图书馆)本书作者是孙诒让的外孙,民国三十年代先后在浙江图书馆和浙江通志馆工作过。
本书内容一是记载浙江学者藏书、校书、刻书和著书的历史文献,如《浙江书林散记》、《浙江雕版印书杂识》等;二是考订有关浙江地方志的几个问题,如《浙江通志纂修源流考略》、《辛亥革命以后编纂的浙江地方志》等。
每条目录前设主题词,是为目录多了便于分类排序;著者与书名等信息之下有索。
书号与收藏单位,是为方便检索借阅;提要内容注明与本专业相关的资料及其价值,是为说明可供哪方面研究参考。
五、积累资料方法之五:建数据库
做研究课题,我们宜建立专题资料数据库。平时阅读报刊或浏览网页,凡遇见有用资料,可以剪裁、下载,存在特定的纸袋或电脑文件夹里,这也起到了小型数据库的作用。
武汉大学俞君立教授在写作《中国文献分类法百年发展与展望》一书时,查阅到20世纪国内有关文献分类的论文6,500余篇、专著110部、文献分类法近200部、著者号码表约70余部,他先将这么多的资料线索建立成一个课题研究数据库,然后再进行资料的整理与研读。在收集资料过程中,许多民国时期的文献因年代久远、查阅困难,但他们克服困难,依然获得了这一时期文献的93%[19].
总之,只有重视资料积累,才能出好成果。古人著书,皆寸积铢累而成,如顾炎武的《日知录》。顾炎武(1613一1682,号亭林)费时三十年写出《日知录》32卷,所谓"稽古有得,随时札记,久而类次成书者。"2o]他提倡著述要认真积累、重视一手资料,云:"尝谓今人纂辑之书,正如今人之铸钱。古人采铜于山,今人则买旧钱,名之曰废铜,以充铸而已。所铸之钱既已粗恶,而又将古人传世之宝舂到碎散,不存于后,岂不两失之乎?承问《日知录》又成几卷,盖期之以废铜。而某自别来一载,早夜诵读,反复寻究,仅得十余条,然庶几采山之铜也。"[1]正因为如此,一世之人方能成非一世之书。
历史学界有个学者叫陈登原(1900一1975,字伯瀛),1950年后任西北大学历史系教授。他写的《天一。阁藏书考》(1932年)、《古今典籍聚散考》(1936年),在图书馆学界也有很高的声誉。他做学问特以积累资料为重,见到有用之文字辄记在卡片上。
所以他撰述出来的著作多留有排比史料的痕迹。如代表作《国史旧闻》即凭借其二三十年记卡片的功力而成。该书共四册,近200万字,虽然重在史料的收集、分类和编排,但是每个条目下皆有作者评说,实际上是一。部汉以后的中国通史。首卷于1958年由三联书店出版,辑述三国魏晋南北朝史事,出版社按资料类书籍计,初拟以每千字6元标准付稿酬,经陈氏力争,始改以著作类每千字12元付之。在同年批判"厚古薄今"运动中,此事成陈氏一一大罪状,而陈自辩"为这部稿子,我已经写过三千万字(卡片在外),手上生茧了(请检查我的大指中指)……如果承认一篇论文,一。本著作,乃是手工业产品的类似,《国史旧闻》就是廿余年的手工人的劳动"22].他上课时每言:"一天写卡片十张,三年之后就可以横行霸道!"[23]
近几年因信息技术的推进,大数据的采集、存储与分析已经更为方便,这为人文社会科学增加了新的动力,数字人文(digitalhumanities)逐渐兴起,计量史学(quantitativehistory,又称"量化史学")重又受到重视。无论是开展数字人文研究,还是从事计量史学研究,其前提是要对研究文本进行数据化处理后建立出专题资料数据库,在此基础上才能进一步从事数据挖掘、关联分析以及可视化处理等。因此,专题资料数据库的学术价值就显得十分重要。哈佛大学徐力恒博士在《数据驱动的史学研究一中国历代人物传记资料库(CBDB)的建设与使用》报告中介绍,哈佛大学费正清研究中心开发的"中国历代人物传记资料库"(ChinaBiographicalDatabase,CBDB),共收录约370,000人的传记资料,这些人物主要出自七至十九世纪,该资料库将分散在史料中与人物相关的非结构化文本数据进行结构化标引,如将人名(别名、字号)、时间、地址(籍贯、游学、入仕地等)、职官、入仕途径、著作、社会区分、亲属关系、社会关系、财产、人物参与的重大事件等标引转化为结构化的数据,并大规模著录,由此形成了一个超大规模的数据集,人文学者可利用数据进行历史人物活动的地理空间分析、社会网络分析和其他的相关统计分析等[24].
总之,研究资料是做好研究的基础。程千帆先生说过,材料的搜集是"学",从材料中提出问题是"识"[25]."学"在"识"前方可谓"学识"."学"之不厚,"识"之难高。