本篇论文目录导航:
【题目】
大数据背景下档案信息化建设探析
【第一章】
大数据下给档案管理带来的挑战研究绪论
【2.1 2.2】
档案数据资源体系的变化
【2.3 - 2.5】
档案安全保障体系的变化
【3.1 3.2】健全方便人民群众的档案利用服务体系
【3.3 3.4】
建设为民务实高效的档案行政管理体系
【结论/参考文献】
大数据下档案管理发展研究结论与参考文献
第3章 大数据时代应对档案管理模式变化的策略
2014年12月23日,国家档案局局长、国家档案馆馆长杨冬权同志在全国档案局长馆长会议上发表讲话指出,我国档案工作呈现出一种新状态、新精彩,走入一个新高地、新平台,进入了以服务大局和民生为中心,以“三个体系”建设为重点,事业发展得到进一步保障的新常态,档案工作进入了形态更为高级、结构更为合理、发展更为顺畅、任务更加复杂艰巨的新阶段,站在比过去更高的新层次上,积极认识、适应、引领新常态档案工作必须要具备五种新思维:要有创新思维,勇于开辟档案工作新领域;要有先行思维,当先行者先行服务;要有网络思维,善于利用网络开展工作;要有合作思维,努力实现各方面互通互联互赢;要有人本思维,开展各项工作中都坚持以人为本。①正如杨冬权局长讲话稿中提到的,大数据时代的到来也使档案管理工作进入一种新常态,迫使档案工作者开创新思维。大数据是档案管理工作在新形势下面临的新课题,既给档案管理工作带来新的源泉,使档案管理获得新的发展机遇,同时也改变了传统的档案管理模式,激发档案管理寻求更多、更广、更适宜大数据时代的档案管理新模式。
3.1加强资源聚集,建立覆盖人民群众的档案资源体系
档案资源是开展档案工作的基础,是档案部门的立身之本,也是档案事业可持续发展的关键。加强档案资源建设是丰富档案资源、完善馆藏结构、服务党和政府工作大局、服务经济社会发展、服务广大人民群众的根本途径。大数据时代,每天每时每刻都有大量的结构化数据、半结构化数据、非结构化数据产生,档案资源的收集范围更广,参与档案资源建设的除了传统的档案部门,社会群体和个人也可以成为搜集档案资源的主人,搜集来的档案资源可以存储在档案馆、数据中心,甚至云端。
3.1.1拓宽档案资源的收集类别
从纸质档案到档案信息化再到大数据时代,档案资源一直呈指数级飙升,档案资源的种类也从纸质到电子,从结构化到半结构化、非结构化转变。随着时代的轮转,档案搜集的类别范围也因为档案载体不一结构各异而发生了改变。
纸质等传统档案仍是档案收集的重点。我国早在1985年就开始了办公自动化探索征程,党的十七大倡导建设“资源节约型、环境友好型”两型社会,近年来政府部门又掀起无纸化办公、无纸化考试等热潮,这些举措都为节约资源、保护环境做出了巨大的贡献。档案管理部门虽然早已迈入办公自动化的大门,但是对于档案资源来说,纸质档案仍然是档案部门收集的重点,在档案馆藏数量中仍占主要地位。一方面是受传统的影响,目前所知世界上最早的纸质文献是1986年在甘肃天水放马滩一座文景时期(公元前179-公元前150)的汉墓中出土的西汉初期的纸质地图残片。纸质档案是整个社会历史的记录,中华民族上下五千年的文化和历史都留在了纸上。另一方面受习惯思维的影响,大部分人在学习、办公时还是倾向于阅读纸质文档,对于档案来说,纸质档案给人真实性、可信赖度更高的感觉。信息化社会,纸质档案越来越少,但是它承载的社会记忆和显现的价值意义不会因为数量的减少而褪色和降低,即使在大数据时代或者以后更远的未来,档案收集也不能忽视了纸质档案等传统档案这个大群体的存在。
结构化、非结构化、半结构化电子档案成为档案收集的主流。电子档案是信息化时代的产物,生成于数字化设备环境中,存储于电脑、磁盘、光盘等载体里,依赖计算机等数字设备阅读、处理,可在网络上传送。大数据时代,档案资源观正从传统狭隘的定义向“大档案观”转变,档案部门在进行馆藏纸质档案数字化、接收档案文件电子化的同时,要有意识地收集更多类别广、形式多、价值大的数据资源。网络的发展产生了更多更复杂的数据种类,包括结构化数据、非结构化数据和半结构化数据。结构化数据如数字、符号、关系型数据库等,非结构化数据如文本、图片、表格、图像、声音、影视、超媒体等,半结构化数据如E-mail、HTML文档等,都是大数据时代档案收集的主要对象。很多人会疑惑,这些零散化、碎片化、底层化的信息有没有收集的价值,世界着名高科技公司苹果公司给了我们答案。2014年7月11日上午9点,中央电视台新闻频道报道苹果公司i OS系统会记录用户行踪,即使关掉定位也没用,定位功能可以显示手机用户经常活动的地点、时间、频率,完整的分析人的移动行为轨迹,而绝大部分手机用户对这个功能并不知晓,苹果公司也曾解释定位信息收集问题,声称从未跟踪手机用户位置,但谁知道他们收集这些零碎信息背后的真正用意是什么。
3.1.2完善档案资源的建设主体
大数据时代,无论任何机构、社会组织和个人,都无法置身于数据之外,不同群体拥有不同的数据,他们的数据互不连通,档案部门可以将多元化、社会化的数据尽收囊中,但人少力薄是档案部门的现实状况,单靠一己之力不可能完成档案资源全面收集的重任,因此和不同数据拥有者的合作就显得非常必要,档案资源体系建设不仅要成为档案部门的职责所在,档案部门将通过自主管理、协商合作等方式把责任向社会转移,认可和鼓励各类社会组织及个人参与到档案资源的建设中来,完善档案资源的建设主体,达到借助社会力量优化档案资源的目的。
一是档案部门要善于与档案形成者合作。首先,我国各级各类党和政府机构、企事业单位等是国有档案资源的形成者,他们在日常工作事务中不断地产生文件材料,这些文件材料处理完毕后要进行整理归档,档案部门的主要职责也是为党和政府机构、企事业单位管理档案事务,他们要按照规定及时向档案馆移交档案。因此,对档案部门来说,对党和政府机构、企事业单位以档案的收集相对比较容易。其次,越来越多的家庭、个人意识到档案的重要性,纷纷开始建立家庭档案、个人档案,他们是私人所有档案的形成者。家庭和个人建档既记载了家庭和个人的历史,又折射了社会的变迁,虽然每个家庭的档案数量不多,但其在社会上的总和也是一笔巨大的档案资源,档案部门要积极与社会家庭和个人建立合作关系,收集更多更宝贵的“社会记忆”.此外,国家还要求领导干部建立领导干部个人档案、廉政档案,社会名人可以建立名人档案等等,他们组成了档案资源形成的特殊群体。
二是档案部门要善于与档案整理者合作。大数据时代,档案部门要学会利用社会力量和网络力量来完成档案资源的整理工作。国家规范并支持社会力量参与档案事务,允许政府可以通过合同、委托等方式向社会购买档案服务,政府以外包的的方式将档案工作交给业务能力高度专业化的档案中介机构、专业机构。档案中介机构合法合规参与档案事务服务,帮助档案部门规范档案资源整理工作。档案部门还可以利用网络人力资源,通过众包模式集聚档案资源。众包模式是指把本应由公司内部员工执行的工作任务,以自由自愿的形式外包给非特定的大众网络的做法模式,①美国加州伯克利大学一个复杂的分布式计算项目的成功运算就是利用网络众包模式典型案例,这个项目成功调动了世界各地无数个人电脑的闲置计算能力。众包是一种一对多关系比外包一对一关系更方便快捷高效的模式,既可以有效利用闲置资源又能轻松解决工作难题,档案部门可以采用众包模式收集档案资源,开启更多人的智慧,集中更多的资源,充分调动起隐藏在网民中的信息资源,将需要采集的自身又难以完成的档案收集任务众包给不特定的大众,通过网民的智慧实现档案资源的集中。沈阳市家庭档案研究会主办的“家庭档案网”,就是一个趋向众包模式的档案网站,主要是通过网络渠道收集家庭、个人、名人的各类档案信息,网站工作人员再将这些零散无序的信息分类整合,以专题专栏的形式呈现出来。
三是档案部门要善于与档案利用者合作。档案利用者虽然不直接产生档案资源,但是他们利用档案的行为及结果所留下的痕迹成就了一部分档案资源体系的建设。大数据时代,档案利用者通过网络进行的档案查询、检索、咨询等一系列行为,都成为信息记录,档案工作者可以从用户的利用轨迹中发现新的信息点,找到信息与用户之间的相关关系,或是用户需要的、或是用户感兴趣的,通过信息点去收集与之相关的内容,大数据时代,档案部门不用再去理会信息的因果关系,要关注是什么而不是为什么。网络电商就是通过记忆客户浏览过的商品,找到商品与客户之间的关系,再搜索商品与商品之间的关系,客户的网页就会显示“热销品”、“同类”、“猜你喜欢的”之类的信息推送服务。
四是档案部门要善于与档案保存者合作。档案保存者是档案资源的最终归属者,拥有最集中的档案资源。大数据时代,存储在档案馆、档案室的档案资源和互联网公司、数据分析公司拥有的数据资源总量相比,简直九牛一毛。互联网的发展带来了无穷无尽的数据,数据的泛滥和混乱催生出数据分析公司来开发利用数据,所以说到底,数据分析公司拥有最多最大的数据。中国电商大亨马云就提出要为政府网站的信息提供云存储服务,为国家保存档案,一方面,马云的公司团队有着高水平的大数据处理人才和技术,从数据的采集、处理到存储都能提供一套流程完整的服务,更重要的是马云的公司保存着大、多、全的社会信息资源,政府必须从他那买单。
3.1.3改变档案资源采集方式
积极开展接收和征集工作是传统的档案资源采集方式,档案部门以丰富馆藏为目标,依法做好到期应进馆档案接收工作。大数据时代,档案资源的采集不能光是坐等人来,网络资源的实时变化、档案形成者的大众化都需要档案部门改变档案资源采集方式,收集到数量更多和质量更好的档案资源。
一是网络资源的主动抓取。对于网络资源要通过主动抓取的方式进行采集归档。网络资源数量多、更新快,重要信息和垃圾信息都是一闪而过,而且垃圾信息占大多数,一旦错过重要信息就会被海量信息淹没,再要找回得花费大力气。网民对重要信息也缺乏归档意识,对于有用的信息不知道该怎么保存,该交给谁保存。档案部门就要适时担起自己的职责,改变被动收集档案资源的方式,变身数据捕手,实时监控网络动态信息,采取主动出击策略选择重要网络资源归档,完成网络资源的主动抓取任务。同时档案部门要引导并培养网民重要信息归档意识,争取从网民手中获取更有价值的档案资源。
二是用户实时推送归档。形成档案的用户,过去是依法定期按时归档,且大多是针对于党政机关部门而言的,要求次年六月以前完成前一年的档案归档工作。大数据时代,党政机关部门不再需要全年度工作完全处理完毕后文件材料才一齐归档,通过档案管理内部平台系统就可以将当下办理完毕的文件材料及时推送到平台,档案室的档案员随时接到推送消息后就可以依据文件的机构和问题等内容对其进行分类预归档保存,确认这类型档案不再产生新的文件材料加入进来,对之前的预归档文件整理完毕后就完成了档案的最终归档保存工作。形成档案的家庭和个人,也可以通过档案部门开通的网站平台渠道或是档案专门网站实时推送自己想要归档保存的档案,交由档案部门代为保管。这种实时推送归档的档案采集方式不仅能降低文件材料因日积月累存放而丢失的风险,而且对于档案员和档案部门来说,实时的归档分散了工作任务,化解了集中归档时间紧任务重的难题,归档质量也能得到充分保证。
3.1.4科学整合档案资源
大数据时代,档案信息化步伐加快,档案管理趋向结构化、系统化,档案部门要学会应用新一代信息技术及相关工具和方法,稳步开展档案数字化和电子档案接收工作,进一步提高档案资源优化整合能力。
第一,继续推进“存量数字化、增量电子化”战略。档案部门一是要以“存量数字化”的要求极力推进传统载体档案数字化,尤其是对纸质档案要加快数字化进程,查阅时用数字化档案代替原件利用,保护并尽量延长纸质档案寿命;二是要以“增量电子化”为任务对归档、接收进馆档案要求全面实行原生电子文件形式,新形成的电子文件及时归档保存并按时接收进档案馆保护。大数据时代,档案部门要严格要求党政机关单位对归档文件实施电子化管理,从源头上保证数字档案信息的真实、完整、可用;接收档案以电子化版本为主,在范围上多注重民生电子形式档案的接收,在种类上多收集多媒体、数据库、网页等形式的档案资源。在加强电子档案接收管理方面,国家将制定一批实用性高操作性强的文件,如《电子档案准确性、完整性、可用性、安全性检测规范》、《海量电子文件数据存储指南》、《企业电子文件归档和电子档案管理指引》等,这些文件有望今明年陆续出台,着重考虑网络信息的归档管理工作,党政机关等单位的门户网站、政务微博、政务微信等新兴发布平台的信息归档工作将逐步提上日程,成为档案部门一项新任务新挑战。
第二,优化资源结构。档案资源的底层化、碎片化,各种档案资源散落在互不连通的数据库中,成为一座座“信息孤岛”,如何连通这些孤立的数据库,将分散的档案资源集中起来,实现档案资源的优化整合,发挥出档案资源最大价值,是大数据时代档案管理的一个重要挑战。档案部门没有能力对所有的档案资源兼容并包,需要和不同的群体合作,一是档案部门系统内部之间的互联,二是与文化馆、图书馆等相关学科之间的互助,三是和网络商和数据开发公司的互通,最重要的是档案部门要与社会进行资源、技术、人才方面的交流合作,搜集更多的资源、运用更强的技术、借助更专业的人才实现档案资源的最优化。同时,档案部门还可以利用云计算技术,借助互联网的计算方式,将全国的档案资源进行整合,形成“中国档案云”,完成档案资源的优化整合,充分发挥档案资源的集聚效应。
3.2创新服务内容,健全方便人民群众的档案利用服务体系
“数据本身是没有价值的,通过数据提供服务才具有真正的价值,数据即服务”①,档案资源若是只存放在档案馆不拿来用,就如同一堆废物,保存再多也是无意。如何从档案资源中挖掘出价值,盘活档案资源,将昏昏沉睡的死档案变成源源不断的活资源,就需要档案部门加速档案资源开放进程、改变档案资源服务方式、构建基于档案资源价值存在的知识服务体系。
3.2.1加速档案资源开放进程
大数据时代,档案部门一方面面临着与社会散落的档案资源进行激烈争夺的局势,另一方面随着《政府信息公开条例》的实施,国家积极稳妥地推进政府信息公开工作,依法保障公民、法人和其他社会组织获取政府信息的权利,这种权利的开放使得公民对信息的知情权要求更高,他们希望获得更多更有效的信息,档案资源加速流动与开放成为必然结果。档案部门对档案资源的开发应遵循“公开为原则,不公开为例外”,及时公开超过保管期限的秘密档案,尽量做到“应开尽开,保障秘密档案的安全”.例如,美国NARA(国家档案与文件署)出台的《开放政府计划》,通过公民档案员项目、数字化战略、在线公共利用检索系统、社交媒体参与等举措,扩大档案开放力度提高公众参与水平。②档案资源开放,不仅有利于推进政府信息公开制度的实施,优化办事流程提升工作效率,保障公民对信息的知情权、参与权与表达权,更重要的是档案资源在全社会自由流动开来后,经历从守旧封闭到创新开放,为社会奉献丰富多彩、足量多金的信息,有助于跨越档案部门和其他政府部门之间的“信息鸿沟”,助力城市记忆工程和智慧城市的建设。
3.2.2创新档案服务理念
大数据时代,档案资源要实现物尽其用,就要对其内容深度挖掘,打造档案资源知识库,档案利用者也会因自身知识水平的提高对档案服务提出更多的要求,关注他们新的需求,对传统的档案利用服务理念和途径作出调整,用新思维和新方法,开辟档案利用服务新高度。面对档案利用者的诸多需求,档案部门要努力完善四种服务理念。
一是人性化服务。人性化服务就是在档案服务中体现“以人为本”思想,不能有官老爷心态,以用户第一为原则,给用户提供平等获取信息的权利,服务过程中表现良好的服务态度,把自己当作服务生,面对用户热心、耐心、细心、专心,尤其是基层档案部门经常要服务一些农民老百姓,对他们的利用诉求要认真倾听,服务要热情周到。
二是个性化服务。个性化服务是档案部门对档案利用者需求提供精确性匹配的服务。大数据时代信息受众分类更加明确,用户的利用需求发生改变,追求个性化服务,享受不受时空限制方便快捷获取所需,档案部门要对用户的利用需求、行为、方式等细节进行收集、追踪和分析,预测出他们需要的内容,以参考、定制等方式推送给用户。
三是智能化服务。智能化服务是档案服务的最高技术水平。大数据时代更注重技术的运用,档案服务技术水平也要提高,档案部门要有智能化的档案数据处理系统,能够快速完成数据分析任务,智能抓取有效信息,提供便捷服务通道,这不仅有助于档案部门发现隐性知识,还有利于从档案服务向知识服务跨越,实现档案知识的顺畅流通与广泛传播。
四是知识化服务。知识化服务是一种基于网络环境下的开放式的服务,是档案服务发展的趋势和方向。档案知识化服务应以知识管理理念为指导,以档案资源为核心,以大数据技术为支点,以档案知识挖掘为重点,以档案知识应用和知识创新为目标来构建档案知识服务体系,完成知识提供与检索、知识整合与加工、知识共享与交流的一体化服务。
3.2.3拓展档案服务途径
网络的发展改变了信息传播的方式,丰富了信息传播的渠道,档案服务借阅、咨询、展览等传统途径将得到调整,档案服务途径多样化网络化,应用各种新兴媒体、发挥网络远程功能、基于云计算云存储的云服务手段将成为大数据时代档案服务新战场。
微服务。微服务主要指以微博微信等新媒体为载体即时传播信息的服务形式。微博即一句话博客,是一个基于用户关系信息分享、传播、交流以及获取的社交网络平台,主要涉及信息发布、网络营销、政府管理以及个人交流等方面,是中国网民上网的主要社交网络平台之一。①微信是一个为智能终端提供即时通讯服务的免费应用程序,通过网络快速发送短信、语音、视频、图片和文字,微信公众平台的订阅号和服务号就是为微信用户提供公共信息、咨询和服务的平台。②档案部门或档案学人通过开通微博微信可以传达档案信息和传送服务项目,向社会公众提供方便快捷的档案服务,拉近档案与大众的距离,拓宽档案信息服务的范围,提高档案信息服务的效率,还可以交流互动、共享信息、加强协作,为社会提供更好的档案服务。笔者通过对档案微博微信的搜索,开通账号的用户基本分机构、企业、期刊、个人四类,其中较有特色和影响力的档案微博有“抚顺档案”、“武汉市档案局”、“南京档案”、“上海大学档案馆”、“胡鸿杰”、“寒似冰淡如水”等等,档案微信公众号有“厦门档案”、“浙江省档案馆”、“青岛档案”、“贵阳档案”等等。
远程服务。远程服务指利用通信手段实现不同地域之间的实时人工服务方式。③远程服务具有方便快捷、节约成本、服务对象没有地域限制、服务可集中化管理的特点和优势,非常适合于大数据时代的网络档案服务。档案信息远程服务以数字化的信息资源为基础,依靠科学技术,通过网站、电子邮件或实时交互的形式,向用户提供远距离档案信息咨询和服务。档案部门要在加强档案资源建设的同时,加快采用信息技术,充分利用网络优势,建设好覆盖广、内容全、检索快的档案远程利用服务平台。“江苏省档案远程教育平台”④就是由江苏省档案局、江苏省档案馆主办的以档案教育教学为主的档案远程教育服务平台,目前提供15门的网上档案岗位培训课程和16门的网上档案继续教育课程,还有与课堂相对应的在线考试和证书打印等多种服务项目,帮助档案人员提高档案素质,也为有档案知识需求的社会公众提供了更多的学习机会。
云服务。云服务指通过网络以按需、易扩展的方式获得所需服务,它是一种基于互联网的相关服务的增加、使用和交付模式,涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。⑤档案云服务是以云计算技术为基础,以云存储资源为保障,将分散的档案信息通过云平台组织构建起来形成服务云,借助这些云平台强大的计算能力和低成本、高安全性等特性来提高国家档案信息资源共享效率的一种档案信息资源服务模式。国家档案局开展的“中国档案云”项目就是致力于打造国家级开放的档案信息资源共享利用系统,它以云技术云存储为依托,覆盖全国各级各类档案馆,为社会公众提供开放档案信息查询利用服务的专业化平台,将成为互联网用户访问全国开放档案资源的统一门户,提供一站式全方位服务。①