随着因特网和数字技术的快速发展,档案馆数字档案信息一方面以前所未有的速度和数量迅猛增长,另一方面档案馆保存数字档案信息的技术和能力却相对滞后,存在着这样或那样的诸多隐患问题,有人把这些隐患问题比作“一枚定时炸弹”,这决非是危言耸听。据笔者调查了解,数字档案馆近年来虽然一直是档案界的一个研究热点问题,但其研究大多集中在硬件建设、档案信息的收集整理与检索利用、知识产权管理等方面,而对“如何将有收藏价值的数字档案信息长期保存、为今后档案馆档案信息服务提供保障”方面的研究却没有得到足够重视,致使档案馆数字档案信息保存中的一些技术问题没有得到及时有效的解决,数字档案信息保存现状不容乐观,充满了“数字档案信息丢失”的危险,研究解决数字档案信息保存技术问题已成为摆在档案馆面前的一项刻不容缓的迫切任务。笔者不揣浅陋,拟就当前档案馆数字档案信息保存技术问题,谈点个人的思考与认识。
1 思考之一:当前档案馆数字档案信息保存技术方面存在问题吗
当前档案馆数字档案信息保存技术方面是否存在问题呢?要回答这一问题,首先必须弄清档案馆数字档案信息保存的现状。
众所周知,档案馆的一项重要职能就是保存人类档案文化遗产,这是发挥档案馆其他职能作用的前提和条件,因为从某种意义上讲,档案馆一旦失去了档案信息保存功能,其存在的价值也就消失。多年来,面对传统档案资料保存介质老化和收藏空间的压力,各级各类档案馆纷纷采取措施,对保存介质老化的档案资料采取各种保护措施,改善收藏环境,然而至今仍有数以万计的档案资料保存场所缺乏预防灾难的措施或适当的环境控制,确保馆藏档案资料不会遭到灾难性损失的任务仍然非常艰巨,以传统形式出现的大量档案资料的长期保存问题仍然有待于解决。数字存储技术的出现及其在档案馆档案信息保存工作中的应用,使档案馆界精神为之一振,因为数字存储技术在保存人类档案文化遗产方面似乎显示出了绝对的优势,不但能解决日趋严重的馆藏空间不足的压力,而且使长期困扰档案馆工作者的抢救馆藏珍贵档案资料方面的难题得以解决,尤其是对那些长期风化或虫蛀损坏、濒临毁灭的古代珍贵档案典籍进行数字化转换,不仅解决了档案文化遗产保存的问题,而且转换后的数字档案信息可以对利用者开放,充分发挥它们的利用价值,从而解决了藏与用的矛盾。然而,人们在兴奋之余却没有意识到数字档案信息保存的理想与现实之间仍存在着很大的差距,数字档案信息的长期保存技术问题还远没有得到解决,并成为档案馆健康发展的一大障碍。
档案馆数字档案信息长期保存的技术问题虽然早就存在,也曾有人表示过疑虑,但由于起初档案馆数字档案信息的数量、范围和收藏规模都较小,因而没有引起档案界同仁广泛、足够的重视。随着档案馆数字档案信息数量的增多和这方面问题的不断暴露,数字档案信息长期保存的技术问题逐渐引起档案界的关注。限于当前技术水平,有很多档案馆抱有这样一种观念,即数字档案信息的保存是建立在复制的基础上,而不是依赖物理载体本身的长期保存。但与仅仅把档案信息从老的载体转移到新的载体或者从旧的系统转移到新的系统的情况相比,这里所说的复制(也指“迁移”或“更新”)情况更为复杂。为了保存数字档案信息,常常有必要进行复杂且费用较高的格式转换和资料迁移,以便使保存的原有档案信息在重现时保持真实。可是,无论是目前可获得的技术支持还是可支配的资金都无法完全达到这些目的。所以,最常用的保存方法是将不太稳定的磁性或光盘载体上的数字档案信息打印在纸质材料或缩微胶片上。这似乎具有讽刺意味,就在档案部门发现进行传统档案的数字化转换是一项有效措施,能解决某些因印刷载体的老化、发脆而使上面的档案信息丢失的问题时,同时,又有更多的以电子形式出现的档案信息为了安全起见和长期保存,采用纸质材料或缩微胶片将其打印下来。其实,这正说明了在向数字化时代过渡时期印刷载体档案信息存在的必要性和现实意义。一般而言,高质量的酸性纸的寿命可长达一个世纪或更长,而档案用的高质量的缩微胶片寿命可达到300年甚至更长时间。纸张和缩微胶片具有不需要专门的硬件和软件读取的优势。对于许多档案馆来讲,在数字档案信息长期保存问题没有得到根本解决且又缺乏更加经济实用的迁移办法之前,将数字档案信息打印在纸上或胶片上,也不失为一种切实可行的办法。当然,将数字档案信息打印在纸质或胶片载体上存在着许多不利因素,尤其是使数字档案信息的一些特有的功能丧失。
综上所述,笔者认为,当前凡是藏有数字档案信息的档案馆,都面临着承载数字档案信息载体的退化而带来的数字档案信息丢失的危险,以及因数字档案信息格式的多样化与读取、利用这些档案信息所使用的软硬件设备更新换代频繁而造成管理与使用上的不便。虽然,许多档案馆为数字档案信息的收藏与提供利用进行了一些有益的尝试,其中有些做法从短期或局部看是可取的,但在技术上档案馆数字档案信息长期保存问题都还远远没有得到解决。
2 思考之二:当前档案馆数字档案信息保存技术方面存在哪些问题
虽然数字技术从理论上为档案馆完好保存档案信息提供了可能性,但实际上,档案馆数字档案信息的长期保存还存在许多远没有得到解决的技术问题。笔者这里所说的“数字档案信息”既包括一开始就是以数字形式产生的档案信息,又包括由传统形式的档案转换而成的数字化档案信息。记录数字档案信息的载体是很容易遭受到老化和灾难的损害的,与传统档案相比,数字档案信息即使在理想的环境条件下也是短命的。数字档案信息尤其易于丢失和损坏,因为它们是存储在易受损的磁性材料和光盘材料上,一旦受到热、潮湿、空气污染的侵袭,强磁场的干扰,或是读写设备出现故障,这些材料就会迅速退化而造成存储的档案信息衰退或丢失。此外,如果阅读档案信息的设备过时,或将数字档案信息转换成人们可读形式的软件因被淘汰而不复存在,那么,即使存储档案信息的载体保存得再好,数字档案信息同样无法读出。有关专家指出,由于计算机软件、硬件、存储等技术方面的更新速度不断加快,记录和存储数字档案信息的设备、手段和软件每3至4年就要更新换代。因此,比载体退化更加迫切和更具挑战性的是检索技术和读出技术过时的问题。
对于档案馆利用者来讲,档案馆数字档案信息的真实可靠性是十分关键的。确保数字档案信息真实性的措施之一就是要求档案馆存储比数字档案信息多得多的档案信息。像正式档案文件的结构、便于档案检索的元数据、档案使用的原始记录、档案文件产生的日期,等等。这样的特征对于确保档案信息可靠性都很有帮助。美国等发达国家的一些档案馆,要求保存的数字档案信息必须带有元数据,以此作为支持所藏档案信息的完整性、真实可靠性的依据。如果数字档案信息创造者都广泛采用通行的数据和通讯标准,将有效地促进档案馆数字档案信息长期保存工作的进展。所以,档案馆要使得保存的数字档案信息具有多元化、多功能的特征,既保证数字档案信息的可靠性又保证其易用性,就要对大量用以存储和检索数字档案信息的软硬件提出非常高的要求。
就数字档案信息保存的软硬件要求而言,虽说不同类型的档案馆不尽相同,但就当前而言,笔者认为,一般都应尽量符合以下几方面的要求:一是存储系统应当尽量能够处理各种形式的数字档案信息,包括档案的正文、数据、图像和声像资料;二是存储数字档案信息的载体应当尽量符合“有很长的寿命、高度的抗灾性能、非常大的存储容量以及能够经受长期反复地使用”等要求;三是把档案信息从其他存储形式转换到数字形式或迁移到新的存储技术载体中应尽可能是十分方便、迅速、准确的,而费用则应尽可能低廉;四是数字档案信息保存对存储的空间要求应尽可能小,并且尽可能不需要高度敏感的环境控制;五是要求数字档案信息保存设备、载体和维护成本尽可能控制在较低的水平,从而使数字档案信息保存能为档案馆负担得起。
3 思考之三:如何应对当前档案馆数字档案信息保存技术方面存在的问题
如何应对当前档案馆数字档案信息保存技术方面存在的问题呢?笔者认为,我们应当从技术手段方面加强有利于档案馆数字档案保存的基础设施建设,建立一个有利于档案馆数字档案信息长期保存的、完善的技术保障体系。至于具体如何操作,目前虽然尚无尽善尽美的方案,但笔者认为可以借鉴现行做法中的经验教训从存储载体、迁移技术、转换技术和管理工具四个方面加以考虑,这四个方面通常是相互依存的,是档案馆进行数字档案信息长期保存不可缺少的基础设施。
3.1 存储载体
磁性和光盘载体的有限寿命是一个重要的问题,尽管这个问题不是档案馆数字档案信息保存的最主要制约因素。从最近的研究情况看,如果处理得当,磁性载体的寿命可达10至30年,有些光盘的设计寿命已长达100年之久。但大多数权威人士认为,载体寿命的提高没有多大的意义,因为目前的载体寿命往往超过了读取载体上档案信息所用软件和硬件设备的寿命。尽管如此,仍然需要提高基本的存储载体的稳定性、容量和寿命等来减少存储的成本。值得指出的是,缩微胶片被认为是唯一能够接受的档案信息存储载体,其保存的寿命至少可达300年。据报道,美国洛斯阿拉莫斯国家实验室宣布,发明了一种高密度的只读存储技术,采用粒子束将信息记录在不锈钢针、钵或其他材料上。这种高密度技术是目前光盘只读存储技术存储量的180倍,而其成本只有光盘只读存储技术的一半。据称,采用这种技术存储信息的载体不会受到材料退化的影响,因此这可能为档案馆数字档案信息存储载体问题的解决找到新的途径。
3.2 迁移技术
大容量存储技术无论出现怎样的突破,从数字档案信息长期保存的角度,都需要有更好的办法将数字档案信息迁移到不断更新的硬件和软件中去。目前,有些档案馆在数字档案信息迁移技术方面的实践,只是局部的、少量的,对于大量的数字档案信息迁移还没有多少经验。一旦需要进行迁移时,很难预料到需要进行多大量的格式转换,迁移的费用有多少。有关档案馆数字档案信息迁移的成本问题,至今笔者还没有看到档案界开展这方面的研究。
反向兼容技术的发展对档案馆数字档案信息的保存工作是有利的。反向兼容,可以使用新一代的软件从老的系统中“读取”数据,而无须格式转换,并且不会失去检索、显示和计算等功能。虽然反向兼容技术日益普及,但是,反向兼容也是有限度的,通常只具备兼容前一代或前两代的功能,而软硬件升级换代的周期通常为18个月,那么,许多四、五年前或年代更早一些的数字档案信息用现行的软硬件就无法读取。这样就不可避免地要利用数字档案信息迁移技术。档案馆在保存数字档案信息方面有许多的选择,他们可以保存与原始记录完全一样的副件,保留全部的显示、索引、计算功能,也可以只保存显示和部分的计算功能,或者是用文摘性质的东西来代替原始记录。在档案馆数字档案信息迁移过程中,可以有目的地将一些不重要的细节和背景情况过滤掉,也可以改变格式和存储载体。这样做的目的主要是提高档案馆数字档案信息的保存质量,以便于利用者据此判断出所需档案信息的真实可靠性以及这些数字档案信息与原始记录之间的联系。
有人提出保留过时的软件和硬件系统,以此作为利用原有数字档案信息的工具,可是这无论从成本还是从管理和使用的角度都是不切实际的,无论是档案馆还是利用者都不可能为了提供或利用数字档案信息再去熟悉业已淘汰的各种软硬件系统的性能和操作技能。因此,档案馆应当积极地开展对数字档案信息进行迁移工作的可行性及成本效益的研究。
3.3 转换技术
要想使档案馆大规模数字档案信息保存工作变得切实可行,另一个重要的因素是要有更快、更低廉和效果更好的转换技术。我们应当清醒地看到,目前我们正处在一个混合的环境之中,纸张、缩微胶片、录像、磁性材料、光盘等载体要同时存在好多年,对此我们需要统筹考虑,采用更加有效的办法来处理它们之间的关系。转换技术的提高可以解决混合环境下数字档案信息保存与利用的问题,使档案馆将某些格式的数字档案信息存储在稳定性好的载体(比如缩微胶片)上,然后再按需要转换成数字格式以便于分析和再利用。
3.4 管理工具
需要考虑的第四个方面是开发数字档案馆使用的管理工具。对于像超文本系统中出现的那些动态数字档案信息的保存和再利用,如果没有一套很好的管理工具和办法是很难做到的。超文本资料的范围是很难确定的,因为没有一个团体或机构对节点和链接中出现的变化进行控制,同时这些资料存在着极高的易失性,因为节点的内容发生变化、存储档案信息的网站发生变化、各节点之间发生变化,随时都有出现移动和消失的可能。最近的一些工具,如MOMspider(Multi-Owner Maintenance Spider)能够对一部分网站进行巡察,记录下诸如掉线、文件移动、文件修改和已过期资料的维护问题。尽管这些工具对目前的档案维护是有用的,但却不能解决长期保存的问题。如果进一步研制出解决保存问题的工具软件,那么,所研制的工具软件就应当具有潜在的功能,起到过滤、识别类似或相同资料的作用,以及对维护中出现的问题起到监控作用。
总之,档案馆数字档案信息的长期保存是一个系统工程,也是当前数字环境下关系到档案馆生存与发展的关键问题。这就不但需要各级各类档案馆千方百计争取政府有关部门和社会各界的支持和帮助,集思广益、群策群力,而且需要档案馆自身去积极行动,在吸取借鉴传统保存中存在的经验教训的基础上不断探索、积累经验,才能真正解决好这一问题。 |