欢迎光临深圳市莞深恒源科技有限公司官网!
全国咨询热线:13144843931
当前位置: 首页 >> 新闻中心 >> 常见百科

历史档案的整理

时间:2022-01-29 10:53:50 作者:超级管理员 点击:709次

一、明清档案的整理与演变

《档案学辞典》认为,整理归档是指“档案机构根据文献在来源、内容、时间、形式等方面的文化联系,对档案进行系统的分类、组合、整理和编目。”文献档案的整理无疑是一种纪念工作。

文献校勘之所以具有代表性,主要有三个原因:一是校勘对象的特殊性,珍贵史料既具有一般档案的共性,又因其历史悠久、不可互补性而具有一定的艺术价值;其次,整理方法的特殊性,历史文献的内容和载体不再自然,需要在整理过程中有特殊的整理方法;第三,校勘理论的局限性。对于珍贵的史料,现有的新闻传播学理论和研究更多地关注其作为档案的普遍性,而忽视了其作为史料的个性,这也造成了文献档案整理理论的特殊性。

中国**国家档案馆成立90年来,建档工作经历了文献博物馆时期、明清时期、1980-2010年、2011年四个阶段。

图书馆时期的整理与归档。作为故宫下属的三级机构,已经开始收集整理档案。这一时期的主要工作是接收和集中散落各处的清代档案,并进行初步清查。当时,在战争频繁的环境下,文件经常丢失和转移,数据收集受到很大影响。但在当时学者的坚持下,原本杂乱的明清档案随波逐流,整理出它们的76个脉络,分门别类,构建了它们的体系,初步奠定了整理清代档案的基础。

明清档案。这一时期的档案工作具有承前启后的特点。一方面将之前散落各地的明清档案继续接收,对于宗人府等尚未整理的档案,将进行大致分离存放,以备下一步整理。另一方面,及时总结整理经验,不断探索,逐步熟悉和尝试整理不同系统的档案,建立了较为科学完整的整理模式,巩固了现有的档案基础。其中,影响较大的是副奏折的18类记载、内阁官职按题材划分等。可以说,这一时期是立案工作的重要时期,奠定了一直沿用至今的全家庭监护制度和档案层级的基础。

1980年国家档案馆**后,人员迅速增加,整理队伍不断壮大,进入均衡发展时期。在这个阶段,档案的整理基本上延续了以前的模式和方法,从档案层面到档案层面。总的编排方式是:集卷-分块-逐渐编号-加信封-写标题等。同时,对于系谱系统不同的档案,也区分了不同的排序标准和层级体系。2011年初,根据“五年整理归档计划”,档案室进入新的整理阶段。在后续阶段,我们采用计算机辅助排序,采用外包模式,并根据数据归档的具体情况制定数据归档方案和细则。通过8个签约项目,我们完成了内阁、军务部长、皇宫中学60个档案馆5243647(册)档案的整理工作。

Ii.历史档案数字化排序

2011年,我馆提出了“五年数据归档计划”,这是社会化过程的**个外包安排模式。通过高度标准化、模块化、规范化的过程监督,并辅以计算机网络管理数据,对我馆现有档案进行整理进行了新的尝试。中国**国家档案馆档案数字化工作的深化,产生了大量珍贵史料的数字化影印,积累了海量的历史文献资料。*大的特点是:

1.馆藏数字档案规模庞大。从文献层面来看,我们图书馆的档案数以千万计,从电子证据来看,这是天文数字。单从2011年5月以来的编译结果来看,每年编译的文件超过160万个,电子证据近4000TB,数字时代可使用的帧数超过3200万帧。

2.字段很多,一个档案的价值信息也是数不胜数,比如负责人、时间、职位、地区、档案号等几十个信息字段。然而,在我们图书馆的档案中,不同的档案归档时会输入不同的信息字段。例如,如果排列了宫中朱批纪念类的物品,则需要录入朱批的内容,但在属于朱批纪念类的物品档案中,则不需要此录入字段。

3.价值密度小,数据归档过程中必须录入一些数据。然而,对于用户来说,不同的目的和需求,不同的文件和信息选择,导致数据使用频率高,吸收效率差异大,在一定程度上降低了价值密度。

4.人的主观判断与差异化管理。以往的整理归档主要是以个人观望为主,每个人**承担几个环节,难以替代,受“人”因素影响。但是现在的归档工作需要时代的发展,这种整理模式的作用和带来的麻烦都是显而易见的。借助计算机,可以*大程度地避免这种影响。任何时候都不可能用数字技术快速有效地整理珍贵的史料,尤其是数千万的明清档案。技术与电脑整理结合采用大规模外包模式,现在可以实现,原因有以下三(条件):

1.现代科学的发展学技术。与过去相比,如今,计算机已经成为应用*广泛的辅助整理工具,并设计了高清摄像头、联网系统、多交互操作软件等。,都提供技术支持。

2.专业服务公司建设。与过去相比,专业化分工进一步细化,出现了能够提供历史数据整理和外包业务功能的专业化企业。这些公司可以根据归档工作的需要设计相应的程序,并提供足够的设备操作,以流水线的生产模式输入、整合和保存所需的档案信息。

3.各领域理论的整合。在跨学科、跨学科融合成为现实的今天,计算机辅助历史文献整理得到了更多的支持,如网络化产品与整理归档环节的工业流水线相结合,可以提高效率;企业管理理论应用于数据归档人员管理,使标准化生产成为可能,等等。

三五年来的备案情况及特点

就珍贵史料具体数据的整理而言,我们在收集、整理、储存和处理数字档案的过程中,不应被数据冲昏头脑,而应冷静对待。基于云计算的用户行为体验的运行规律,在一定程度上演绎了基于利用的整理思想范式,也提供了文献档案整理的基础分析。

关于创新革命推动各行业启动量化进程的事实,哈佛历史教授加里·金

描述:“这是一场革命。大数据的巨大资源让各行各业都开始了量化的过程,这个过程在任何领域都会开始,无论是历史、商业还是政府。与手工作坊的历史整理归档不同,我馆实施的大规模珍贵史料量化整理,其特点是持续推行产品的标准化和广泛性。

自“大数据云计算”概念引入以来,我们通过五年来的归档实践,重新思考了历史数据整理的内涵和外延。系统构建的整理操作步骤、数据接口和程序功能在整理实践中不断完善。在排序的实际层面上,我们遵循了《馆藏档案整理总体方案》(2011—2015)中“维护现有的整个文件设置和原始文件文件库”的排序原则。在文件级排序时,我们基于我馆3月《划分馆藏档案文件级基础保管单位件的原则及标准》确定文件中的文件级托存单位“件”,给出文件级文件号,并根据本项目的排序实施方案及相关规则形成检索数据。卷中的每个文件都配有一个信封,并配有条形码。

1.操作流程标准化。在扬弃传统整理工艺的基础上,我馆的整理实践立足于

项目外包的模式充分利用现代信息技术技术,兼顾质量和速度,在确保文件、档案“一物不丢、一物不乱”的安全框架内,妥善规范整理流程。我们针对珍贵史料探索出了一套通用性强的整理流程,即:预处理—人工组卷整理—计算机化信息提取、整理—人工验证—添加文件级信封、实体整理—包装贴标、成品质量检验—暂返库—进入数字化处理阶段—进入实体文件的存储与封存—进入数据虚拟描述阶段:

2.数据接口标准化过程。在数据库中构建框架时,设置收集元素字段的El。

统一的计时标准。在保留所有传统字段信息(档号、责任者、职官、文种、时间、文字种类、件数、面数、画幅数、破损情况、备注等)的基础上,我们为不同群体提供基于界面生成的个性化定制相关数据库。例如,在编制排序顺序目录时,根据需要将相关条目与标准字体段分开。

3.规范程序功能管理。考虑到档案工作成果数据的集成和共享,它对应不同的

目录业务需求由相应目录数据库中的优化软件程序模块生成。例如,仓库存储的需求会生成一个包含文件位置信息和损坏程度等重要信息的目录数据库系统。无论满足什么样的需求,都是基于一个通用的程序功能。

更加注重正相关而不是因果数据思维,使我们对历史数据归档的内涵有了新的认识,即历史文献的整理是分层次、分维度的,没有一劳永逸。我们对文化整理归档数字化改造和描述的实践,通过件与件、卷与卷、项与项、类与类、全案与全案之间的数据整合,通过关联形成人机协同,通过交互和挖掘发现新的价值。

要突破信息锁定的传统整理思维,**步是克服其他传统数据形成的数据孤岛,搭建数据信息共享平台,形成既面向历史又面向未来、充满开放珍贵史料的大数据云计算。

组织内涵的开放性。在实际的文献档案整理工作中,有对珍贵史料因果关系的尝试。

澄清欲望。然而,传统的整理实践告诉他们,这种让所有意图都清晰的想法几乎是无法解决的。然而,我们却进入了西方本体论中一个叫“解释的循环”的陷阱,钱钟书曾用古雅细腻的文言文翻译过:“小品使大品明,大品使小品明;把终点推到终点,探索终点到贫困终点;相互往复,容易弄圆,避免偏燥,所谓‘阐释之循环’就是“易”。

换言之,“解释的循环”深刻传达了传统档案工作思想的困境。我们努力准确地恢复单个文件的任何信息元素,同时对整个档案进行详细而全面的描述。这种在单档和全家福之间给出满意解释的意图,恰恰证明我们陷入了因果链陷阱。

大数据的出现改变了人们的思维框架和认知形式。在“数据驱动”的观点下,数据的杂糅性优于准确性,数据的宏观调控高于微观推敲。在数据挖掘中,我们放弃了对因果关系的渴求,专注于对各种社会关系的整体数据分析,即因果关系的逻辑让位于数据之间的线性关系。检查数据之间“互反”的正相关关系,这可以通过实证主义在人类认识活动领域倡导的交往理性得到证明。

档案本身丰富的校勘脉络为校勘活动设置了鲜活的概率,而校勘脉络的动态系统理论上决定了校勘理念始终在进行,因此校勘活动始终是开放的、创造性的、永无止境的。

以数据归档整理为例,“五年归档工作规划”出台前85年的整理实践表明,“如何整理文献”是整理历史文献的基本点,也是争论不休的热点话题。馆藏珍贵史料的具体情况极其复杂,导致对“片”的内涵和外在外延缺乏准确、权威的标准。我馆过去整理部品的具体做法:主要部品附件与个别件有争议,内容相关的部品与实物形状制作的部品有争议,一组文献与文献集有争议。2011年《划分馆藏档案文件级基础保管单位(件)的原则与标准》的实施意见可以看作是对这个问题的权威调解。但是根据大数据环境下的整理实践,这个整理问题几乎是可以克服的。在数字虚拟空间中,关键是零件之间的正相关。简而言之,对A部分的判断高度依赖于它与相关B、C、d部分的关系,我们可以通过获取数据搜索网站,根据相关度创建所有片段的集合。这样,关于“零件”的争论将被取消,它将不再作为一个实体是可有可无的。

2.结果是公开的。

方辉在《瀛奎律髓》中指出:诗人有很大的判断和总结。我馆《五年归档工作规划》是在总结我馆归档历史规律、把握“大数据时代”归档工作发展路线的基础上,结合我馆历史文献真实情况做出的“重大判断”。档案收集整理分为五个阶段。截至2015年4月,我们已经完成了档案整理项目的前四个阶段。根据项目的整理实践,这四个时期可以称为“总结归纳”。对于整理珍贵史料思想中试图还原档案产生情况和原始联系的理想而言,“五年档案规划整理”无疑是一大裨益。经过整理后再进行全面数字化改造的珍贵史料,在克服了传统的纸质档案孤岛后,将与包括大数据在内的所有信息形成明清档案。到那时,通过适当的数据引擎,我们可以完全组织各种软件定义,而不会伤害到物理文件。

记录人类活动的珍贵史料承载着个人无法控制的各种信息资源。当数字化完成并整合到电子档案中后,借助数据引擎,我们可以在复杂运算和分析的基础上,对数值模拟和演示进行深入研究,我们完全有可能看到更多尘封往事的真相,解开更复杂、更隐秘的历史谜团。这表明人们利用数字档案积极获取、标注、比较、采样和解释文化知识,这充满了很多机会。这也从根本上改变了历史数据归档结果的单一性和强封闭性。