重特大事件档案数据资源整合的 意义、障碍和路径

发布时间:2025-02-05 17:19:24被阅览数:205 次信息来源:《北京档案》

  作者:张福虔

  摘要:重特大事件档案数据整合对于推进国家治理体系和治理能力现代化具有重要意义。论文采用内容分析法,针对重特大事件档案数据整合面临的政策法规、数据技术和数据资源的障碍,从宏观、中观、微观三个层面进行剖析,提出重特大事件档案数据资源整合的实现路径,包括宏观政策层面:完善政策法规框架;中观技术层面:AI赋能展现数据知识脉络;微观数据层面:护航数据安全和数据质量。

  关键词:重特大事件档案   档案数据   资源整合

  重特大事件档案是党和国家组织应对自然灾害、事故灾难、公共卫生事件、社会安全事件等突发事件所形成的具有保存价值的历史记录。[1]在面临复杂多变的国际和国内环境中,各种“黑天鹅”“灰犀牛”事件发生频繁。近年来,我国重特大事件档案工作推进取得了较好成效,尤其是在应对处置新冠疫情、重大生产安全事故过程中,档案发挥了不可替代的作用,但实践中仍存在档案记录不完整、收集不齐全、保管不集中、利用不充分[2]等问题,尤其是档案数据缺乏有效整合,不利于跨部门之间的协作和未来的决策制定。妥善地收集、保存和有效利用重特大事件档案,对于汲取历史中的教训、提升面对风险和挑战的能力,以及推进国家治理体系和治理能力现代化均具有重要的作用。鉴于此背景,2022年12月,中办、国办联合发布了《关于加强重特大事件档案工作的通知》,明确提出了“建设重特大事件档案数据库”和“推动档案资源整合”的具体要求。

  目前,学界已在档案资源整合的政策法规[3]、模式构想[4]、体系建设[5]、案例分析[6]等几方面展开了探索,并且已经积累了一定的实践与理论成果。在实践方面,胡仁浩[7]、郑婷婷[8]、张梦[9]、归吉官[10]分别以川渝地区档案、海洋科技发展档案、红色文学档案、涉外民生档案为研究对象,探讨了档案资源整合的实践现状和价值意义。

  在理论研究方面,朱兰兰[11]、连志英[12]、陈慧[13]、陈海玉[14]分别以叙事理论、扎根理论、赋能思维理论、SOA理论为研究视角,针对档案资源整合中的具体问题进行了分析讨论并提出相应对策。但是,就目前的研究成果而言,在重特大事件档案数据资源整合理论探究方面还存在研究空白,缺乏系统性的研究成果。

  鉴于此,本文以重特大事件档案为研究对象,分析重特大事件档案数据整合的意义和障碍,提出实现路径,以期推进重特大事件档案数据资源整合的综合发展。

  一、重特大事件档案数据资源整合的意义

  根据档案数据内涵和资源整合相关概念,本文认为重特大事件档案数据资源整合是一个涉及收集、协调、处理和合并与重特大事件相关的多元化数据和档案信息的过程。这一过程遵循数据整合理论,旨在创建一个统一、综合的数据资源库,以便数据的存取、分析和应用。它包括对来自不同来源(如政府机关、救援组织、科研机构等)的数据进行清洗、结构化和标准化处理,以确保数据的一致性和可用性。整合的核心目标是提高数据的质量、完整性和可用性,为使用者提供一个易于访问的数据集成。这类数据的整合不仅增强了档案资源的深度应用,而且对于重特大事件及相关研究领域具有显著的实践意义。

  (一)助力决策参考和策略制定

  重特大事件档案数据资源的整合对未来决策的参考和策略的制定具有深远的意义,因为它为政策制定者和规划者提供了关键的历史数据,这些数据涵盖了历史上的各种重大事件、灾难响应、社会经济影响以及恢复和重建的过程。通过分析和整合这些信息,可以更准确地理解和预测未来可能发生的类似事件的模式和趋势,从而在制定长期的公共政策、应急响应计划、社会稳定和经济发展策略时,能够考虑到历史教训和成功案例。例如,在城市规划和基础设施建设方面,通过分析过去的灾害数据,可以更好地理解哪些区域更容易受到自然灾害的影响,从而在规划时加强这些区域的防灾措施;在经济政策制定方面,通过分析历史上经济危机的影响和恢复路径,可以更有效地制定应对未来经济波动的策略;在公共卫生领域,对过去重大疫情的数据整合和分析,可以帮助制定更有效的公共卫生政策和应急准备计划,以应对未来可能的公共卫生危机。

  此外,整合的数据资源还可以支持跨国界的合作和全球性问题的应对策略制定,如气候变化、环境保护和国际安全问题,因为这些问题往往需要基于历史数据和经验来制定全球性的长期应对策略。总之,重特大事件档案数据资源的整合不仅为政策制定者提供了一个更全面、更深入的历史视角和数据支持,也为制定面向未来的长期规划和策略提供了重要的基础,有助于提高这些规划和策略的有效性、预见性和适应性。

  (二)推进国家治理能力现代化

  重特大事件档案数据的整合对于推进国家治理能力的现代化具有深远的意义。在面对自然灾害、公共卫生危机、大规模事故等重特大事件时,一个国家的应对能力不仅取决于其物质资源和技术水平,更在于其信息管理和决策流程的效率。

  首先,重特大事件档案由于其自身特点,往往分散存放在不同部门之中,这种分散性对档案数据的快速检索与利用构成了一定的障碍。因此,通过对重特大事件档案数据整合,形成分类明确、主题划分清晰、层级结构合理的数据库或者平台,在未来重特大事件发生时,不需要从档案库房中调用档案,而是能够直接从数据库中查询档案信息,对于制定有效的应对策略、分配资源以及评估潜在风险有直接的帮助。

  其次,重特大事件档案数据整合有助于打破信息孤岛,促进政府内部及与公众、企业和其他非政府组织之间的信息共享。这种信息的互通不仅增强了政府部门间的协同工作,还支持不同主体之间的信息共享和协作,同时适应不同管理层级的需求,使得重特大事件档案能够跨层级、跨主题、跨地域利用。

  最后,整合重特大事件档案数据还能够提高档案管理的效率和准确性。通过数字化的方式存储和管理档案,可以减少人为错误,提升数据的准确性和安全性。同时,这种集中式的数据管理还有助于进行长期的数据分析和研究,为未来的事件预防和策略制定提供宝贵的历史数据和分析工具。综合来看,通过整合和挖掘重特大事件档案数据,能够使国家更加智能、科学地制定政策,提高危机管理水平,增加决策的透明度,从而有效推动国家治理能力的现代化。

  二、重特大事件档案数据资源整合的障碍

  重特大事件一般具备不可预测性、多变性和高风险性等特征,其档案数据价值珍贵,档案数据资源整合亦迫在眉睫。当前,重特大事件档案数据整合共享面临着政策缺失、技术壁垒和人才短缺等诸多障碍,数据安全、数据质量、数据孤岛、数据标准、数据伦理等问题普遍存在,给档案数据资源统筹、开发利用带来了巨大挑战。借鉴管理和组织理论,[15]本文从宏观、中观和微观三个层面深度剖析重特大事件档案数据整合面临的障碍。

  (一)宏观层面:政策法规与发展模式滞后

  档案学家谢伦伯格曾指出:“档案本质是一种经验,政府需要借鉴这些经验去制定政策,处理社会、经济以及组织、程序等方面的问题。”[16]截至2023年10月,我国已经制定了10部重特大事件档案管理的相关法规,170余件各省、区及地方性代表性政策,构成了一个相对完整的法规政策体系。但毋庸讳言,该体系各部分存在不协同和不完善的问题。

  首先,重特大事件档案数据整合通常需要跨部门和跨领域的协作,但通过考察发现,无论是作为国家法规的《中华人民共和国档案法》还是地方的下位法,都没有提供足够的框架和指导来促进这种协作。在没有明确法律框架的情况下,各部门会对法律责任和合规性问题持谨慎态度。同时,协作机制的不明确性可能会使不同部门和机构在协作过程中难以建立有效的沟通和协调。

  其次,《重大活动和突发事件档案管理办法》等相关法规政策没有明确规定执行机构的角色,这种不确定性可能导致职责重叠、职责界限模糊、责任推诿等问题。

  再者,现有的发展模式往往限制了数据资源的整合,这些限制可能来自技术、组织结构、政策法规等多个方面。我国的重特大事件档案管理发展模式以政府主导为基础,强调系统化、数字化和标准化的管理流程。这种发展模式可以确保档案管理遵循统一的标准和政策,有助于保持信息的完整性和安全性。但不得不承认,这种模式在快速响应技术变革和社会需求方面柔性不足,一定程度上限制了创新和灵活性。因此,为了提高重特大事件档案数据的利用效率,推动档案数据整合进程,需要在保持现有发展模式优势的基础上,积极寻求改进和创新。

  (二)中观层面:数据技术能力薄弱

  在中观层面,重特大事件档案数据资源整合面临的主要障碍之一是数据技术能力的薄弱。这种技术能力的不足表现在以下几个方面。

  一是重特大事件档案数据处理技术不足。重特大事件档案数据资源具有复杂性、多样性和异构性等特点,包含文本、图像和各种结构化、非结构化数据,其数据来源、格式和标准也各不相同。基础数据处理涵盖了从数据收集到初步处理的各个环节,处理能力的不足会直接影响到数据整合的质量和效率,进而影响数据分析和决策支持的有效性。

  二是重特大事件档案资源数据库开发能力欠缺。重特大事件档案数据库在未来危机应对中扮演着关键角色,《关于加强重特大事件档案工作的通知》中明确提出了“建设重特大事件档案数据库”的具体要求,然而数据库开发能力欠缺问题对实现这一要求构成了明显的障碍。开发能力欠缺包括技术型人才欠缺、档案管理人员信息分析和信息挖掘能力较弱、经费投入不足等,严重制约了重特大事件档案价值发挥与潜能释放。

  三是重特大事件档案数据共享平台欠缺。数据共享平台是档案机构在信息时代服务社会、展示工作成效和增强公共透明度的重要媒介。当前,我国各省市档案机构大部分建设了官方公众号平台和专题展览平台,但针对重特大事件这一特定领域的集中和系统化数据共享平台的建设仍属于起步阶段。构建高效、安全和易于访问的重特大事件档案数据共享平台对提高应急管理能力和决策的有效性至关重要,也对增强社会公共透明度和历史研究具有深远意义。

  (三)微观层面:数据资源问题突出

  从数据导向的微观层面看,重特大事件档案数据资源整合面临的挑战表现在多个维度。

  首先是数据标准化问题。一方面,不同的机构和部门在记录和存储档案数据时,往往采用各自的标准和格式,这种格式和标准的差异不仅限于数据的表现形式,也涉及元数据的不一致性,比如数据来源、创建时间等关键信息的记录方式不同。在自然灾害或大规模公共卫生事件中,不同部门或机构收集的数据可能因为格式不一致而难以有效融合,从而影响对事件的快速响应和决策制定。另一方面,随着新数据的不断涌入和标准的更新,持续的数据标准化工作是必要的,于是便需要一个有效的机制来定期更新和修订数据标准,以适应不断变化的需求。

  其次是数据安全问题。重特大事件档案数据安全问题呈现出多维度的复杂性,这一问题的核心在于如何平衡数据的可用性与保护敏感信息的需求。重特大事件档案数据通常涵盖广泛的个人和组织信息,包括但不限于个人身份细节、地理位置信息、健康记录以及政府和企业的敏感操作信息。这类数据由于其高度敏感性和重要性,成为网络攻击者的主要目标,增加了数据泄露的风险。

  最后是档案数据的权属问题。重特大事件如自然灾害、大规模事故或公共卫生事件,往往涉及广泛的社会层面和多个部门,如应急管理机构、卫生机构、档案机构等,这种情况下,每个机构或部门都可能对某部分数据持有所有权或至少拥有某种形式的使用权,这就会导致档案数据的权属边界不明确。

  三、重特大事件档案数据资源整合的路径

  (一)宏观政策层:完善政策法规框架

  政策指引和规划引领一直是推动我国档案事业向前发展的关键力量,完善重特大事件档案数据整合法规体系,是重特大事件档案管理的迫切需求。

  一是以法治为前提,提升下位法规政策与上位法规政策档案利用方面的协同性。以法治作为指导思想,意味着要建立一个全面、灵活且适应性强的法规框架。地方档案管理部门应当依据《中华人民共和国档案法》《关于加强重特大事件档案工作的通知》等国家法规重新审视本地关于档案事业的法规政策,设立重特大事件档案数据管理的专用章节,安排专用条款,确保从地方到中央在重特大事件档案数据管理和使用方面都遵循同一套标准和原则,确保档案数据的流通性和协同性。

  二是以善治为中心,进一步明确执行机构的角色定义。所谓善治,是指以向上向善的价值观念,高效、公正且可持续推动档案事业的协同共治,自主自治。上级立法机构和相关主管部门应当依法履行监管责任,及时响应档案事业发展的需求和变化,不断调整和优化档案数据管理的相关法律政策,及时识别和填补档案数据管理中执行机构明确的法律空白,确保法规政策能够全面、及时地覆盖重特大事件档案数据管理的各个方面,从而保证档案数据的高效、公正和可持续管理。

  三是以共治为抓手,智治为指引,优化重特大事件档案数据管理发展模式。一方面,重特大事件档案管理应加强完善社会协同机制,这意味着在档案数据管理过程中,不仅仅以政府机构为主导,还要更多地吸纳和融合社会力量协同参与。这种模式的优势在于能够集中更广泛的资源和专业知识,提高档案数据管理的全面性和多元性。另一方面,管理模式应从技术倒逼向主动变革转变。这一转变强调的是档案数据管理必须紧跟时代步伐,主动适应和引入新技术和新理念,而不仅仅是在外部环境变化时被动应对。智引的核心是顺应时代需求,利用智能化技术和信息化手段同时结合数据驱动的方法引导,优化档案数据管理和决策的过程。因此,在信息技术飞速发展的今天,各级档案机构应提升档案管理人员对新技术的理解和运用能力,主动探索,利用新技术提高重特大事件档案数据的质量和整合效率。

  (二)中观技术层:AI赋能展现数据知识脉络

  在人工智能(Artificial Intelligence,AI)发展引领新一轮产业技术变革的背景下,数据处理方法不断创新,处理效能也水涨船高。针对重特大事件档案数据资源分布异构、缺乏互操作性等问题,应当引进新技术、新方法,推动技术升级和AI赋能,让技术成为重特大事件档案数据资源整合的重要驱动力。

  首先,针对数据处理能力不足问题,可以通过引入高效的数据处理框架和平台来加强。例如,使用分布式计算技术,如Apache Hadoop[17]和Apache Spark[18]能够处理大规模数据集,同时提高处理速度和效率。此外,利用云计算服务,如Amazon Web Services[19](AWS)或Google Cloud Platform[20](GCP),能够提供可扩展的数据存储和计算资源,确保数据处理的弹性和可靠性。

  其次,针对数据异构性和缺乏互操作性的问题,可以采用先进的数据整合技术。例如,使用ETL(提取、转换、加载)工具和数据虚拟化技术,可以帮助整合来自不同来源的数据,并将它们转换为统一格式。同时,通过实施标准化的数据模型和接口,如使用JSON或XML格式,可以提高不同系统间的数据兼容性和互操作性。

  最后,针对重特大事件档案数据互联互通共享数据平台欠缺问题,采用关联数据和知识图谱等技术可有效展现数据的知识脉络,提升对复杂信息的理解和分析能力。知识图谱构建的核心在于从庞大且多样化的数据中识别关键实体(如人名、地点、事件等)和它们之间的关系,这包括但不限于因果关系、地理关系、时间序列等。通过这样的结构化表示,不仅能够将原本分散且难以关联的数据点转化为有意义的信息网络,还能够通过各种关系揭示数据背后的深层次联系和模式。此外,知识图谱和关联数据技术支持复杂的数据查询和分析,使得用户能够针对特定的问题或需求,从多个角度和层面对数据进行深入挖掘。例如,可以查询特定重大事件的影响范围、相关的人物和机构,或者分析特定时间段内的事件发展趋势。这种灵活性对于理解重特大事件的背景、影响和发展至关重要。通过AI赋能,可以有效地揭示重特大事件档案数据背后的知识脉络,为后续决策制定、科学研究和应急管理提供有力的支持。

  (三)微观数据层:护航数据安全和数据质量

  面对数字时代的变革与机遇,档案机构在大规模和多源的数据环境中,如何制定策略、进行决策和管理好档案数据成为解决重特大事件档案数据问题的关键。

  首先,数据标准化是至关重要的,它涉及将不同来源和格式的数据转换成统一的格式,以便后续的处理和分析。因此需要制定一套统一的数据标准,这包括确定数据格式、编码规则、命名约定和数据结构等。这些标准应当被组织内部所有相关部门和团队成员接受和遵守。

  其次,针对数据质量问题,应完善数据质量控制,包括数据清洗和数据验证。这些步骤确保了数据的可靠性和有效性。此外,强化数据存储和管理,使用高效的数据库系统和数据管理工具,如云存储和分布式数据库,不仅可以提高数据存储的效率和灵活性,还可以增强数据的安全性。针对数据安全问题,应建立严格的权限控制机制,确保只有经过授权的人员才能够访问和处理敏感数据,防范未授权的访问。同时,采用加密和脱敏技术,对重特大事件档案中的敏感信息进行保护,确保在数据的传输和存储过程中,即便被非法获取,也难以解读。此外,应建立完善的监测和审计机制,对数据访问和操作进行定期审查,及时发现潜在的安全风险。

  最后,针对档案数据权属问题,各部门应明确档案数据的所有权和使用权,对法律和政策全面审查,以确定档案数据受哪些法律和政策的约束。通过这些综合措施,可以有效地解决数据资源问题,提高数据处理和分析的效率和质量,支持更加精准和高效的决策制定。

  *本文系中国国家社会科学基金青年项目(项目编号:21CTQ028)“文化大数据背景下古村落多源异构档案的知识融合”的研究成果。

  注释及参考文献:

  [1]中共中央办公厅,国务院办公厅.中办国办印发《关于加强重特大事件档案工作的通知》[N].人民日报,2022-12-13(001).

  [2]中共中央办公厅,国务院办公厅.国家档案局负责人就《中共中央办公厅国务院办公厅关于加强重特大事件档案工作的通知》实施答记者问[N].中国档案报,2022-12-15(001).

  [3]姚明.我国重特大事件档案法规政策协同化研究[J].档案学研究,2023(4):40-46.

  [4]左娜,张卫东.面向数字人文的档案资源整合模式构想:解构与重组[J].档案学通讯,2020(3):29-37.

  [5]华林,杜仕若,邱雨辉.基于抗战记忆传承的南侨机工档案资源体系化建设研究[J].北京档案,2020(7):11-14.

  [6]方鸣,丁家友,裴洋.文旅融合背景下的档案信息资源整合研究——以苏州市为例[J].档案学通讯,2020(6):54-60.

  [7]胡仁浩.跨区域红色档案资源协作开发利用实践与研究——以川渝地区档案馆为例[J].档案学研究,2023(2):87-94.

  [8]郑婷婷,于小宁,陈旖旎.基于海洋科技发展的观测监测档案资源动态整合与利用探究[J].北京档案,2023(3):17-20.

  [9]张梦.红色文学档案资源整合与开发——以中国现代文学馆为例[J].中国档案,2023(3):40-41.

  [10]归吉官,农秀北.边境地区涉外民生档案资源整合机制创新研究[J].北京档案,2021(11):31-33.

  [11]朱兰兰,段燕鸽.叙事理论在红色档案资源开发中的应用——以大别山区为例[J].档案学研究,2023(2):95-102.

  [12]连志英.数字档案资源整合影响因素分析:基于建构型扎根理论的研究[J].档案学通讯,2015(6):52-56.

  [13]陈慧,王晓晓,南梦洁,等.数字档案资源整合与服务过程中的隐性知识分类——以赋能思维为视角[J].图书与情报,2019(6):118-124.

  [14]陈海玉,赵冉,万小玥,等.基于SOA的少数民族档案资源整合及实现路径研究[J].档案管理,2020(2):53-55.

  [15]POOLEMS,VAN DE VEN A H.Usingparadox to buildmanagement and organization theories[J].Academy of managementreview,1989,14(4):562-578.

  [16]谢伦伯格.现代档案——原则与技术[M].黄坤坊,译.北京:档案出版社,1983:15.

  [17]董新华,李瑞轩,周湾湾,等.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15.

  [18]杨珍珍,张坚君.基于Spark技术的高校校史编研系统研究与实现[J].浙江档案,2022(1):51-53.

  [19]马晓亭,陈臣.基于亚马逊AWS云服务的数字图书馆云计算基础设施构建[J].情报科学,2013,31(1):46-51.

  [20]徐泉,王良勇,刘长鑫.工业云应用与技术综述[J].计算机集成制造系统,2018,24(8):1887-1901.

  作者单位:中国人民大学信息资源管理学院