档案数据资源化的关键环节、实现路径与效能评估研究

发布时间:2024-12-23 08:28:33被阅览数:370 次信息来源:《山西档案》

  作者:马银花

  摘要:大数据时代,数据日益成为推动国家治理体系和治理能力现代化的战略资源。档案数据资源作为重要的数字资产,在服务社会经济发展、促进国家治理能力现代化中肩负着重要使命。在梳理档案数据资源化研究现状的基础上,围绕档案数据资源化的关键环节、实现路径、效能评估等问题展开系统探讨,旨在为新时代背景下推进档案数据资源整合共享、释放档案数据价值潜能提供理论支撑和实践指引。

  关键词: 档案数据;数据资源化;知识关联;数据治理;效能评估

  随着大数据时代的到来,数据资源已上升为国家基础性战略资源,数据要素正加速向经济社会各领域渗透,成为数字经济发展的关键驱动力。党的二十大报告中指出,要坚持和完善中国特色社会主义制度,推进国家治理体系和治理能力现代化,推进数字化进程,提高治理效能,这为新时代档案事业高质量发展指明了方向。作为国家重要的信息资源,档案数据蕴藏着巨大的历史价值、现实价值和未来价值,是国家数字治理的基础性战略资源。《“十四五”全国档案事业发展规划》也明确提出,要积极推进档案数据治理体系和治理能力现代化,加大档案数据资源整合力度,强化数字技术赋能作用,推进档案事业的创新发展,为新时代档案数据资源化建设指明了工作重点。

  当前,国内外学界针对档案数据资源化开展了一系列卓有成效的理论和实践探索。在理论研究方面,学者们从国家战略、治理变革、技术赋能等角度,深入阐释了大数据时代档案数据资源建设的重要意义。有学者认为,档案数据资源建设要以国家治理和社会治理的现代化需求为导向,以服务型政府和服务型社会建设为目标,构建集约、高效、协同、共享的档案数据资源体系,为社会主义现代化建设提供有力支撑[1]。在实践探索方面,各级各类的档案部门都在积极开展档案数据资源整合工作,加强档案数据标准化建设和数字化转化,搭建档案数据资源共享平台,推动优质档案数据资源的汇聚共享和创新应用[2]。

  尽管如此,当前档案数据资源建设实践方面仍面临着一系列挑战,如档案数据资源碎片化、顶层设计和制度规范尚未完善、新型技术与档案业务融合不充分、资源开放共享的广度和深度不够等。鉴于此,本文拟在梳理国内外研究现状的基础上,重点探讨档案数据资源化的内涵及其关键环节,总结国内外档案数据资源化建设的实践经验,探讨构建科学合理的档案数据资源化绩效评估指标体系,进而提出推动档案数据资源化效能提升的策略及建议。本研究旨在为新时代背景下推进档案数据资源整合共享、释放档案数据价值潜能提供理论支撑和实践指导。

  1  档案数据资源化的关键环节

  1.1  数据采集与整合:夯实档案数据资源化基础

  数据采集与整合是档案数据资源化的基础性工作,直接关系到档案数据资源的规模、质量和后续应用潜力。就数据采集而言,需要从档案数字化、业务信息系统集成归档、重点领域档案数据专项采集等多元渠道出发,全面采集反映不同历史时期、不同行业领域的原生性档案数据资源。在此基础上,还需加强档案数据标准化治理,对异构分散的档案数据进行清洗、比对、关联、融合,不断提高档案数据资源的广度、深度和关联度。以财务数据源为例,除了需要采集结果数据,还需要采集交易数据、过程数据、行为数据、环境数据等,实现对这些数据全方位的采集汇聚,有助于支持和驱动财务部门人员发挥经营管理、价值创造的职能。同时,档案部门要主动适应电子政务、智慧城市的发展需求,与数据主管部门加强工作协同,建立常态化的档案数据资源采集与交换机制,实现档案数据资源的应归尽归、应收尽收、应管尽管[3]。

  1.2  知识关联与挖掘:拓展档案数据资源化深度

  档案数据的知识关联与挖掘在档案数据资源化过程中起到价值提升的作用。具体而言,应从以下三个方面着力:一是利用语义分析、知识抽取等技术,揭示档案数据资源的内在语义结构,形成档案主题、人物、事件、地点等维度的知识要素;二是运用知识图谱、链接数据等技术,构建多层级、多维度的档案知识关联网络,形成跨库、跨域、跨层级的知识化档案数据资源体系;三是针对档案大数据的特点,研发基于内容分析、关联推理、智能搜索的档案知识挖掘利用模型,不断提升档案知识服务的精准度和智能化水平。从总体上看,通过语义关联与知识挖掘等环节,使档案数据资源不再只是简单的原始记录,而是承载着丰富语义背景、内在逻辑关联的知识单元。

  1.3  开放共享与利用:拓宽档案数据资源化应用

  开放共享与创新利用是档案数据资源化的最终目标和价值体现。当前,各级档案部门应顺应数字政府、数字社会发展大势,统筹推进档案数字资源的开放共享与创新利用。一方面,要加快构建统一规范的档案数据开放技术标准规范,研发一体化的档案数据共享交换平台,打通档案与政务、民生、文化等领域数据的联通渠道。另一方面,要创新拓展档案数据的应用场景和模式。例如,建设面向党史、文博、红色旅游等主题类的新型档案智库,开发出融合VR、AR、人机交互技术的沉浸式档案展示系统,进而推动档案知识嵌入政务决策、智慧服务、精准治理等数字场景。通过拓宽档案数据资源开放共享渠道,创新档案数据的应用场景和模式,不断放大档案数据资源效能,让档案大数据在服务国家治理、经济发展、民生改善中发挥更大的作用[4]。

  2  档案数据资源化的实现路径研究

  2.1 基于统一标准规范的档案元数据构建

  科学构建统一规范的档案元数据标准体系,是实现档案数据资源全生命周期管理、异构数据互联互通的关键所在。从国际档案界的实践来看,制定系统全面的档案元数据标准规范已成为共识。例如,ISO  23081元数据标准为档案元数据的功能要求、概念模型提供了框架性指南;RiC档案著录标准则进一步细化了档案实体及其关系类型的元数据项。纵观国内档案部门,在档案著录、编目方面已形成较为成熟的国家标准和行业规范,但在档案元数据构建方面尚处于起步阶段,亟须建立统一协调的顶层架构。具体而言,构建面向数据资源化的档案元数据标准规范,需要在吸收借鉴国际标准的基础上,立足我国档案事业的实际发展需求,兼顾数据标准的前瞻性、开放性和实用性。

  2.2 面向异构数据整合的知识关联网络构建

  大数据时代,各类档案数据资源呈现出数量多、类型广、来源杂的特点,其中蕴含着丰富的内在语义联系。运用知识图谱等语义关联技术,深度挖掘档案数据的内在联系,构建档案知识关联网络,是破解档案“数据孤岛”问题、实现异构档案数据资源整合的有效途径。当前,面向档案领域的知识图谱研究与应用已成为学界关注的重点。国内外研究者普遍认为,知识图谱在表达复杂语义关系、交互式检索、智能推理决策等方面具有独特优势,为档案数据资源的关联发现和融合利用提供了新思路、新方法。通过构建档案知识关联网络,将分散在不同系统、不同门类中的档案数据转化为可供智能检索、关联分析的知识,进而嵌入到智慧决策、精准服务等应用场景中,让档案在服务党和国家事业发展大局、推动社会治理创新中发挥更大的作用。

  2.3 聚焦“数智融合”的档案数据治理体系建设

  随着大数据、人工智能、区块链等新兴技术与档案业务的加速融合,以数据为核心、数智融合的档案治理体系正在加速形成。推动档案与数据深度融合,既是顺应技术革命、产业变革的必然要求,又是提升档案治理效能、实现高质量发展的必由之路。围绕档案资源的数智融合,各级档案部门需要打破思维定势,创新工作模式,系统构建适应数字时代特点的档案数据治理体系。具体而言,要强化数据赋能意识,充分运用大数据、云计算、知识图谱等新技术,革新档案收集、整理、编目、检索等业务流程,实现档案管理由经验型向数据驱动型转变。同时,要完善数据安全保障体系,健全档案数据分级分类管理制度,加强档案数据全生命周期安全防护,筑牢档案数据安全底线。以会计档案为例,在大数据环境下,会计电子档案管理仍然存在多元风险,应该从计算机系统、电子数据和人为管理等多个维度构建安全体系,消除系统漏洞,杜绝安全隐患。

  2.4 突出主体协同的档案数据资源共享服务平台建设

  档案数据资源共享利用是检验档案现代化水平的重要标尺。档案工作必须主动融入政府数据开放共享大格局中,创新完善档案数据资源共享服务模式,实现档案数据资源“应共尽共、应用尽用”。在此背景下,加快建设统一规范、互联互通、开放兼容的档案数据资源共享服务平台,打通档案与政府、社会各界的沟通渠道,释放档案大数据效能,成为新时代档案发展的必然选择。当前,推进档案数据资源共享平台建设,需要在顶层设计和多元主体协同上下功夫。通过加强统筹规划,制定国家、省、市、县各级档案数据资源共享平台建设指南,明确基础支撑、数据标准、功能架构、安全保障等关键要素,形成上下联动、有序推进的工作格局。

  3  档案数据资源化的效能评估体系构建

  3.1 档案数据资源化效能评估的重要意义

  档案数据资源化涉及档案管理、信息技术、资源开发等多个方面,通过科学评估档案数据资源化效能,能够准确把握工作成效、找准问题短板、优化实施路径,进而推动档案数据资源化水平的整体提升。首先,通过构建科学规范的评估指标,动态评估档案数据资源的开发利用效果,既能形成工作抓手,引导档案部门聚焦数据资源这一中心任务,又能倒逼档案管理流程再造、管理机制优化,推动形成档案数据资源化良性发展格局。其次,科学评估档案数据治理成效,有助于系统审视数据标准规范体系完备程度、数据关联融合水平、数据安全防护能力以及数据服务效能,找准薄弱环节,采取有针对性的改进措施,持续提升档案数据治理的精细化、智能化水平。此外,构建多维度、全方位的档案数据资源化效能评估体系,有利于厘清档案大数据应用短板,不断创新应用场景、优化应用模式、拓展应用领域,充分释放档案数据资源效能。

  3.2 档案数据资源化效能评估指标体系设计

  科学设计档案数据资源化效能评估指标,是开展效能评估的基础。国内学者普遍认为,档案数据资源化效能评估应立足数据全生命周期视角,兼顾数据汇聚、治理、开发、利用、安全等关键环节,构建多层次、多维度、全覆盖的指标体系[5]。因此,在结合已有研究的基础上,本文拟从以下四个维度设计档案数据资源化效能评估指标:

  一是档案数据资源建设指标。该指标主要评估各类档案数据资源的数量规模、采集范围、来源渠道、数据质量、元数据覆盖率、数据标准规范程度等,考察档案数据资源基础建设是否充实完备、结构是否合理等。

  二是档案数据资源整合指标。该指标重点评估档案数据共享交换、关联融合、集成利用的情况,涵盖了档案数据共享率、异构数据映射率、数据关联度、主题数据库建设数量与质量、跨层级档案数据整合度等信息,从而能够反映出破除档案“数据孤岛”、实现“聚通用”的效果。

  三是档案数据资源开发指标。该指标聚焦档案数据资源的增值利用,从档案数据挖掘、知识化、智能化应用等方面,设计出档案知识库建设质量、知识问答准确率、档案大数据分析模型应用数量、面向政务服务的档案数据主题应用数量等指标,评估档案数据资源的深加工、高效能利用水平。

  四是档案数据资源效益指标。该指标主要评估档案数据资源开发利用的社会效益、经济效益、文化效益、生态效益,涵盖档案数据服务对象覆盖面、档案大数据对政府决策的支撑度、档案主题展览点击量、档案开放日活动参与度,以及档案信息挖掘成果转化率等指标,多角度反映数据红利的释放情况。

  3.3 档案数据资源化效能提升策略

  科学评估只是手段,提升档案数据资源化效能才是目的。各级档案部门要以评估为契机,针对评估中发现的问题,及时采取措施加以改进,在数据汇聚、治理、流通、应用等环节持续用力,多管齐下,全面提升档案数据资源化发展水平。具体而言,首先,要强化档案数据资源建设,系统梳理档案工作各环节形成的数据,拓展档案数据的覆盖范围和采集深度,并加强档案数据标准化建设,真正做到档案应归尽归。以会计档案为例,为发挥其优势和经济价值,应在资金上给予大力扶持,并配备专业的计算机硬件、软件设备和内存空间较大的高端服务器,保证采集工作的提质增效。其次,要充分释放档案能量,以需求为牵引,以应用为导向,不断创新档案大数据应用场景,推动档案数据嵌入社会经济运行的各个环节,服务国家治理体系和治理能力现代化。例如,聚焦服务政府科学决策,加快建设集中统一的政务档案专题数据库,为政府部署重大决策、实施政策制定等提供数据参考和情报支撑;针对文化传承创新需求,开发红色档案、文化遗产档案、名人档案等特色档案资源,讲好中国故事,传承中华文脉。

  参考文献

  [1]杨杰,马海群,邹纯龙.档案数据敏捷治理体系研究[J].山西档案,2024(1):25-32.

  [2]苏会灵.档案数据要素流通的关键问题与对策研究[J].山西档案,2024(2):62-64.

  [3]孙大东,向晓旭.新《档案法》规制下非遗档案数据化管理策略研究[J].山西档案,2021(6):90-97.

  [4]袁蕾涵,任越.新质生产力赋能档案公共服务高质量发展的价值意蕴与实践构想[J].山西档案,2024(3):19-24,32.

  [5]单思远,杨雪.高校档案资源平台评价指标体系的构建与实证研究[J].山西档案,2022(6):118-125,107.

  【作者简介】马银花(1981—),女,汉族,新疆阿克苏人,阿克苏职业技术学院副教授,学士,研究方向:大数据与会计。