发布时间:2024-12-09 08:28:51被阅览数:249 次信息来源:《山西档案》
作者:徐新韵
摘要:中国古代档案文献蕴含着丰富的历史信息和文化价值,是研究古代社会的重要史料。但受制于历史和技术等因素,其整理、数字化和知识化水平亟待提升。立足新时代背景,从多维评估、技术融合、协同创新等角度探索中国古代档案文献整理的现代化方法,提出了元数据驱动、本体构建、众创众包等数字化策略,并从语义标注、知识关联等层面探讨了古代档案文献知识化的实现路径。研究指出,统筹规划、协同推进档案整理数字化、知识化工作,对于充分释放中国古代档案文献在数字时代的价值具有重要意义。
关键词:古代档案文献;档案整理;档案数字化;档案知识化;创新转化
中国古代档案文献是中华民族宝贵的文化遗产,记录了古代社会政治、经济、文化等诸多领域的珍贵信息,是研究古代历史、传承中华文明的重要载体。但长期以来,受限于历史久远、载体脆弱、管理条件有限等因素,这些珍贵的古代档案文献大多处于封存、散佚状态,其整理、保护和利用水平远滞后于当今时代的发展需求。
随着信息技术的飞速发展,数字化、网络化、智能化已成为档案文献管理的大势所趋。《“十四五”全国档案事业发展规划》提出了档案信息化的发展目标:“档案信息化发展保障机制进一步完善,档案信息化建设进一步融入数字中国建设,新一代信息技术在档案工作中的应用更为广泛,信息化与档案事业各项工作深度融合,档案管理数字化、智能化水平得到提升,档案工作基本实现数字转型。”如何创新理念、完善机制、积极采用现代技术,破解制约古代档案文献整理与利用的瓶颈,实现传统档案文化资源与现代信息环境的有机融合,充分彰显古代档案的当代价值,是新时期档案工作者面临的重大课题。
本文拟站在新的历史起点,在梳理古代档案整理传统方法的基础上,以信息技术为牵引,以需求为导向,从整理、数字化、知识化三个维度系统探讨中国古代档案文献的现代化发展策略。力求形成一个传统与现代交融、基础与应用并重的中国古代档案文献开发利用理论框架,为破解古代档案文献管理困局、推动中华优秀传统文化传承发展贡献绵薄之力。
1 中国古代档案文献整理的现代化方法
1.1 多维评估:中国古代档案文献整理的新思路
传统的档案文献价值评估主要基于档案的历史和文化价值,忽视了档案文献在其他领域的应用潜力。多维评估则从历史价值、艺术价值、现实意义等多个维度[1],全面评判档案文献的研究利用价值。通过建立综合历史价值、技术价值、现实价值等多维考量的评估指标体系,档案工作者可以结合历史学、文献学、艺术学、档案学、文学和音乐学等多个学科领域的专家意见,甄别整理优先次序,在高质量完成抢救性整理的基础上,统筹兼顾、循序渐进,逐步实现对中国古代档案文献的系统整理。多维评估有助于克服档案文献整理的随意性和片面性,提高中国古代档案文献整理工作的科学性和有效性。
1.2 技术融合:中国古代档案文献整理的新方法
随着现代科技的飞速发展,大量新技术在档案文献整理领域得到应用。将传统整理方法与现代科技手段相结合,可以有效提升中国古代档案文献整理效率和质量。例如,采用多光谱扫描、高清摄影等先进技术,可以对脆弱、易损的档案文献进行无损采集;运用大数据分析、模式识别等技术,能够辅助档案文献的鉴定、著录、编目等工作;通过区块链、云存储等手段,则可强化档案文献整理全过程的安全管控。
技术融合并非简单的技术堆砌,而应遵循适用性、经济性、安全性的基本原则。要根据中国古代档案文献的特点和整理需求,选择适合的技术手段,避免盲目追求高精尖技术而忽视实际效果;要充分考虑技术应用的成本效益,在保证整理质量的同时,注重投入产出比;要高度重视技术应用的安全风险,完善各项保障措施,确保档案文献的真实性、完整性、可靠性。
1.3 协同创新:中国古代档案文献整理的新机制
中国古代档案文献整理是一项系统工程,需要多学科、跨部门的通力合作。构建“政府主导、档案部门牵头、业界力量参与”的多方协同机制,汇聚整理合力,实现优势互补。政府主导有利于整合资源、提供政策支持,为中国古代档案文献整理营造良好的制度环境;档案部门作为业务主管部门,要发挥组织协调作用,统筹各方力量;高校、科研机构则应发挥自身的学术优势,为中国古代档案文献整理提供人才与技术支撑;社会组织、民间藏家等社会力量的参与,有助于拓宽档案文献征集渠道、丰富整理视角。鼓励跨学科、跨部门的协同创新,有利于推动中国古代档案文献整理从“单打独斗”走向“协同创新”,不断开创档案文献整理的新局面。
协同创新的关键在于构建科学的利益共享机制,要在尊重各方诉求的基础上,合理分配任务、细化责任规定,形成风险共担、利益均沾的合作共识;要搭建开放、平等、互信的交流合作平台,畅通信息共享、资源互换的渠道;要建立科学的绩效评价体系,合理评定各方贡献,激发协同创新的内生动力。
2 中国古代档案文献的数字化策略选择
2.1 基于元数据的古代档案文献数字化
元数据驱动策略是以元数据为核心,贯穿古代档案文献数字化全过程的一种策略。元数据是描述档案文献数字对象属性、特征、内容的结构化数据,是实现档案文献数字化资源组织、管理、检索、利用的基础。元数据驱动策略要求在档案文献数字化之初,即着手元数据的提取和标引工作,通过元数据标准的规范应用,实现对档案文献的深度描述。在档案数字化过程中,要以元数据为引领,优化工作流程,提高数字化效率。数字化初步完成后,还要不断丰富和完善元数据,为档案文献的管理与服务提供支撑。元数据驱动策略有利于提升古代档案文献数字化的规范性、一致性,便于实现跨平台、跨系统的数据交换与共享,是一种科学、先进的数字化策略选择。
元数据驱动策略的关键在于选择合适的元数据标准。目前,国内外已发布了一系列档案文献元数据标准,规定了档案文献元数据的核心要素和描述规则,为中国古代档案文献元数据的提取与表示提供了重要依据。但是,这些标准大多是针对现代档案文献而制定的,对古代档案文献的特殊性考虑不足。因此,在借鉴既有标准的基础上,还应充分吸收古代文献著录、版本目录等方面的研究成果,形成既符合档案文献元数据通用规范,又能反映古代档案文献特色的元数据标准体系。
2.2 基于本体构建的古代档案文献数字化
本体构建策略是以本体为基础,促进中国古代档案文献数字化资源语义关联与知识发现的一种策略。本体是对特定领域知识的形式化描述,由概念、属性、关系等基本要素组成。将本体理论引入中国古代档案文献数字化领域,可以有效解决档案文献知识组织的深层次问题。本体构建策略要求在档案文献数字化过程中,遵循本体构建的基本方法,抽取档案文献蕴含的核心概念,刻画概念间的内在联系,形成兼具逻辑严密性与语义丰富性的档案文献本体。基于本体,可以实现档案文献及相关知识的语义关联、智能检索与链接推荐等功能,大幅提升档案文献数字化成果的应用价值。本体构建策略代表了一种语义驱动的数字化理念,为古代档案文献数字化拓展了新的思路。
构建古代档案文献本体,要立足古代档案文献的特点,兼顾档案学、历史学、语言学、文学和音乐学等多学科视角。一方面,要从宏观层面厘清古代档案文献的门类、体裁、版本等基本概念及其关联,构建顶层本体;另一方面,要从微观层面挖掘档案文献所记载的人、事、物、地、文、乐等要素,构建需求本体。两个层面相互依存,缺一不可。同时,基于古代汉语的特点,要重视概念词的歧义消解、词形和词义的映射等问题。此外,古代档案文献本体的构建应吸收已有的档案本体、文献本体的研究成果,既立足古代档案的特色,又遵循本体构建的一般规律。可以预见,随着语义网、知识图谱等技术的进一步发展,以本体为基础的档案文献数字化策略必将释放出越来越大的潜力。
2.3 基于众创众包的古代档案文献数字化
众创众包策略是将内部员工或外部承包商所做的工作外包给一个大型的、没有清晰边界的群体。在档案文献数字化领域则体现为发挥大众力量,促进中国古代档案文献的数字化、社会化生产。数字时代,大众参与档案文献数字化的意愿日益高涨。从古籍的众包翻录到珍贵档案的网络众筹,大众参与正成为档案文献数字化的强大力量。众创众包策略就是要最大限度地汇聚社会资源,引导大众参与档案文献数字化的各个环节[2]。在古籍档案文献数字化过程中,可采取分包、外包等灵活方式,凝聚社会各界的力量;数字化平台的建设要遵循开放、共享的理念,为大众参与提供便利;要创新激励机制,调动大众参与档案文献数字化的积极性。众创众包策略顺应了档案文献数字化、社会化生产的趋势,有利于构建开放、协同、高效的数字化生态,是古代档案文献数字化的重要策略选择。
同时,众创众包策略的实施要处理好专业性与大众性的关系。一方面,古代档案文献数字化对参与者的专业素养提出了较高要求,需要档案学、古文字学、历史学、文学和音乐学等领域的专业人员提供指导;另一方面,大众参与是众创众包的关键,要最大程度地降低参与门槛,提供必要的培训和支持,做到专家引领与大众参与的有机结合。同时,还要重视古代档案文献数字化成果的质量控制与审核,建立严格规范的校验机制,确保成果的专业性与准确性。
3 中国古代档案文献的知识化实现路径
3.1 基于语义标注的档案文献知识化路径
基于语义标注的知识化路径,是一种自底向上、由数据到知识的方法[3]。其关键在于构建适用于中国古代档案文献的语义标注规范和工具,组织专业力量进行系统、精细的语义标注,提炼、凝练档案文献所蕴含的核心概念、关键实体、重要关系等知识要素,形成规范化的标注语料库和知识库。在标注规范方面,要充分借鉴现代语义标注理论,吸收中国古代文献研究的传统方法,形成一套切合中国古代档案文献特点的标注原则、方法和规则,夯实语义标注的方法论基础。在标注工具方面,要发挥计算机科学与古文献研究的交叉优势,充分利用自然语言处理、机器学习等技术,针对古代汉语的特点,研发词法分析、词性标注、命名实体识别、句法分析等自动或半自动工具,提高语义标注的效率和准确率。在标注实施方面,要组织训练有素的专业团队,严格按照标注规范,对选定的古代档案文献进行系统、精细的语义标注,力求词义明晰、句法准确、逻辑严密,形成高质量的标注语料库。在此基础上,进一步归纳标注语料,凝练知识元,建立概念词表、实体库、关系库,用结构化的形式呈现中国古代档案文献的知识要素。
3.2 基于知识关联的档案文献知识化路径
基于知识关联的知识化路径,是一种自顶向下、由知识到应用的方法。其核心在于设计知识关联模型,建立档案文献知识库,实现知识要素的关联、融合,形成反映档案知识网络结构的知识图谱,进而支撑智能化应用与服务[4]。在知识库构建方面,要在语义标注形成的概念、实体、关系等知识元的基础上,进一步梳理、优化知识元的逻辑结构,明确核心概念之间、概念与实体之间、实体与实体之间的关系类型,并引入档案业务数据(如全宗表、门类表等)、相关学科(如历史地理、政治制度、社会经文学艺术等)知识,融合多源知识,最终建成内容丰富、结构合理、语义明晰的中国古代档案文献知识库。在知识关联建模方面,要在档案学、历史学、文学、音乐学和计算机科学等多学科理论的指导下,借鉴通用知识图谱的设计方法,构建适用于古代档案文献的知识关联模型,建立概念—概念、概念—实体、实体—实体、实体—关系等知识链接,形成知识关联的基本框架。在图谱构建方面,要依据关联模型,选择合适的知识关联算法,如基于统计的共现算法、基于规则的逻辑推理算法等,实现知识库中概念、实体、关系等知识要素的自动链接、聚类、推理,逐步构建起反映古代档案文献知识结构网络的知识图谱。在智能应用方面,要充分利用已建成的知识图谱,围绕档案管理、档案利用等核心业务需求,研发智能检索、知识问答、辅助编目、智能阅读等系列知识服务,创新档案文献的管理与利用方式,实现从档案到知识、从知识到智慧的跃迁。
参考文献
[1]赵彦昌,姜珊.问题与方法:清代司法档案整理与法律史研究的双向互动[J].档案学研究,2022(5):142-148.
[2]宋帆帆,苏君华.数智驱动下档案公共服务价值共创:价值、模式与路径[J].档案学研究,2024(2):30-37.
[3]牛力,袁亚月,韩小汀.对档案信息知识化利用的几点思考[J].档案学研究,2017(3):26-33.
[4]陈雨.数字人文视域下科技名人档案知识化开发探析[J].档案学研究,2023(4):99-107.
【基金项目】广东省2024年度教育科学规划课题(高等教育专项) “‘文学+音乐+粤港澳文化旅游’产教融合创新人才培养模式研究” (项目编号:2024GXJK261 )。
【作者简介】徐新韵(1976—),女,汉族,安徽蚌埠人,星海音乐学院教授,博士,研究方向:中国古代文学、中国文史。