数字人文视角下基于CBDB的宋元时期研究题域与价值分析

发布时间:2024-12-09 08:23:28被阅览数:197 次信息来源:《山西档案》

  作者:徐桂彬

  摘要:近年来,数字人文的兴起为传统历史研究领域带来了新的机遇与挑战。以哈佛大学等主持开发的CBDB为研究对象,通过对CBDB的统计与内容分析,系统梳理了其收录宋元时期数据的来源、类型、数量等基本情况。在此基础上,进一步归纳了CBDB对宋元时期政治、经济、文化、社会等诸领域研究的潜在价值。通过厘清基于CBDB的宋元时期研究题域,旨在探讨其学术价值与应用前景,以期为推进中国古代史研究领域的数字人文实践提供参考和借鉴。

  关键词:数字人文;CBDB;宋元时期;人物传记;历史研究

  “数字人文”的出现标志着社会科学与人文研究领域正迎来信息技术革命的新时代。随着各领域历史人文数据资源的逐步信息化与数字化,借助新一代信息技术手段实现数据的规模化组织、关联与挖掘,进而推动传统人文学术研究的转型与深化,已成为学界的热点议题。自党的十八大以来,以信息化建设和大数据战略为引领,国家不断推进社会各领域的数字化转型,尤其是在历史文献资源数字化方面,实施了如“中华古籍保护计划”等一系列重大战略举措,并发布了《关于推进新时代古籍工作的意见》等文件,为历史人文研究奠定了前所未有的数据基础、提供了有力的政策保障。

  当前,国内外学界在文史领域大型数据库的开发与应用上进行了诸多积极探索。哈佛大学费正清中国研究中心、北京大学中国古代史研究中心、台湾“中研院”历史语言研究所共同主持开发的“中国历代人物传记数据库(China Biographical  Database  Project,简称CBDB)”便是其中的佼佼者。该数据库广泛收录正史列传、地方志、文集、笔记等史料,其中以唐、宋、明、清的人物传记资料最为充实,可精细化提取人物的籍贯、亲属、师友、著述等结构化信息,是开展中国中古社会史研究的重要工具。围绕CBDB,学界已产生了一系列有影响力的研究成果,如有学者[1]利用CBDB对唐宋时期政治精英的社会流动进行研究,探讨了南宋士人的社会网络关系,并进行可视化分析等;还有学者[2]依托CBDB和古籍文献进行数据采集,构建了明清时期进士家族的人物关系网络,绘制了进士家族的世系图谱。然而,目前基于CBDB的研究多聚焦于单一时段或特定群体,尚缺乏宏观的主题领域梳理。目前,CBDB收录数据已进一步扩充至更多朝代,不仅拓展了研究视野,而且有助于深入把握中国中古社会历史发展的连续性与变迁。

  基于此,本文拟从数字人文的视角,对CBDB中现存的数据开展系统的梳理,并围绕以下问题展开研究:第一,CBDB在宋元时期的研究中具有怎样的数据优势与特点?第二,依托CBDB可对宋元时期展开哪些主题领域的研究?第三,基于CBDB的研究对深化宋元历史的认识有何学术价值?本文将详细梳理CBDB收录宋元时期数据的来源、类型、数量等基本情况,并总结其对宋元时期政治、经济、文化、社会等诸领域研究的潜在价值。研究结果表明,CBDB在数据规模、关联深度与广度等方面具有显著优势,已成为宋元时期人物传记、社会网络、政治制度等领域研究的重要数据支撑。尤其值得关注的是,基于CBDB的研究通过定性分析与定量分析相结合的方法,为传统历史学研究开辟了新视角、新路径,对相关学术话语体系产生了革新性影响。此外,CBDB为跨时空的数据融合与比较研究提供了范式,有望推动中国历史学研究实现数字化转型,进一步促进历史档案的数字化进程与学术价值的开发。

  1  CBDB的数据来源、质量与特点分析

  1.1 CBDB 数据的主要来源、类型与规模

  CBDB项目最初由哈佛大学教授郝若贝(Robert  M.Hartwell)发起,现由哈佛大学、台湾“中央研究院”与北京大学共同主持,是当前全球范围内系统性收集中国历史上所有重要人物传记资料的关系型数据库。截至2024年2月,数据库已收录约535  181人的传记资料,这些人物主要出自7世纪至19世纪。该数据库除了可作为人物研究的参考资料外,亦可用于地理空间分析与社会网络的分析。从数据来源看,CBDB主要依托于正史列传、地方志、家谱、文集、笔记等多种类型的文献史料。就宋元时期而言,除正史外,地方志与文集是重要的数据来源。从数据类型看,CBDB着重提取人物的籍贯、亲属关系、社会关系、仕履、著述等结构化信息,形成了一个以人物为中心、多实体关联的数据网络。

  1.2 CBDB 数据质量评估与特点分析

  CBDB采用包括人工标注和自然语言处理在内的多种方法,持续优化其数据质量。一方面,CBDB团队邀请相关领域的专家参与数据标注与审核工作,从源头上把控数据的准确性。另一方面,随着数据规模不断扩大,CBDB引入先进的机器学习算法,以提高人名消歧与关系抽取的效率。总体而言,CBDB在数据覆盖的广度与关联的深度上展现出明显的优势。从横向角度看,CBDB收录的唐宋人物地域分布广泛,不仅涵盖了中原地区,还涉及岭南、四川等偏远地区;从纵向角度看,人物之间的亲属、师友、仕宦关系错综复杂,这在一定程度上还原了当时官僚群体的社会网络结构。当然,CBDB也存在一些局限,如对下层民众的记录相对较少,文献来源仍有待进一步扩充。此外,由于古代文献体例的差异,不同时期的人物信息密度与关联广度存在差异,如宋代的信息多于元代,这可能会影响数据实证研究的可比性。

  1.3 CBDB 在宋元时期研究中的优势与局限

  CBDB在宋元史研究中具有独特的优势。具体来说,首先该数据库拥有海量的结构化数据,为定量研究提供了坚实基础。其次,通过关联人物的多维属性,有助于厘清错综复杂的社会网络关系。同时,CBDB所提供的地理信息编码支持时空分析,能够清晰地呈现历史动态演进的过程。因此,CBDB为传统历史研究引入新视角、新方法的同时也推动了相关研究领域的发展。例如,在政治史方面,可利用CBDB分析宋元精英的地域流动与婚姻网络,从而深入考察路径依赖对其仕途的影响。而在社会史方面,CBDB则成为探究不同时空背景下官僚群体结构特征与士人交游圈[3]的重要工具。当前,CBDB在宋史研究中的应用较为深入,广泛涉及政治、社会、文化、区域发展等多个主题,并取得了丰硕的研究成果。相比之下,CBDB在元史研究中的应用尚显薄弱,这主要受限于元代文献材料的散佚。然而,通过深度挖掘现存文献,拓展CBDB元代人物的信息,将有助于系统比较宋元时期人物关系的延续与变迁。

  2  基于CBDB的宋元时期研究题域分析

  2.1 人物传记与社会关系

  CBDB以人物传记信息为核心,极大地促进了宋元时期人物研究的发展。一方面,CBDB提供了系统的人物检索途径,用户可根据姓名、字号、籍贯、官职等维度查询目标人物的信息;另一方面,CBDB通过编码人物之间的亲属、师友、同僚等关系,可构建一个详尽的人际关系网络图谱。基于这一图谱,学者们对宋元士人群体的家族世系、婚姻关系、社会交往等方面展开了深入的探讨。例如,有学者利用CBDB分析了北宋官僚家族士大夫的婚姻网络空间分布,发现其呈现以开封为中心的“中心—边缘”结构;也有学者考察了南宋地方官僚的复杂社会网络,揭示了这一网络由血缘、地缘、学缘等多种因素交织构成。这些研究拓宽了传统史学“以人为中心”的研究视野,为探究历史人物群体提供了新的方法和路径。

  2.2 政治制度与权力结构

  众所周知,宋元时期的政治制度频繁变革,是中国古代政治发展史中的重要阶段。CBDB所记录的人物籍贯、仕履等信息,是研究宋元政治史不可或缺的数据基础。具体而言,通过对比宋元时期官员的地域分布,能够考察出不同朝代的人才选拔与任用方面的特点。此外,通过分析官员的升迁路径与任职年限,可窥见宋元时期的官制设置与演变进程。据调研,宋元时期的党争是学界长期关注的热点议题,例如北宋庆历新政前后新旧两党的激烈角力、南宋时期以秦桧为首的权臣集团专权等案例。当前,学者们正尝试运用CBDB,结合社会网络分析方法考察党派成员的派系构成与联络纽带,从而为传统政治史研究引入新的视角和方法。在未来的研究中,亟须进一步加强南北宋及宋元之间的纵向比较,以更全面地揭示宋元政治生态的历时性变迁。

  2.3 文化思想与社会风尚

  CBDB为宋元文化思想方面的研究提供了丰富的人物信息资源。通过梳理文人的籍贯、交游、著述等,能够勾勒出宋元文学流派的师承系谱与空间分布,如二苏(苏轼、苏辙)的文学传承、江西诗派的形成与影响。CBDB还详尽收录了诸多道学家、理学家的生平事迹,结合对其人际关系网络的有效分析与深入挖掘,有助于探究宋元新儒学的源流演进。值得注意的是,CBDB还广泛收集了宋元时期科举、书院、地方社会等方面的人物资料,这些资料对于动态分析不同地域进士的数量与去向,以及深化对宋元教育选拔与地方社会流动的认识,具有重要意义。因此,CBDB为宋元社会文化生活的全景式描摹奠定了高质量的数据基础。

  2.4 经济贸易与城市发展

  CBDB虽以传记文献为主,但通过人物的籍贯、仕履等信息,结合空间分析方法,同样能够探讨宋元经济贸易的动态变迁。例如,通过各朝代官员的地域流动,可以勾勒出宋元时期重要商埠的兴衰更替轨迹。此外,对不同时期商人籍贯分布的考察,有助于理解宋元商业网络的空间格局和分布特点。当前,已有部分学者尝试将CBDB人物的居住地、迁徙路线等数据与其他文献资料相结合,对宋元时期的城市职能分工体系、聚落形态演变、区域协作模式等进行深入的研究。展望未来,CBDB若能够补充商贾、艺人等中下层人物的相关信息,并结合宋元时期各地的契约文书、海关账册等资料,则可为重建宋元时期经济社会图景提供全新思路。

  3  基于CBDB宋元时期研究的学术价值与应用前景

  3.1 拓展宋元史研究的新视角与新方法

  当前,传统人文学科的研究往往局限于个案剖析,存在“只见树木不见森林”的问题。而CBDB庞大的人物网络则为传统研究提供了一种“全景式”的数据视角,使得纵览宋元300余年历史变迁的全貌成为可能。具体而言,通过系统梳理海量的传记资料,能够在更高的层次上把握历史发展的宏观趋势和一般规律。同时,CBDB为历史研究引入了先进的定量分析方法。除了传统的统计分析外,学者们还广泛运用社会网络分析、GIS空间分析等数字人文研究方法,多角度、动态地刻画出宋元时期的历史图景[4]。此外,引入数理模型与计算机模拟技术或将成为未来历史学研究的新趋势。例如,基于大数据的实证研究虽不能完全取代传统的史料考证,但无疑为解决历史难题提供了新的视角和突破口。

  3.2 实现定性研究与定量分析的有机结合

  基于CBDB学术研究的显著特点在于定性分析与定量研究的有机结合。一方面,CBDB的数据源自传统文献的考证辑录,其本身蕴含着深厚的历史学底蕴,这使得基于CBDB的定量分析能与传统史学进行有效“对话”,从而避免研究过程中出现简单化、表面化或过于主观的问题;另一方面,运用CBDB进行实证研究,能够为传统历史学研究提供新的论据支撑。具体而言,通过数据统计与关联分析,能够发现文献记载中难以直接察觉的深层次规律和内在联系,产生新的知识发现,从而能够进一步增强研究结论的说服力。此外,CBDB的地理信息编码为史学研究开辟了时空分析的新路径。通过数字地图技术,可以直观呈现人物迁徙、官员流动的时空轨迹,再现历史动态演进过程。不难预见,随着数字人文研究的不断深入,定性研究与定量分析将成为历史学研究的“双翼”,它们相辅相成,相得益彰,共同推动相关学科的高质量发展。

  3.3 加深对宋元时期历史的认识与理解

  基于CBDB的研究对于宋元时期历史发展的“再认识”具有深远意义。传统的宋元史研究虽已取得丰硕成果,但仍存在诸多悬而未决的问题,如“唐宋变革”的性质与影响、宋元士人精英的流向、元代汉化的程度等。鉴于此,通过梳理CBDB中相关人物的信息并进行高质量的知识组织,追踪历史人物的迁徙轨迹与社会关系网络的演化,有望为这些问题提供新的思考视角和解决方案。此外,CBDB能够为宋元时期的官僚构成、文人群体的系统性比对提供数据支撑,进而可以为探究两宋变革及宋元更替在政治、社会、文化等多个层面的深层影响提供支持。同时,将不同地域的士人精英进行类型化分析,揭示区域历史发展的差异性,不仅能够颠覆传统的断代史、政治史的叙事模式,还能形成与国家和地方、政治和社会之间互动关系相关的创新性研究主题,有助于更深刻地理解宋元时期历史发展的规律与内在机理。

  3.4 推动数字人文在中国古代史研究中的应用

  CBDB的构建与开发利用是数字人文在中国古代史研究领域的一次伟大实践,其不仅对宋元史研究具有重大影响,而且为其他时代的历史研究提供了范例。受CBDB的启发,学界开始尝试建设隋唐五代、明清等时期的人物传记数据库,以实现与CBDB的互联互通,并有望最终形成覆盖中国两千年历史的知识图谱[5]。与此同时,基于CBDB的研究推动了数字人文基础设施的建设。全国多所高校与研究机构陆续开设数字人文相关课程,以培养具备跨学科视野的复合型人才,而各类数字人文项目的开展也带动了技术创新与成果转化。随着学界对数字人文认识的不断深化,以CBDB为代表的数字人文项目,将成为传统文史研究与前沿科技深度融合的典范,为中国古代史研究注入新的生机与活力。

  参考文献

  [1]杨海慈,王军.宋代学术师承知识图谱的构建与可视化[J].数据分析与知识发现,2019(6):109-116.

  [2]刘京臣.大数据视阈中的明清进士家族研究:以CBDB、中华寻根网为例[J].北京大学学报(哲学社会科学版),2019(4):96-108.

  [3] 华林,张富秋,刘菊,等.数字人文视域下馆藏清代土尔扈特档案文献可视化开发[J].山西档案, 2024(3):74-80.

  [4]岳娜.数字人文视域下的档案知识库建设:问题与前瞻[J].山西档案,2024(3):81-83.

  [5]窦海燕.数字人文时代下档案开发利用的新模式与新路径探索[J].山西档案,2024(3):90-93.

  【作者简介】徐桂彬(1991—),男,汉族,河南开封人,首都师范大学历史学院博士在读,研究方向:历史地理学。