中国高校人文社会科学信息网

您所在的位置:

首页观点历史

迎接历史学的“数字转向”

2020-07-20 08:51:00作者:周兵 姚百慧 王涛来源:《光明日报》( 2020年07月20日 14版)浏览次数:0 网友评论 0

编者按

  互联网技术的进步,深刻影响了人文学科发展的方向,使得“数字人文”成为可能。数字化技术同样对历史学产生重大影响,历史学在史料获取和搜集、研究方法、书写方式、传播途径等方面发生了一些变化,研究效率大为提升,研究思路也有所拓宽。数字史学作为一种新生事物,对传统史学研究者提出了更高要求。历史学者应该敏锐把握时代脉搏,认清历史学科发展面临的机遇和挑战,做好迎接历史学“数字转向”的准备。本期刊发的文章既有从史学史的角度论述历史学发生“数字转向”的必然,又有从方法论角度探讨数字史学的影响,还介绍了我国世界史研究中数据库的使用,希望对数字史学这一史学界关注的热点议题有进一步的认识。

迎接历史学的“数字转向”

作者:周兵

  过去几个月以来,一场全球范围的疫情,给人们带来了程度不同的、各种直接或间接的影响。在同一事件里,相近的生活经历、创伤体验,使得人们能够借由各自的经验而对他人在此过程中的命运有了更为切身的理解,也就是我们常说的“感同身受”,在心理学上称之为“移情作用”。

  对于历史学家来说,历史经验的“移情作用”不仅发生在有差异的个人之间,也突破了文化和地域的空间限制,更穿越了时间的维度。现时代的人生经历、立场背景等,是我们在观察过去的过程中无法摆脱的基础,全球危机的亲身体验为历史学家们更好地解读历史中的风云际会提供了一定的启示。疫情期间,课堂教学和会议研讨不得不转换为虚拟空间里的交流;居家隔离的状态下,一网联通,便可以建立起有效联系。可以说,许多研究者多年来所预言的历史学的“数字转向”已然是不可逆转的趋势了。

  以历史教学为例,远程视频会议系统的开发早已相当成熟,但是在疫情之前,要改变并取代已延续了几千年来师徒相授的传统课堂教学,几乎是天方夜谭;开放性的数字化远程“慕课”,诞生至今已逾十年,虽也曾受到热议和追捧,但始终无法撼动根深蒂固的传统课堂。而如今,远程教学已经成为世界范围内普遍采用的教学模式之一,虽是迫不得已,但其优势和效果即便在疫情结束之后也不能被轻易忽视。在突如其来的疫情之下,能够平稳过渡、保持教学秩序的,正是那些前期在远程技术应用、网络课程开发方面有一定基础的学校和课程。一个电脑课件做得比较完备的老师,肯定比一个主要依靠板书的老师,更能适应由实体课堂向线上教学的角色转换。时至今日,兰克倡导的“习明纳尔”(即seminar,“专题讨论”之意)恐怕也只能转成线上的讨论了。

  回溯史学史,可以看到,史学进步、新陈代谢的动力,是学科自身强大而主动的反省、修复能力,是开放包容和兼收并蓄的学术精神。在不同的发展阶段,历史学都曾遭遇过不同程度的冷遇和低谷,但随着新材料、新理论和新方法的引入,古老的历史学得以不断地迸发出新的活力。历史学发生的“数字转向”,便是已知的诸多新变化之一。

  自19世纪以来,历史学建立了一整套较为严格缜密的研究方法、学科体系和职业规范。仅以对历史资料的收集、整理和考证为例,史料的范围从一般的档案、文献、典籍等,逐渐拓展到考古、图像、数据、口述等文字之外的形式。最近20年来,历史资料的数字化与数字化原生史料的大量出现,成为历史学“数字转向”的重要标志之一。

  关于传统史料的数字化转换。自古以来,就一直存在史料在不同介质和载体之间的转换,如由口述传统向文字书写的过渡,直接带来了传统史学的诞生;再如碑刻铭文的拓印,文稿的誊写、抄录与印刷,还有一度非常盛行的微缩胶片等,都在一定程度上推动了历史研究的进步。其中,文字书写与近代印刷的发明和应用,对人类的知识生产和传播产生过革命性的影响。现代数码技术的发展,使得文件的存储、携带、阅读、检索和传播等各方面都发生了质的变化。单就史料本身而论,数字化使得历史研究者有可能尽量多地获取、占有和运用史料,并且全面细致地掌握相关的研究状况。但是,海量的史料超出了人类自然的阅读能力,这是之前任何时代都不可想象的新问题。于是乎,文本、数据库和网络范围内的电子检索,成为今天每一个研究者日常的基本操作技能;而再更进一步,就出现了利用计算机、人工智能和统计学等方法的“数据挖掘”,以及在此基础上展开的“大数据”模型分析。

  再来看原生的数字史料,也就是运用数码技术直接制造产生的各类电子文档、信息和记录。随着数码电子设备在工作和日常生活中的普及,我们已经在不知不觉中进入到一个“数码”的时代。对于未来将要研究我们这个时代的历史学家来说,他首先必须解决的就是如何获取这个时代里大量以数字形式出现并存在的历史资料。例如,进行历史人物的研究,一般较为传统的研究路径大致包括这样几个方面:一是通过档案资料来挖掘耙梳人物的生平信息、人生轨迹等;二是借由人物存世的著述、日记和书信等文本建构其思想、观念和情感世界;三是追踪人物的社会交往和关系网络,从他人的观察、记录、回忆和评论里还原并丰满人物的形象。即使是依然沿用这一路径,在未来的研究者所要处理的史料中,也会有大量的电子邮件、数码通信信息、社交网络记录等。况且时代在变迁,信息存储的设备和格式可能早已更新换代,加之电子信息缺乏实体的物理存在,更为隐秘、难以查找,也易被删除、破坏、篡改和散佚,许多私人信息、官方文件和电子设备可能还设有加密保护。这些情况,对于仍然按照现有学术训练模式培养的研究者来说,恐怕会成为难以逾越的障碍。因此,在一些对未来史学发展的展望中,常常会提到“数字考古”“数字考证”等概念,这些或许都将成为未来历史学家们的学术基本功之一。

  事实上,数字化对历史学的影响是全方位的。数字化的媒体、技术和工具,已经深入到历史学的各种实践、演示、分析、教学、研究和传播当中,取得的成果也不胜枚举。但是,由于技术发展的日新月异以及传统学科本身存在一定的滞后性,两者之间还存在着不小的张力,对于历史学的“数字转向”这一议题也尚未达成一致的共识,亟待深入展开讨论、更新学术规范、明确前进方向。历史学的研究实践,不仅需要广泛借鉴各种新的技术手段、充分利用先进的高科技产品和工具,而且要前瞻性地思考历史学本身在未来数字时代中的学科定位与理论特色。在这种背景下,对于历史学的理解,不应该是僵化刻板的,历史学家的形象也并不只有寒窗古卷、皓首书斋这一种。

  历史学,归根结底是一门在时间序列上展开研究的学问,因此人们常常把历史比作是现在与过去之间的对话。而作为对话参与者之一的历史学家,通常站在其所身处的时代,带着对现实生活的关怀,展开相应的研究和写作工作。作为历史学分支的史学理论与史学史的研究,则为我们提供了审视自身学科的独特视角,也促使我们思考与展望历史学的前沿趋势和未来前景。历史学者应该抓住时代机遇,迎接历史学的“数字转向”。

  (作者:周兵,系复旦大学历史学系教授)

我国世界史研究中外文数据库的利用
作者:姚百慧

  据笔者调查,国内主要图书馆购买的以及可免费利用的外文专业数据库资源,已超过千种。这些数据库就文献类型而言,可分为图书、期刊、学位论文与会议论文、报纸、档案、统计资料、报告、书目与文摘、图片、音视频等。就收入内容而言,历史学涉及史学理论、世界通史与断代史、地区国别史(涉及70个左右的国家)、传记、文物考古,其他学科如地理、哲学与宗教、政治与法律、军事、经济、文化、科学、教育、体育、语言与文字、文学、艺术、医药卫生等,也有很多资源可以参考。世界史研究需要利用数据库尤其是外文数据库,这是无须争辩的问题。需要讨论的是,如何对这些数量庞大的数据库进行利用。本文从定名与定性、专题数据库的建立、数据库内容考辨三个角度,谈一些粗浅的看法。

  所谓定名与定性,是指对数据库的名称、性质和收录范围有清晰的认识。

  一般而言,因数据库开发者都会提供数据库名称,定名问题不会有太大的困难,但也有一些特殊情况。其一,数据库开发者有时会改变数据库的名称,从而导致在不同的馆藏地或不同的学者引用中对同一数据库标引不同。如美国档案类数据库“美国解密档案在线”(U.S. Declassified Documents Online),原名为“解密档案参考系统”(Declassified Documents Reference System);期刊类全文数据库“综合学科学术文献大全”(Academic Search Complete),原来的英文名为“Academic Search Premier”。在这种情况下,建议标引以最新名称为准,同时了解其历史名称。其二,存在总库、子库的情况。如HeinOnline法律数据库有60余个子库,美国国会图书馆的“数字化收藏”(Digital Collections)有300多个子库。一些开发商或代理商,还会重组其数据资源,形成新的总库。如Gale公司,它把旗下部分报纸期刊类的库组成Gale NewsVault,又把以档案为主的300余个子库组成“珍稀原始典藏档案”(Archives Unbound,简称AU),还把这两个库和它的其他偏重原始档案文献的子库组合起来,形成了Gale Scholar超大型数据库。就个人利用而言,清晰的子库名称更重要;但由于一些馆藏只标引了总库,所以也需要了解总库名称。其三,馆藏机构的标引方式,也会造成名称的混乱。比如,有的馆藏只列翻译而无原文名称,各馆藏有时翻译名称不同,以及有的馆藏根据购买情况重新拟定数据库名称。如国家图书馆购买了AU中亚洲的部分专辑,命名为“珍稀原始典藏档案合集:亚洲”(Archives Unbound Asia)。

  确定性质指确定文献的收录类型。前文已提及,外文数据库的文献类型包括图书、期刊、报纸、档案等。不同类型的文献,在史学研究中所起到的作用是不同的,或作为目录检索路径,或作为前期学术史,或作为史料来源。在开发商或图书馆的数据库介绍中,会说明文献的类型或特征。需要强调的是,上述文献是基于现代的出版类型进行分类的,它很难完全体现人类过去所积累的文献的所有特征,所以只能是相对性的。比如,档案在今天往往指代有密级的、生成之时尚不能为一般公众查看的文献,但对于古代史而言,甲骨、碑铭、纸草文书、木板文书等,不管其当时的利用范围如何,都已是研究那个时代的珍贵“档案”了。

  确定收录范围,指弄清数据库收录的内容特征。在数据库的介绍中,一般会对此作出说明,如“早期英文书籍在线”(Early English Books Online)的介绍,一般会说明其收录的数量(12.5万余种、超过2250万页英文著作)、时段(1473—1700年之间)、类型(名家著作、皇家条例及布告、军事、宗教和其他公共文件、年鉴)、学科范围(历史、语言、音乐、美术、物理学、妇女研究)等。但确定内容特征有时也会有一定的困难,上文提及的总库与子库的情况是其中之一。有的数据库有很多子库,但图书馆一般只会选择部分子库购买,而标引时却用总库名称,这样就很难知道该库在某一具体馆中的子库收录情况。另一种情况是,很多图书馆会选择数据库中与本校教学科研密切的模块来购买,从而导致即便没有子库的数据库,在各馆中收录内容差异也较大。比如Sage期刊库,有的馆(如首都师范大学)购买了500多种现刊,有的馆(如北京大学)则购买了800多种现刊。同名数据库各馆收藏不同,会让同一检索在不同的馆藏出现差异甚至差别较大。此外,有的数据库以模块形式呈现,模块下内容较多,而模块名称却未必能完整展现其收录内容。如ProQuest历史库的一个模块“越南战争和美国外交政策(1960—1975年)”(Vietnam War and American Foreign Policy,1960—1975)是一个单一的数据库,从其名称来看,只能判断其与越战有关。但这个数据库收录内容广泛,含有104个子辑,内容极其丰富,比如有成系列的美国国家安全委员会文件、国家安全委员会会议记录,从肯尼迪到尼克松时期的国家安全文件等,实际上是战后到20世纪70年代美国外交史研究的重要资源。像这类数据库,不了解其子辑内容就没法深入利用。

  定名与定性是我们利用外文数据库的起步工作。接下来,就可以大体判断某一数据库与我们所从事研究的关系,从而确定是否要加以搜集和利用。类似于做专题文献书目一样,在从事一项专题性的学术研究时,也要围绕该研究搜集在线资源,做一个专题数据库的列表。需要注意的是,这些专题数据库搜集时面不能过窄,它们不仅要包括与某一研究直接相关的数字资源,也要包括一些宏观性质的及可能相关的其他数据库。如研究两次世界大战期间英国的绥靖外交,首选当然是英国的外交档案以及重要人物的文件集,如收录了60余册《英国外交政策文件,1919—1939年》的“英国海外政策文件”(Documents on British Policy Overseas)数据库、内维尔·张伯伦和奥斯丁·张伯伦的文件集(The Papers of Neville Chamberlain; The Papers of Sir Austen Chamberlain)、“丘吉尔档案”(Churchill Archive),次选是这一时期的内阁文件(Cabinet Papers)和国会文件的系列数据库(U.K.Parliamentary Papers, House of Commons Parliamentary Papers, Hansard等),最后是反映当时媒体动向的重要报刊,如“大英图书馆报纸”(British Library Newspapers)、《泰晤士报》《每日电讯报》《伦敦新闻画报》《图画邮报》等。同时,通过“英国外交部机密印刷件:北美,1824—1961年”(Confidential Print: North America, 1824—1961)、“英国外交部:美国通信”(British Foreign Office: United States Correspondence)、“英国外交部档案:日本,1919—1952年”(Foreign Office Files for Japan,1919—1952)、“英国外交部档案:中国,1919—1980年”(Foreign Office Files for China,1919—1980)等英国档案数据库,以及美国、日本、德国、澳大利亚、加拿大等国家的外交档案数字资源,可了解围绕英国绥靖行动有关国家的互动。以上搜集偏重于两次世界大战期间与英国有关、相对原始的文献,也不能忽略一般的通用数据库,比如图书资源(约50种)、期刊资源(约30种)、学位论文资源(十余种)等。

  在搜集到相当的电子资源后,还要进行内容考辨的工作。这一考辨,可以从两个角度入手。

  一是观察数据库资料来源和开发机构。一般而言,政府机构公布的本机构所掌握文献的权威性,高于其他来源;知名开发商、学术机构开发的专业性数据库,高于一般网络资源。例如,我们要查美国人口数据,最优先利用的是美国人口普查局开发的“美国事实发现者”(American Fact Finder),它可以提供美国人口、住房、经济和地理数据的来源;关于美国农业人口,则要参阅农业部的“国家农业统计数据”(National Agricultural Statistics Service),它提供了自1840年以来美国各州和地区的农业人口普查数据;还可以利用明尼苏达大学的“美国国家历史地理信息系统”(National Historical Geographic Information System),它提供了1790年至今的美国人口普查和其他全国性调查统计资料,包括带有地理空间属性信息的人口、农业、经济等方面的数据。

  二是注重数据形式和原实体之间的关系。就人文学科的多数数据库而言,其数据往往来自某种实物。利用这种数据库时,除了传统利用实物载体要注意的考辨等工作外,还要考察数据形式同原实体之间的关系。如纸质文献在电子化的过程中,是完整电子化,还是部分电子化?电子化的文献是如何排列的,这种排列同原始文献的排列关系何在?等等。如ProQuest公司开发的“数字化国家安全档案”(Digital National Security Archive),其文献选取和组合模式是围绕某一国家安全问题,抽取来自不同机构的档案,并按时间先后组织在新的子辑中。虽然所抽取的档案是完整扫描,但它并不会完整扫描原档案所在卷宗或系列,研究人员只能通过不同档案的时序排列建立起联系。利用这类数据库时,有时还需使用相关的配套指南、大事年表、人名索引等工具。

  定名与定性、建立专题数据库、内容考辨,是利用外文数据库的基础工作。做好这些工作,研究者可以更高效准确地找到自己所需要的电子资源。当然,它们并非利用外文数据库注意事项的全部,如从知识考古学角度,可以讨论数据库开发的知识背景、开发动机、开发人员组成、文献著录方式等;从文献挖掘角度,可以讨论挖掘工具的选用、关键词选取、算法等,这些都是我们在使用数据库时需要考虑的内容。

  (作者:姚百慧,系首都师范大学历史学院教授)

数字史学的方法论问题
作者:王涛

  最近几年,“数字”成了一个令人着迷的修饰语,“数字艺术”“数字人文”等概念不一而足。有学者认为,学术界正在经历一场“数字转向”。

  “数字转向”对历史学的影响,已从很多侧面体现出来,如区域国别史研究的专题数据库越来越多,在线历史文献的获取越来越便捷等。在我国史学界,中国史领域关于“数字人文”的探讨已经热闹非凡,世界史学界则稍显平静。与此同时,国际史学界无论在对数字技术的关注度,还是在扎实的研究成果方面,都有着不凡的表现。历史学门类下的一些研究分支,也在纷纷冠名数字化的研究,如“数字公众史学”“数字口述史”“数字环境史”等,呈现出一派繁荣的景象。

  美国史学界很早就接纳了数字史学,其发展状况也最具代表性。研究本国历史的罗森茨威格于20世纪90年代起便致力于用数字技术协助历史研究。2004年,罗森茨威格在第118届美国历史学会的年会上组织了一场题为“迈入在线历史的第二阶段”的讨论单元,提出数字史学应从之前对理论和工具的探讨转向更加专业的历史专题研究。2005年,美国学者博登对美国史学界的数字化状况进行了一番梳理,指出美国史学界在数据库建设、协作研究等方面已经硕果累累。随着数字工具越来越方便实用,数字史学得到了进一步发展。2013年,由美国史学家凯利主编出版的《数字化时代的历史教学》,为历史专业的年轻学子提供了指南,指导他们如何卓有成效地在历史研究和写作中运用数字技术。同年,美国学者多尔蒂等用“数字化”的方式,反思数字化时代历史书写这个具有先锋意义的话题。他们先是召集若干学者就这一话题写作文章,然后将成果放到开放网络平台供读者评阅。最终结集出版的文章,取名为《数字化时代的历史书写》,对数字技术如何改变历史学家思考、教学、写作和出版的方式等问题进行了回答。此外,从2013年开始,《美国历史杂志》在传统的“学术书评”之外,单独开辟了“数字史学评论”专栏,对数字史学的研究成果进行学术评议,表明了美国史学界的主流态度。

  上述提及的这些历史学者,都是数字史学的弄潮儿,他们主动拥抱、推广数字史学的理念与方法,推动整个史学界对数字技术的关注,促使传统学者从方法论层面进行探讨。

  英国爱丁堡大学出版社在2008年推出了“艺术与人文研究方法”系列丛书,旨在为人文学科的学生展现方法论的可能性与有限性。2012年,英国史学家顾恩等在这个系列丛书下出版了《历史学研究方法》,专门有一个部分讲解历史学研究定量与定性的方法。从章节的分布来看,学者们在历史研究中运用诸如地理信息系统(GIS)以及数据库进行量化分析的方法,已经被广泛接纳。2016年,该书又推出了修订版,特别增设了数字研究的章节,以一种更加严谨的态度对待数字工具的效能问题。

  随后,数字史学被纳入史学方法论的体系就成为愈加自然的事情了。我们所熟悉的英国历史学家彼得·柏克一直对历史研究的新方法特别关注。2018年,柏克主编的《辨析历史学的新路径》一书,用一种具有学术争辩的方式把“数字史学”请进了“历史学的宫殿”。该书的体例设置极具特色,不同作者对当下流行的史学研究新领域进行梳理,诸如全球史、性别史、数字史学等被纳入考察范畴;与此同时,编者为每一个研究领域安排了一位评议作者对其内容提出异议,然后再由原作者进行回应。数字史学的方法也遭到一些质疑,章节作者英国历史学家温特斯的解答让我们更加深刻地意识到,在史学研究中引入数字方法的限度与效度。

  英国布鲁姆斯伯里出版社多年前曾推出“书写历史系列丛书”,其中《书写历史:理论与实践》截至2020年已经出了3个修订版。在第3个修订版的计划中,本来设置了“数字史学”的章节,但由于种种原因,最终版本并没有刊发出来。不过,我们从这个例子可以看到,包括德国历史学家贝尔格等在内的编者对数字史学的关注。

  进入21世纪以来,历史学门类下的多个研究方向都有进行数字化的尝试。公众史学与数字化似乎有天然的亲缘关系,意大利公众史学家努瓦雷很早就提出了“数字公众史学”的概念,并在很多场合鼓励大家通过数字化方式,让公众史学项目得到更多元的展现,其参与主编的《数字公众史学手册》也将于2021年出版。

  “数字”的概念虽然很吸引人,人们对它的理解却不尽相同。口述史研究也是相对较早开始思考数字转向的史学研究领域。美国口述史专家唐纳德·里奇的经典著作《大家来做口述历史》曾多次改版,他不断根据数字技术的发展状况,调整口述历史实践过程中运用数字技术的态度和方式。在口述历史实践者的眼中,数字技术使得口述史在采集、转录、存储、传播等方面带来了极大的效率改善。不过,如果始终用一种数字档案的逻辑来看待数字转向,其实是对数字化的一种片面认知。同样的认识偏差还存在于2016年出版的一本关于历史学方法与理论的书籍之中:《历史学的宫殿》。该书是面向历史学专业学生的拓展读物,仅仅用“量化历史”来体现方法论的更新,显然是对数字转向过于简化的一种理解。

  从学术研究的角度看,“数字转向”拓宽了史学研究的思路。美国历史学家古尔迪在《历史学宣言》里呼吁“长时段”的回归,得到了许多历史学家的共鸣。不过,由于缺乏具体研究项目的支撑,古尔迪的呼吁更像是空洞的口号。反而是英国历史学家弗朗索瓦与同事们一同构建的“Seshat全球历史数据库”,不仅兑现了进行长时段历史研究的承诺,而且改善了历史研究成果呈现方式单一的问题。

  当然,除了长时段的回归,借助数字技术,历史研究也能在微观问题上得到延展。比如,借助GIS的技术和方法,历史学者可以更加精细地讨论时间与空间因素在历史发展过程中的作用,这也是美国学者博登海默提出“深度制图”概念的重要价值。这个理念在城市史研究中得到充分利用,有学者通过GIS技术挖掘中世纪晚期文献中有关空间信息的描述,进行空间数据的转录、配准,对英国城市空间的演变状况获得了更多细节的把握。除此之外,利用文本挖掘技术从海量文献中提取有价值的信息,快速掌握大规模文本的概貌,或者用社会网络分析抓取历史人物之间的隐秘关联,都能够为史学研究提供新的思路。

  总体而言,“数字史学”从概念提出到正式进入史学方法论,成为史学培养体系中的一环,大概有30年的时间。这个漫长的过渡阶段,似乎是很多新的史学研究领域都需要经历的沉淀期。但从国际史学界的整体面貌来看,数字史学正在获得越来越好的发展态势。对中国的世界史研究来说,虽然学者们对数字史学的关注还有待深化,但基于数字技术的研究条件得到改善,研究议题不断拓展,是有目共睹的事实,这些都充分显示了数字转向的积极促进作用。我们已经很难想象,如果没有诸如JSTOR、Gale等数据库,世界史研究在中国的学术语境下如何展开。所以,我们应更主动地迎接史学的数字转向,助力中国的世界史研究不断推出更多具有原创性的成果。

    (作者:王涛,系南京大学历史学院教授)

 

查看评论

已有0位网友发表了看法