重视新文科的数字基础设施建设

作者:朱本军;转自:中国社会科学网-中国社会科学报 2020年08月28日 09:11

“新文科”从概念提出到现在,大规模、实质性建设尚未完全落地,这为学术界向“新文科”建设设计顶层方案提供了咨政建议的时间窗口。近些年全球范围内蓬勃兴起的数字人文,尤其是海外汉学界运用数字技术开展中国研究方面,出现了一些新气象,也出现了一些特别值得注意的新趋势。这些新气象和新趋势提醒我们,发展新文科,要高度重视文科数字基础设施建设。

文科数字基础设施建设的重要性

最近几年,当国内人文学者还在按照传统方式以一人之力辑校点读之时,海外的汉学研究发展却异常迅猛,出现了大量适合人文研究重复使用、跨学科合作的基础数字工具和项目,如哈佛大学主导的“中国历代人物传记资料库”(CBDB)、“中国历史地理信息系统”项目(CHGIS),耶鲁大学主导的“广厦千万间”项目(The Ten Thousands Rooms Project),普林斯顿大学主导的“中国互赠诗”项目(Chinese Exchange Poems Project)等。这些数字人文工具和项目一方面为中国的文史学者提供了文献数字化、文本化、数据化、计算工具与平台的跨学科视野,另一方面吸引了大量中国本土从事哲学社会科学研究的学者长期进驻使用。

哲学社会科学是国家话语权的重要领域。在信息技术与互联网技术无处不在的当下,如果我们不重视研究本土的哲学社会科学数字基础设施建设,一旦海外汉学界的数字基础设施形成规模效应和用户黏性,某些内容的差异表达可能对我国哲学社会科学话语体系产生一定的负面影响。从这个意义上讲,加强人文社会科学研究的数字基础设施建设的意义深远且极为必要。

文科数字基础设施的概念与内容

文科数字基础设施的提法,从某种意义上看,舶自于自然科学。2003年美国自然科学基金会(NSF)在一份报告中将“数字基础设施”(cyberinfrastructure)描述为“一个新的科学和工程的知识环境和虚拟组织”。在这个环境或组织中,研究人员可以以新的、更高效的方式开展研究。由于美国自然科学基金会的提倡,此后美国的自然科学各分支领域出现了大量关于“数字基础设施”的提法和讨论,例如“建设自然科学和工程学数字基础设施”“建设固体地球科学数字基础设施”“建设生物医药研究数字基础设施”“建设海床观测数字基础设施”“建设空间数字基础设施”等。

在人文社会科学领域,美国学术团体理事会(ACLS)早在2004年即注意到,自然科学领域的科学家和工程师“不再仅仅把数字技术看作是增强既定研究方法的工具,而是一种创造新知识环境的力量”,并认为人文社科领域也需要这样一种环境。在这个环境中研究者能够通过互操作协议获取高性能的计算工具和数据,研究人员只需要“把他们的学识和学术精力集中在高层次的研究问题上,成为新媒体和新技术的有效用户,而不是非得从无到有去发明它们”。为此,美国学术团体理事会成立了“数字基础设施委员会”,职责是“描述和分析人文和社会科学领域数字基础设施的现状”,“阐明人文社会科学在发展信息、教学和研究数字基础设施方面的要求和潜在贡献”,以及“对促进数字基础设施发展的各类公共和私人机构进行协调”。美国人文社会科学学界注重数字基础设施建设,并延伸到汉学研究,从美国学术团体理事会的行动即可窥见一斑。

今天,我们所谈论的新文科数字基础设施,本质上指的是一个由人文数据资源、网络协议、计算平台和计算工具形成的大联合体。在这个大联合体中,人与信息、计算工具被无缝地聚集在一起,并能在信息驱动的世界里开展研究。

新文科数字基础设施的中国方案

近两年,海外一些个人和机构已经在“汉学研究数字基础设施”方面做了一些富有想象力的构想和颇有成效的尝试。由于软科学基础设施的布局具有“早鸟效应”和“山头效应”,海外的这些新动向实际上增强了我国新文科数字基础设施建设的现实紧迫性。

全球视野下的中国方案可同步推进“本土研究”与“海外研究”两个数字基础设施的布局。所谓“本土研究”布局,就是中国学者要牢牢把握研究本土数字基础设施建设的主动权,俾使海内外与中国议题相关的讨论都在此同一数字基础框架下进行;所谓“海外研究”布局,就是要建立中国视野下的海外研究数字基础设施,吸引海外学者进驻与参与。就新文科数字基础设施而言,无论“本土研究”还是“海外研究”,中国方案应特别注意以下三个方面。

一是主导人文基础数据的标准与规范。尽管人文的本质是“一千个人眼里有一千个哈姆雷特”,但是人文数据中的事实性基础数据(如时间、地名、人物、职官等)规范与标准的建立相当重要。

二是注重数字生态培育。规范且权威的数据、开放的平台,以及具有专业忠诚度与使用黏性的人,会形成一个虚拟空间的生态。这种生态,在“网络效应”的影响下,会呈现出一种高度跨界融合与互动共生的景象。

三是做好体系化、大一统的顶层设计。当前海内外在人文社会科学领域的诸多数字化项目,存在低水平重复、描述标准不统一、著录规则不一致等现象。究其原因,在于学者或研究机构没有人力财力聚合、商业数据库商家之间由于利益冲突无法达成体系化、大一统的顶层设计。人文数字基础设施中国方案的落地,可以发挥中国的优势,采取统一部署、顶层布局、分步推进的方针进行实质性建设。

总而言之,新文科数字基础设施建设看似无形,但兹事体大,既关乎文科学术的整体走向,又关乎国内国际两个大局的话语体系建设与话语权建立。仅就中国本土的人文数字基础设施研究而言,只有将研究的主动权掌握在我们自己手中,才能根深蒂固、源远流长,才能使新文科在新时代发挥更为重要的基础作用。

(作者单位:北京大学图书馆)

zh_CNChinese