[武大]《光明日报》发表王晓光教授文章

[武汉大学数字人文研究中心网站消息]“新技术”和“文科”不能简单相加

王晓光

新技术环境下,人文社会科学研究呼唤全新的研究基础设施,需要加强文科实验平台的研发与建设,推动人文社会科学研究范式的转型升级,支撑新文科建设。

新文科呼唤新的研究工具和方法

随着《新文科建设宣言》的发布,新文科建设进入全面部署期。建设新文科必须把握时代背景,尊重学科发展规律。近年来,移动互联网、大数据、云计算、人工智能等新兴信息技术的普及应用,正在推动人类社会快速进入数字轴心时代。随着智慧城市、数字政府、数字图书馆、数字档案馆等人类文明记忆机构数字化转型的加速,数字化形式的文献记录和档案数据呈现出爆发式增长态势。哲学家卡尔·波普尔口中的记录人类文化、科技以及各种文明现象的客观知识世界正在转型成为一个人类历史上从未出现过的形态——数据态。与以往的知识载体形态不同,在数据态上,由简帛、羊皮、纸张、铜器、瓷器等不同载体和由文字、视频、音频等不同媒体记载的历史文化知识得到了统一的形式化表示。随着历史档案资料数字化和智慧城市的发展,表达人类名的数据态正朝一个跨时空的数字孪生世界发展,这一新型人造物,不仅通过数字文献揭示了人类历史的整体脉动,通过互联网上的个体数字踪迹全面细致地刻画着当代个体详细的行为轨迹,是人文社科研究者观察人类社会运动规律,并进行人文研究的绝佳对象。

跨时空数字孪生世界的构造,不仅引发了众多需要计算机专家解决的前沿技术问题,比如跨模态数据的采集、融合、组织、检索、交互、挖掘分析以及可视化表示,也带来了众多需要人文学者关注的新兴问题,如数据治理、数据主权、算法伦理等。作为一种新型研究基础设施,数字孪生世界的浮现对人文社科的研究范式带来了重大影响,如何借助机器学习、语义分析、数据可视化、人工智能等技术、方法和工具,融合新兴的人机协同思想理论,针对大数据资源开展分析和挖掘,以创新知识生产方式,已经成为当代人文社科学者面临的时代拷问。

加强文科实验工具平台建设刻不容缓

在自然科学领域,科学研究前沿的突破和基础科学的探索离不开大科学装置的研发和尖端实验平台的支撑。大口径射电望远镜让人类看得更远,冷冻电镜让人类看得更细。大数据时代的人文社科研究范式整体性创新,同样离不开新颖的科学装置和实验平台。面对新兴的数字孪生世界,人文社科界必须研发并应用全新的智能分析工具和实验平台,才能更全面、更细致、更及时地观察和分析隐藏在大数据背后的规律和模式。然而,与自科领域相比,人文社科领域的科学装置和实验平台建设与应用明显落后。传统的人文社科数据分析基本上都是在小规模统计数据基础上开展的,样本量常常是制约分析结果信度和效度的关键。面对超大体量的、类型多样的、增长快速的、价值稀疏的、多模态大数据,传统的人文社科分析软件力有不逮。因此,面对大数据分析需求,必须探索并研发新一代文科实验平台与工具,以支撑人文社科研究范式的跨越式升级。

加强通用型文科实验平台的研发,围绕人文社科学术活动的一般流程和环节,开发建设数据采集工具、数据存储工具、数据分析工具、数据可视化工具、数据发布工具、数据长期保存工具等一般性、通用性实验平台。将学科问题与数字技术深度融合,注重量化思维、计算思维、关联思维、协同思维在通用性实验平台中的体现。针对人文社科研究过程中所需的一般性和基础性数据资源建设需求,必须开发建设通用性的知识图谱生产系统,满足通识性和一般性知识图谱建设需求,形成一般性智慧数据实验底盘。

加强针对性系统工具的研发,突出不同学科和不同领域的研究特色与现实需求。针对文本数据资源,开发建设支持超大规模文本主题识别、细粒度知识抽取、语义深度理解、网络演化可视化分析的平台,支撑现当代文本和古籍文献的挖掘和统计分析;针对图像数据资源,建设支持海量图像的资产管理系统、深度语义标注与理解工具、图像计算分析工具;针对时空数据资源,建设历史GIS系统,对历史地图进行矢量化转换,对古代地点、道路、城址等对象进行精准标注,细化人文研究的时间粒度,深化人文研究的空间层次;针对3D数据资源,研发3D建模与虚拟现实构建工具,对历史建筑、城市、战争等场景进行模拟推演和虚拟重建。

加强人文社科集成实验平台研发,支撑科学数据的荟萃分析。虽然人文社科各类专题数据库建设日渐增多,但具有大科学装置意义的集成性人文社科实验平台并不多见,第四范式下的人文社科实验路径也不清晰。为此,应加快建设人文社科数据中心和文科实验室建设,在数据标准规范制定、质量控制、知识产权、安全管控等方面制定并发布相关规范,研究设计符合我国国情和社会需要的人文社科数据管理制度体系和实验操作手册。依托文科实验室,借助云计算、开放关联数据、知识图谱等技术搭建标准统一、接口规范的人文社科数据资源门户与平台,整体上提升人文社科数据资源的智慧化层次和共享利用水平。通过相关分析与因果分析相结合、演绎逻辑和归纳逻辑相结合、宏观与微观相结合、思辨与计算相结合,文科实验室和集成实验平台将为人文社科研究范式创新和新文科建设指出一条通往未来之路。

在大数据和人工智能时代,文科实验工具平台是创新性解决社会复杂问题的关键科学基础设施,关乎新文科建设,更关乎中国哲学社会科学话语体系的建立,因此,加强文科实验工具平台建设刻不容缓。

作者:王晓光,武汉大学信息管理学院副院长,武汉大学大数据研究院常务副院长

《光明日报》(2020年12月29日14版)