[武大]中心近期发表的部分科研成果列表

[武汉大学数字人文研究中心网站消息]I. Paper

1.宋宁远,王晓光.基于情节本体的叙事性文本语义结构化表示方法研究.中国图书馆学报,2019.

叙事性文本是人类对世界发展的记录或再创作,含有丰富的语义信息。在数字人文环境下,人文学者的叙事文本阅读策略已经开始从关注宏观的语篇内容向关注微观的情节内容转变,对情节与内容实体的研究已经成为叙事性文本研究的焦点。现有的文本语义结构化研究更多偏向结构较为标准的科学文本,而对于结构复杂、形式多样的叙事文本仍缺乏相关的语义结构化表示方法,制约了叙事性文本的机器理解,因而难以进行文本内容的数据处理与开发。

为了更好地服务与支撑数字人文的研究,本文在梳理叙事学基础理论与概念、事件知识表示、事件本体与叙事本体等理论的基础上,对叙事文本中存在的事件及事件间关系进行了语义建模与表示,同时完善了对情节的定义,构建了基于事件的情节本体EBPO,提出了叙事性文本的“层次-网络”结构模型,用以实现对叙事性文本的语义结构化表示。本文以《傲慢与偏见》和《月亮与六便士》为例进行了实验。结果表明,本文提出的情节本体与结构模型能够有效地对叙事性文本进行语义结构化处理。

2.Xuhui Li, Yanqiu Wu, Xiaoguang Wang, Tieyun Qian, Liang Hong. Towards a semantics representation framework for narrative images. The Electronic Library, 2019.

叙事性图像是记录历史事件和虚构故事的重要媒介,近年来数字图书馆中的叙事性图像资源与日俱增,然而现有的语义表示框架却难以满足机器对图像进行理解和表示的需求,使得叙事性图像的价值难以发挥。为了提高数字叙事图像的机器可读性和机器可理解性,满足人们对数字图像进行语义检索的需求,本文在对叙事性图像的语义表示特征进行研究后,提出了一个新的语义表示框架——ESImage,希望能够支持语义信息的有效组织。

ESImage从语义发展的角度出发,采用层级递进式框架,依据叙事性图像的语义特征自下而上分为表层、场景层、焦点层与集合层共4层,在“意义图(meaning graph)”语义数据模型的基础上实现对图像语义的递进式表示。ESImage框架不仅支持单元图像含义的演化表示,而且能够在图像中或多个图像间建立多种语义关系,从而支持语义信息的挖掘与检索。本文以敦煌壁画《九色鹿》为例,对ESImage框架的可用性进行了验证。

3.曾熙,王晓光. 数字学术:概念、特征与案例分析. 数字图书馆论坛,2019(3)2-10.

数字技术在学术研究中的应用带来了学术研究环境的深刻变化,催生了"数字学术"的概念.通过文献调查,本文对数字学术的历史沿革和基本概念进行梳理,并基于学术生命周期理论对学术活动各环节的数字化特征进行深入分析.通过网络调研,以"贝尔法斯特团队诗歌|网络"项目为例,对当前数字学术研究过程与特征进行验证.最后,通过对数字学术的反思与总结提出数字学术并非无所不能,研究人员应以开放、包容、客观、冷静的态度看待数字学术热潮。

II. Short Paper

1.Xilong Hou, Xiaoguang Wang. Modeling and Representation of Intangible Cultural Heritage Knowledge using Linked Data and Ontology. 2019 Annual Meeting of The Association for Information Science & Technology, Melbourne, AU, 2019.10

非物质文化遗产一直是民族优秀文化传承的重要组成部分,对其中所蕴含的丰富知识进行有效的组织与管理是非遗文化遗产保护与传承的前提与基础。由于非遗文化遗产知识的语义化程度较低,难以充分表达知识元素之间的关系,因此很容易造成知识内容的孤立与流失。针对非遗项目知识的有效管理与关联的问题,本文提出了一个基于关联数据构建非遗知识关联数据库的方法体系。以非遗领域知识构成的核心要素为基础,设计了非遗知识本体模型,同时构建了关联数据库,并将内部数据与DBpeida和GeoNames外部数据进行关联开放数据的知识关联。本文还以湖北省非物质文化遗产项目为例,根据收集到的非遗项目和代表性传承人的基本信息,构建了湖北省非遗项目知识关联数据集,并建设知识服务平台,支持数据管理、数据浏览、SPARQL Endpoint等服务。本文提出的知识管理体系是在大数据背景下进行深度知识组织与开发的新思路,对于我国非遗知识的管理具有一定的参考意义。

III. Poster

1.Xiaoxi Luo, Xu Tan, Xiaoguang Wang. Semantically Enriched Presentation for Cultural Heritage Images: A POI-based Perspective. Joint Conference of Digital Libraries, Urbana-Champaign, USA, 2019.6

文化遗传图像蕴含有丰富的历史和文化信息,但现有的图像描述多为粗粒度的基本信息展示,如规格、创作时间、类型、作者等,缺少对图像内POI点的细粒度描述,不利于人们对图像的深度理解与探索。本文构建了一个语义增强框架,用于图像内POI点的相关信息的集成,并以敦煌壁画《五台山图》为例,展示了一种新颖的图像信息表示与交互方法。

2.Xiaoguang Wang, Hanghang Cheng, Huinan Li, Xu Tan, Qingyu Duan. Chinese Dunhuang Mural Vocabulary Construction Based on Human-machine Cooperation. In Proceedings of the International Conference of Digital Humanities, Utrecht, Netherlands, 2019.

敦煌壁画是敦煌文化遗传的重要组成部分,对于人文学者在史地、美术、宗教、乐舞等方面的研究具有不可估量的价值。然而敦煌壁画词表的缺失使得敦煌壁画资源无法得到有效合理的组织。本文从人机结合的角度对敦煌壁画分类词表的快速构建机构进行了探索,设计了上而下的宏观结构设计与自下而上的微观词表优化相关结合的词表构建机制和相关算法。

3.Xiaoguang Wang,Xu Tan, Qingyu Duan. Enhancing Scholar Supportive Data: Surveying the Landscape of Information Resources for Digital Dunhuang. 2019 Annual Meeting of The Association for Information Science & Technology, Melbourne, AU, 2019.10

通过8个具有代表性的敦煌数据库,本文对敦煌相关数据资源的组织状态进行了调研。结果显示,当前的敦煌数据资源类型多样、非结构化特征显著,元数据描述较为充分,但深度语义标注缺乏,难以支撑日益兴起的数字人文研究需求。未来如何以语义增强的手段提升数据价值,本文给出了建议。

IV. Workshop

1.Xiaoguang Wang, Wanli Chang, Hongyu Wang. How To Organize and Reveal Knowledge of Cultural Heritage Digital Resources? — A Case Study of Digital Dunhuang. Joint Conference of Digital Libraries, Urbana-Champaign, USA, 2019.6

文化遗传数字资源包罗万千,具有多源异质的特性。本文以敦煌石窟为例,根据敦煌数字资源的特点设计了敦煌石窟知识组织的属性图模型,再通过知识图谱的构建,对敦煌数字资源中的领域知识进行了语义化组织与关联,搭建了敦煌文化遗产知识表示平台,为文化遗产数字基础设施建设提供了借鉴思路。