海外文化平台助推古籍技术合作交流——第一届古代汉语分词和词性标注国际评测举行

中国社会科学网讯(记者 阮益嫘 王广禄)今年四月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,明确指出,积极开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。加强古籍工作对外交流合作,充分利用海外文化平台开展古籍对外宣传推广活动。6月25日,第一届古代汉语分词和词性标注国际评测会议(EvaHan)在线举行,该评测会是法国马赛法罗宫举办的第十三届语言资源与评测国际会议分会场——第二届历史和古代语言技术研讨会(Workshop on Language Technologies for Historical and Ancient Languages,LT4HALA)的特别分会。

  南京师范大学文学院计算语言学与数字人文专家李斌副教授在开场介绍中指出,LT4HALA旨在促进国际交流,汇集正在开发或正在使用语言技术处理古代语言的学者,以促进计算语言学界与处理历史语言数据的人文学科领域之间的相互交流,本年度的LT4HALA研讨会吸引了来自全世界数十位学者参与,研究古拉丁文、古希腊文、古汉语、古代日语等古代语言的典籍分析技术。古汉语作为承载中华文明的一种古老语言,各参赛队通过前期测试和后期评比的过程中,促进了古籍信息技术处理方法、成果的展示与交流。

  清华大学计算机科学与技术系教授、清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松谈到,现代汉语的自动分词已经走过了约四十年的历程,各项标准制定和评测工作也开展得比较早,而古汉语的分词和词性标注技术起步比较晚,本次评测会的举办是国内外首次,是古汉语信息处理和古籍数字人文研究“走出去”的重要一步。

  第一届国际古代汉语分词和词性标注评测(EvaHan)是国内外首次举办的古代汉语分词和词性标注评测,于2021年12月20日正式启动并公布训练集,2022年3月31日公布测试集,4月7日参赛队提交待评测结果并由组织者完成评测。共有来自13个高校、公司的14支队伍参赛,共提交了55份评测结果。本次评测设置了两个测试集与两种评测模态,全面考察了各参赛队古汉语分词和词性标注系统的性能。数据均由南京师范大学计算语言学团队加工建设,以《左传》前十卷为训练集,后两卷为基测集,《史记》和《资治通鉴》中的部分语料选作盲测集。两种评测模态的不同在于是否限定参赛使用的预训练模型、训练集与外部特征。经过审核评比,最终,来自复旦大学的王鹏宇团队荣获一等奖,北京理工大学杨舒荀团队、北京邮电大学林博达团队荣获二等奖,广东外语外贸大学张海林团队、南京大学申雨瞳团队、南京师范大学中北学院蒋龙杰团队荣获三等奖。孙茂松为获奖团队颁奖。

  南京师范大学文学院计算语言学开创者陈小荷教授带领团队,以十多年的古汉语信息处理资源和技术积累,努力践行以技术传承传统古籍的工作。他在本次评测会上谈到,资源和数据是词法分析的两大支撑。现代汉语的评测已经非常成熟,产生了一些标准数据集。但是,现代汉语与古代汉语有所不同,现代汉语的自动分析成果无法直接移植于古代汉语领域。缺乏标准数据集是当前古汉语信息处理研究的桎梏,古汉语自动词法分析评测的举办,旨在建设古汉语标准数据集,为该领域的研究者进行资源和技术交流搭建平台,启发古汉语信息处理的创造性设计和创新型发展。

  教育部语言文字应用研究所研究员冯志伟谈到,作为古代语言信息处理的国际盛事,古汉语评测今年举办第一届,平行分论坛举办的第二届古拉丁语自动分析评测(EvaLatin),使得两种古老的语言处理技术交相辉映。本次古汉语词法分析评测巧妙地设计了两种不同的测试集和评测模态,为古汉语词法分析构建了公开的标准数据集和评测方法,有助于后续研究的良性发展。

  李斌在闭幕式上谈到,汉语和英语不同,汉语没有词语边界的标记,古汉语的词语边界识别则更加复杂、艰难,但它又是古籍深加工、走向概念知识库的基础性工作。测评竞赛的组织,目的在于提高古籍分词和词性标注的水平,增进各研究单位及参赛队伍间的技术互享与了解。今后将在古籍自动标点、命名实体识别、句法分析、语义解析和机器翻译等更多、更实用的领域开展更多的交流与合作。

  陈小荷谈到,在国际平台举办古汉语的评测任务,撰写英文论文,以英语作报告,体现了增强国际学术交流的孜孜追求;设定以古籍为基础的词语切分和词性标注任务,推动古籍内容自动分析技术发展,体现了向世界讲好中国故事,弘扬中华优秀传统文化的自信与自觉。注疏类古籍文献的挖掘与评测应当成为今后古汉语信息处理的一个重要课题。训诂学家通过钻研古典文献及其注疏获得了丰富的语言知识,使用自然语言处理技术对古文献注疏中的词语知识进行自动挖掘,并作为一种资源用于开放测试,将有助于古汉语信息处理的发展和传统的古典文献研究,推动古籍整理利用转型升级。

  中文分词规范、技术和评测的主要推动者清华大学计算机系黄昌宁教授,古籍信息处理与数字人文专家、南京农业大学信息管理学院王东波教授出席此次会议,并对测评活动进行点评。

  复旦大学王鹏宇团队提交的系统在本次评测中斩获多项最佳成绩,他们在《左传》测试集上得到的结果达到了目前古汉语词法分析的最高水平,分词和词性标注的F值分别达到96.03%和92.05%,其采用的局部语义增强策略与外部知识融合策略对古汉语文本信息处理有着启发性意义。

  本次评测由南京师范大学文学院计算语言学与数字人文研究组和南京农业大学信息管理学院联合组织,由北京大学数字人文研究中心、中国人工智能学会语言智能专委会、中国中文信息学会青年工作委员会、江苏省人工智能学会自然语言处理专委会、江苏省语言学会协助组织。

新闻来源:http://ex.cssn.cn/zx/bwyc/202206/t20220628_5414421.shtml

zh_CNChinese