[清华]清华大学数字人文工作坊第一期“文本挖掘”工作坊顺利结课

2019年11月,清华大学数字人文工作坊第一期在新斋举行。本期工作坊以数字人文研究中重要的基础方法“文本挖掘”为理论基础,以概念史研究为实践对象,包含三次共九学时的讲习课程,由山东大学历史学系副研究员、中国美术学院中国思想史与书画研究中心研究员邱伟云老师主讲,清华大学人文学院严程老师主持。参加工作坊的12位学员分别来自清华大学、北京大学和北京语言大学,从本科三年级到博士一年级,均具有人文研究或数字研究背景。

在前两次课程中,邱伟云老师向学员介绍了概念史研究法及自然语言处理技术,结合数字人文领域的发展历程及研究前沿,从人文基础方法论和数字基础方法论两方面阐述人文研究与数字研究相结合的可能性和必要性。邱老师用诸如“西游记中哪个妖怪法术最强?”等问题引导学员思考如何将人文问题转化为统计学问题,以“人”的观念史研究为例展示数字人文研究的优势,又在展示经典研究范例及前沿方法时提醒大家注意数字统计中的漏洞。邱老师还分享了自己进入数字人文研究领域的契机,鼓励学员找到属于自己的持续性的研究动力。课后,学员们对目前学界较有影响力的数字人文学者的研究工作进行调查,并撰写了十二位学者的研究综述,对数字人文领域的研究现状有更进一步的了解。

邱老师在最后一次课程中强调,除了寻找统计学方法对应的人文意义之外,更关键的是要以人文的问题意识去引导数字方法的使用乃至创新,坚持从人文问题出发、以人文为本位的理念。他带领学员进行案例实操,学习如何应用词频、共现、词缀和文本网络等文本挖掘技术,解决研究中的具体问题。12位学员分成四个小组,每个小组均由擅长数字研究的同学和擅长人文研究的同学搭配组成。四个小组围绕共同课题建设数据库,并分别进行小课题的研讨,学员们也努力从“优势互补”的小组成员成长为相对独立的数字人文研究个体。文本挖掘工作坊既是一个课程学习平台,更是未来学者实验室。学员们在邱老师的循循引领下初窥数字人文的研究门径,经过实操训练初尝作为一名数字人文学者可能遭遇的挑战、收获寸步前进的惊喜,亦在彼此相携中收获合作的温馨与乐趣。

无论是对于学员自身,还是对于清华大学数字人文工作坊而言,这都是一个新的开始。“清华大学数字人文工作坊系列讲座”是北京市双一流项目资助的数字人文专题科研、教学和交流活动。下一期工作坊将以“现地研究”为主题,由简锦松教授主讲。