[北大]严承希同学完成在哈佛的交换学习返回学校

[北京大学数字人文研究中心网站消息]严承希同学是北京大学数字人文实验室16级的情报学博士生,主要研究方向为自然语言处理、信息检索和数字 人文。严博士得到学校与项目组的博士生资助计划,于2019年9月15日至2020年9月14日期间赴美国哈佛大学量化社会研究中心(IQSS)中国历代人物传记资料数据库项目组(CBDB)进行访学学习,师从知名汉学家、哈佛大学东亚语言与文明系教授Peter K. Bol(包弼德)教授从事中华古籍文本的挖掘与分析工作。
blog-11
在此期间,严博士与包教授合作完成了基于混合门技术的古籍命名实体抽取模型的开发,与其他SOTA模型相比至少可以提高1.5%的F1值,相关研究发表在IEEE ACCESS期刊上;在CBDB前项目经理、IQSS研究员王宏甦的指导下完成了CBDB全文本查询系统,并开发了一种融合查询扩展技术与可视化交互技术的智能查询扩展组件。为了更好地提升在做人文学者使用计算机编程技术在CBDB数据库的课题探索和量化分析,严博士在2019年11月22日了分享了“基于python的CBDB数据库数据分析与挖掘”的报告,通过多个案例与重要的python开发包展现了数据清洗、数据查询、可视化以及社会网络分析等处理技术与方法的具体步骤与相关结果,
详细请见:
https://projects.iq.harvard.edu/chinesecbdb/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E5%92%8C%E4%B8%AD%E5%9B%BD%E5%8E%86%E4%BB%A3%E4%BA%BA%E7%89%A9%E4%BC%A0%E8%AE%B0%E8%B5%84%E6%96%99%E5%BA%93python-and-cbdb总的而言,在这次哈佛大学IQSS的访问学习过程中,严博士先后参加了哈佛大学多个跨专业课程的学习以及不同学科的学者与团队主持的工作坊和讨论会,在技术、方法和理论层面得到了显著提高,同时进一步拓展了研究国际研究视野。