THUNLP-AIPoet:诗歌自动生成模型及数据资源

“九歌”是清华大学自然语言处理与社会人文计算实验室(THUNLP)在负责人孙茂松教授带领下研发的中文诗歌自动生成系统。作为目前最好的中文诗歌生成系统之一,“九歌”曾于2017年登上央视一套大型科技类挑战节目《机智过人》第一季的舞台,与当代优秀青年诗人同台竞技比拼诗词创作。2017年上线至今,“九歌”已累计为用户创作超过1000万首诗词,并荣获全国计算语言学学术会议最佳系统展示奖(2017,2019)和最佳论文奖(2018)。“九歌”团队开源了AIPoet诗歌自动生成模型及数据资源,包含如下内容:

  1. 诗歌数据集:涵盖绝句数据、诗歌情感标注数据、格律韵表等资源。
  2. 诗歌生成模型:开源了包括风格诗歌生成、多关键词诗歌生成等模型。
  3. 预训练资源:基于大规模古诗文预训练的Masked Language Model。
  4. Poetry&AI 论文列表:收集整理了诗歌和AI交叉方向的论文。

官方网站:

http://nlp.csai.tsinghua.edu.cn/project/thunlp-aipoet%E8%AF%97%E6%AD%8C%E8%87%AA%E5%8A%A8%E7%94%9F%E6%88%90%E6%A8%A1%E5%9E%8B%E5%8F%8A%E6%95%B0%E6%8D%AE%E8%B5%84%E6%BA%90/