乐府作诗机

古人云:熟读唐诗三百首,不会写诗也会吟。 华为诺亚方舟实验室的研究表明,古人诚不我欺也。 中国古诗词意境深远、格律优美、朗朗上口,是中国文化中璀璨的明珠。但由于形式和内容上的 严格要求,普通人很难掌握写诗的技巧。 AI古诗词写作近年来成为很多研究者关注的话题,随着深度学习技术的成熟,一些优秀的中国古 诗词生成系统相继出现,如清华大学推出的古诗词写作系统【九歌】。 2018年,预训练语言模型在NLP领域取得了极大的成果,特别是GPT模型,在语言生成中表现出了 优异的性能。 我们首次将GPT模型应用于中国古诗词生成,提出了基于GPT模型的中国古诗词生成方法。我们研 究发现,GPT模型在中国古诗词生成上表现极为出色。 我们首先利用大规模中文新闻语料训练得 到一个中文GPT模型。然后我们对收集得到的大量中国古代诗歌、词、对联按照特定的格式进行 整理, 再将整理好的数据输入到GPT模型中进行微调(fine-tine),就得到了一个高质量的古诗 词生成系统,我们将它命名为【乐府】。乐府系统能够按照格律要求生成非常高质量的古诗、词 和对联。通过对训练数据的适当调整,我们还能够生成特定形式的藏头诗。 特别令人惊讶的是,我们对GPT模型没有进行任何定制修改,没有人工输入创作古诗所需要的字 数、韵律、平仄、对仗等任何知识, 没有定义任何这方面的特征,也没有输入任何人工编制的词 典,系统完全从语料中学到了作诗能力,掌握了这些复杂的作诗技巧。 我们将在这次视频中,向大家介绍乐府是如何训练的。大家也可以打开微信搜索“EI体验空间”或者扫描下方二维码亲自体验乐府作诗机。