论文介绍
歌词生成一直是自然语言生成领域的一个非常流行的应用。以前的工作主要集中在根据几个属性或关键字生成歌词,对歌词内容的控制非常有限。在本文中,我们演示了QiuNiu,这是一种中文歌词生成系统,它以段落级文本而不是一些属性或关键字为条件。通过使用段落级文本作为输入,生成的歌词内容有望反映用户需求的细微差别。QiuNiu系统支持短篇小说、散文、诗歌等多种形式的篇章级输入。由于缺乏对齐的段落级文本到歌词语料库,它的训练是在无监督机器翻译的框架下进行的。我们使用自定义的预训练中文 GPT-2 模型初始化 QiuNiu 的参数,并采用两个步骤过程对模型进行微调,以更好地对齐段落级文本和歌词。此外,后处理模块用于过滤和重新排列生成的歌词,以选择最高质量的歌词。
论文地址
https://aclanthology.org/2022.acl-demo.7/
视频演示
https://youtu.be/OCQNzahqWgM