全面!灵活!统一!文本生成开源库TextBox推出2.0版本
"妙笔"生花:一个易用、高效的文本生成开源库,EMNLP 2022收录
随着预训练语言模型的快速发展,文本生成领域涌现出越来越丰富的模型和任务。TextBox 2.0 在原有版本的基础上,致力于构建一个统一、灵活、标准化的框架。为了更好地支持基于预训练语言模型的文本生成,我们构建了统一的端到端训练评测框架,数据加载、模型训练、结果评测分析一站式配齐。话不多说,一起来看看TextBox 2.0 中的更新亮点吧!
-
47种预训练语言模型/模块:涵盖通用文本生成、翻译、可控、对话、轻量化、提示、中文模型等各种类别。 -
13种文本生成任务:包括翻译、对话、问答、摘要、故事生成、风格迁移等各类生成任务。 -
83种数据集:包含统一处理后的各类文本生成任务中广泛使用的数据集,并提供了各个数据集的详细介绍。 -
17种评测指标:涵盖所有主流的评测方式,支持个性化选择和设置。 -
用户友好的pipeline:统一标准化的训练评测pipeline,简单设置,一键运行。 -
高效的训练策略:支持4种预训练目标和4种高效稳健的训练策略。
论文地址:https://arxiv.org/abs/2212.13005
项目Github地址:https://github.com/RUCAIBox/TextBox#2.0
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢