大规模语言模型已经被证明可以很好的应用到小样本学习任务,例如 OpenAI 提出的 GPT-3 在小样本(few-shot)场景上取得了不错的性能,但是在零样本(zero-shot)学习任务中表现不是很突出。为了提升模型的泛化能力和通用能力,一种新范式诞生了——Instruction Tuning,通过以 Instrcution 为指导的大量任务进行学习,提升在未知任务的性能。

本文首先介绍下 Instruction Tuning 与之前比较火的 Prompt tuning 方法的区别。最后介绍了四篇Instruction Tuning相关的论文。

01. FLAN

论文标题:

Finetuned Language Models Are Zero-Shot Learners

论文链接:

https://arxiv.org/abs/2109.01652

02. T0

论文标题:

Multitask Prompted Training Enables Zero-Shot Task Generalization

论文链接:

https://arxiv.org/abs/2110.08207

03. InstructGPT

论文标题:

Training language models to follow instructions with human feedback

论文链接:

https://arxiv.org/abs/2203.02155

04. Natural-Instructions v2

论文标题:

Benchmarking Generalization via In-Context Instructions on 1,600+ Language Tasks

论文链接:

https://arxiv.org/abs/2204.07705

内容中包含的图片若涉及版权问题,请及时与我们联系删除