最近大火的Instruction tuning为何频频受到称赞?经过这种方式精调大模型之后,是否可以提升大模型在NLI和阅读理解的表现?
本文作者将带你揭开谷歌Quoc V.Le团队提出精调新范式Instruction tuning的面纱。
前两天在Arxiv刷到个比较牛的论文题目:
Finetuned Language Models Are Zero-Shot Learners
论文链接:https://arxiv.org/pdf/2109.01652.pdf
是不是跟GPT-3有些像:
Language Models are Few-Shot Learners
以为是蹭热度,就没点进去,结果今天点进去仔细一看,居然出自Quoc V.Le团队:
于是我摆正心态,仔细看了之后还是发现不少东西。这个文章提出了一个Instruction tuning的概念,用这种方式精调大模型之后可以显著提升大模型在NLI和阅读理解的表现:
更重要的是!Open AI居然不谋而合,虽然没发论文,但也在官网放出了类似模型的Beta版本:
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢