大家好,这里是 NewBeeNLP。ChatGPT 大火,今天聊聊其模型训练的一个关键词:Human in the loop。
这篇文章基于一篇 Survey,就是如何将人类的反馈放在 NLP 过程中,这个过程可以是训练,也可以是部署后,也可以是数据标注阶段。总之,它泛指把人类的反馈与 NLP 过程结合。

论文:Putting Humans in the Natural Language Processing Loop: A Survey
在正式开始前,我们需要先说明几个业界常用的概念:
-
HITL:Human in the loop 的简称,将人置于循环迭代 -
HCI:Human machine interaction 的简称,人机互动
首先要说的是动机——HITL 有啥用,为啥要 HITL?两个很重要的原因:
-
提升模型效果(分类、对话和 QA 等)和泛化能力。 -
提升模型可解释性和可用性(用户创建的特征词典、QA 中用户生成的对抗 Q 等)并提升用户体验。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢