作者:Yousef El-Kurdi, Jerry Quinn, Avirup Sil

简介: 本文研究动态调整量化限幅以保持合理精度的基于统计的鲁棒算法。本文引入了一种新的运行时方法、用于显著减少与将BERT类模型量化为八位整数相关的精度损失。现有的量化模型的方法要么修改训练过程,要么需要额外的校准步骤来调整参数,这也需要选定的保持数据集。作者的方法允许在不需要这些调整的情况下利用量化。作者给出了多个NLP任务的结果,证明了该技术的有用性。

论文下载:https://arxiv.org/pdf/2211.09744.pdf

内容中包含的图片若涉及版权问题,请及时与我们联系删除