Simfluence 是训练数据归因(TDA)的新范式,模拟训练过程来仿真单个训练样本对模型预测的影响,产生比现有TDA方法更准确的结果。
Simfluence: Modeling the Influence of Individual Training Examples by Simulating Training Runs
K Guu, A Webson, E Pavlick, L Dixon, I Tenney, T Bolukbasi
[Google Research]
Simfluence: 通过模拟训练过程对单个训练样本影响进行建模
要点:
-
Simfluence 为训练数据归因(TDA)提出一种新范式,模拟训练过程,以更好地捕捉有影响力的训练样本之间的高度非加性交互; -
Simfluence 使用户能回答关于模型在不同训练课程下会学到什么的反事实问题,并直接看到训练中的学习会在哪里发生; -
Simfluence-Linear 是一个捕捉非加性交互的模拟器,能够以惊人的保真度预测单个样本损失的尖锐轨迹; -
在大型语言模型微调实验中,Simfluence 预测损失轨迹的准确度远远高于现有的 TDA 方法,平均平方误差减少了 75%,Spearman 的相关度增加了一倍。
https://arxiv.org/abs/2303.08114
评论
沙发等你来抢