Simfluence: 通过模拟训练过程对单个训练样本影响进行建模

ML

论文

白羽中 2023-03-16 09:41 分享

以下文章来源于arxiv.org

Simfluence 是训练数据归因(TDA)的新范式，模拟训练过程来仿真单个训练样本对模型预测的影响，产生比现有TDA方法更准确的结果。

Simfluence: Modeling the Influence of Individual Training Examples by Simulating Training Runs

K Guu, A Webson, E Pavlick, L Dixon, I Tenney, T Bolukbasi
[Google Research]

Simfluence: 通过模拟训练过程对单个训练样本影响进行建模

要点:

Simfluence 为训练数据归因(TDA)提出一种新范式，模拟训练过程，以更好地捕捉有影响力的训练样本之间的高度非加性交互；
Simfluence 使用户能回答关于模型在不同训练课程下会学到什么的反事实问题，并直接看到训练中的学习会在哪里发生；
Simfluence-Linear 是一个捕捉非加性交互的模拟器，能够以惊人的保真度预测单个样本损失的尖锐轨迹；
在大型语言模型微调实验中，Simfluence 预测损失轨迹的准确度远远高于现有的 TDA 方法，平均平方误差减少了 75%，Spearman 的相关度增加了一倍。

https://arxiv.org/abs/2303.08114

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

评论列表

沙发等你来抢

去评论