Automated Text Identification Using CNN and Training Dynamics

简介

我们使用数据地图对AuTexTification数据集进行建模和表征。这提供了有关训练期间单个样本行为（训练动态）的见解。我们通过置信度、可变性和正确性这三个维度对样本进行了表征。这显示出三个区域：易于学习、模糊和难以学习的示例。我们使用经典的CNN架构，并发现仅在模糊示例子集上训练模型可以提高模型的超出分布泛化能力。
图表
解决问题

该论文旨在通过使用数据映射来建模和表征AuTexTification数据集，以提供有关训练期间个别样本行为的见解。同时，该论文试图验证只对模糊样本进行训练是否可以提高模型的分布外泛化能力。
关键思路

该论文的关键思路是通过使用数据映射将样本在置信度、可变性和正确性三个维度上进行表征，以揭示易于学习、模糊和难以学习的示例。同时，通过仅对一部分模糊样本进行训练，可以提高模型的分布外泛化能力。
其它亮点

该论文的实验使用了经典的CNN架构，并发现仅对模糊样本进行训练可以提高模型的分布外泛化能力。论文还提供了有关训练动态的见解，并提供了数据集的建模和表征方法。该论文的数据集和代码已经开源，这为后续的研究提供了便利。
相关研究

在这个领域中，最近的相关研究包括《A survey on deep learning for named entity recognition》、《A comprehensive survey on graph neural networks》等。

PDF

原文

点赞收藏评论分享到Link

沙发等你来抢

去评论