Self-Consistency Training for Hamiltonian Prediction

2024年03月14日
  • 简介
    哈密顿预测是一种利用机器学习解决分子科学问题的多功能公式。然而,由于训练数据不足,其适用性受到限制。在这项工作中,我们强调哈密顿预测具有自洽性原则,并基于此提出了一种不需要标记数据的精确训练方法。这种优点解决了数据稀缺困难,并将该任务与其他物性预测公式区分开来,具有独特的优点:(1)自洽性训练使模型能够在大量未标记的数据上进行训练,从而大大增强了泛化能力;(2)自洽性训练比使用DFT标记数据进行监督训练更有效率,因为它是对一组分子结构的DFT计算的摊销。我们通过实验证明了数据稀缺和分布外情况下更好的泛化能力以及更好的摊销效率。这些优点推动了哈密顿预测在更大范围内的应用。
  • 图表
  • 解决问题
    本文旨在解决分子科学问题中标记数据不足的困境,提出了一种不需要标记数据的准确训练方法。作者认为哈密顿预测具有自洽原则,因此提出了自洽训练的方法,可以在大量未标记数据上进行训练,从而大大增强了泛化能力。
  • 关键思路
    本文的关键思路是提出了自洽训练的方法,利用哈密顿预测的自洽原则,不需要标记数据即可进行训练,从而提高了模型的泛化能力和训练效率。
  • 其它亮点
    本文的亮点包括:1. 提出了一种不需要标记数据的准确训练方法,可以在大量未标记数据上进行训练,从而大大增强了泛化能力;2. 自洽训练比使用DFT进行监督训练更加高效;3. 实验结果表明,该方法在数据稀缺和分布不均的情况下具有更好的泛化能力。本文使用了多个数据集进行实验,并开源了代码。
  • 相关研究
    相关研究包括:1. A. Tkatchenko等人提出的基于核势的机器学习方法;2. J. Behler等人提出的神经网络势能函数方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论