- 简介机器学习(ML)和传统量子化学(QC)计算方法的进展,使得从原子化能到激发能等范围内的QC属性具有高精度的ML模型。各种数据集,如MD17、MD22和WS22,其中包含在某种QC方法或保真度下计算的属性,已生成以对这些ML模型进行基准测试。保真度一词指所选QC方法对属性的实际真实值的准确度。保真度越高,计算的属性越准确,但计算成本也越高。在多保真度ML(MFML)方法方面的研究表明,训练ML模型的数据来自于多个数值QC方法,比单一保真度方法更有效。这个方向的研究正在不断推进,应用范围从能带间隙到激发能。这个领域有效研究的一个主要障碍是缺乏一个多样化的多保真度数据集进行基准测试。 在这里,我们提供了一个全面的多保真度数据集,该数据集来自于WS22分子构象。我们提供了量子化学多保真度(CheMFi)数据集,其中包括使用TD-DFT形式主义计算的五种保真度。这些保真度在其基组选择上有所不同,分别为:STO-3G、3-21G、6-31G、def2-SVP和def2-TZVP。CheMFi为社区提供了各种QC属性,包括垂直激发能、振子强度、分子偶极矩和基态能量。除了数据集外,还设置了最先进的MFML和优化的MFML多保真度基准测试。
- 图表
- 解决问题本论文旨在提供一个多保真度量子化学数据集,以用于多保真度机器学习模型的基准测试,解决当前该领域中缺乏多样化数据集的问题。
- 关键思路论文提出了一个名为CheMFi的多保真度量子化学数据集,其中包含五个不同保真度的量子化学属性,用TD-DFT方法计算,包括垂直激发能、振子强度、分子偶极矩和基态能量。该数据集可用于多保真度机器学习模型的基准测试。
- 其它亮点本论文提供的CheMFi数据集可用于多保真度机器学习模型的基准测试,具有较高的多样性和广泛的量子化学属性。实验结果表明,多保真度机器学习模型优于单保真度模型。此外,本论文还提供了最新的多保真度机器学习模型和优化多保真度机器学习模型的基准测试结果。
- 最近的相关研究包括使用多种QC方法生成多样性数据集的研究,以及利用多保真度机器学习模型进行各种QC属性预测的研究。例如,MD17、MD22和WS22数据集可用于QC属性预测的基准测试。
沙发等你来抢
去评论
评论
沙发等你来抢