基于机器学习的统计工具正在融入化学研究的工作流程。本文讨论了训练可靠、可重复和可再生模型的所需要素,并为机器学习报告推荐了一套指南。

论文链接:https://www.nature.com/articles/s41557-021-00716-z

本文的目的是提出一个“最佳实践”标准,以确保统计学习开发模型的鲁棒性,以及观察效果的可重复性。希望相关的清单(如下图)对作者、审稿人和读者有用,以指导机器学习模型的训练和报告的批判性评估,并提供一定程度的标准化。建议出版商可以在此清单的帮助下为机器学习手稿的提交制定指南和可重复性的规范。也希望众多科学家将带头开展这项运动,并主动提供机器学习清单来支撑论文。

内容中包含的图片若涉及版权问题,请及时与我们联系删除