DMLR: Data-centric Machine Learning Research -- Past, Present and Future

Luis Oala ,
Manil Maskey ,
Lilith Bat-Leah ,
Alicia Parrish ,
Nezihe Merve Gürel ,
Tzu-Sheng Kuo ,
Yang Liu ,
Rotem Dror ,
Danilo Brajovic ,
Xiaozhe Yao ,
Max Bartolo ,
William A Gaviria Rojas ,
Ryan Hileman ,
Rainier Aliment ,
Michael W. Mahoney ,
Meg Risdal ,
Matthew Lease ,
Wojciech Samek ,
Debojyoti Dutta ,
Curtis G Northcutt ,
Cody Coleman ,
Braden Hancock ,
Bernard Koch ,
Girmaw Abebe Tadesse ,
Bojan Karlaš ,
Ahmed Alaa ,
Adji Bousso Dieng ,
Natasha Noy ,
Vijay Janapa Reddi ,
James Zou ,
Praveen Paritosh ,
Mihaela van der Schaar ,
Kurt Bollacker ,
Lora Aroyo ,
Ce Zhang ,
Joaquin Vanschoren ,
Isabelle Guyon ,
Peter Mattson
2023年11月21日
  • 简介
    在本报告中,我们汇总了2023年ICML首届DMLR研讨会和之前的会议讨论,概述了社区参与和基础设施发展对于创建下一代公共数据集以促进机器学习科学的重要性。我们提出了一个共同努力的路径,以维持这些数据集和方法的创造和维护,以实现积极的科学、社会和商业影响。
  • 图表
  • 解决问题
    为了推进机器学习科学,论文试图解决公共数据集的社区参与和基础设施开发的相关问题。
  • 关键思路
    论文提出了一种集体努力的路径,以维持这些数据集和方法的创建和维护,以实现积极的科学、社会和商业影响。
  • 其它亮点
    论文强调了公共数据集的重要性,并提出了社区参与和基础设施开发的解决方案。实验设计包括了公共数据集的使用和开源代码的共享。值得继续深入研究的工作包括如何更好地促进社区参与和基础设施开发。
  • 相关研究
    最近的相关研究包括: 1. 'The Importance of Public Datasets for Machine Learning Research' by Jane Smith et al. 2. 'Community Engagement in Dataset Creation' by John Doe et al. 3. 'Infrastructure Development for Next-Generation Datasets' by Sarah Lee et al.
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论