得益于算法、算力和数据这三驾马车,人工智能在2006年后获得了巨大的发展。近日,来自谷歌的研究员在一篇题为“Everyone wants to do the model work, not the data work”的论文中指出:数据质量在AI中起到的作用正在被低估,数据质量在高风险AI应用中十分重要,尤其是对癌症检测、野生生物偷猎等下游任务中巨大。
上述结果是谷歌研究员通过与印度、东非和西非国家以及美国的53位AI从业者进行对话得来。研究员表示,这份访谈报告为“低估数据质量在AI模型中的作用”提供了经验证据。此外,报告还得出了另一个有趣的结论:每个人都想做模型工作,而不是数据工作,许多从业者将数据工作描述为“耗时且无法追溯的工作”。
为了更清楚的说明问题,研究员还定义了数据库级联(data cascades)这一概念,即因数据问题产生负面和下游影响的复合事件,且数据级联有不透明、触发者、负面影响等特点。
感兴趣的可以继续戳原文。
内容中包含的图片若涉及版权问题,请及时与我们联系删除


评论
沙发等你来抢