Insights from an experiment crowdsourcing data from thousands of US Amazon users: The importance of transparency, money, and data use

2024年04月19日
  • 简介
    数字平台上用户生成的数据对于研究人员和倡导者来说是揭示数字不平等、审计算法和理解人类行为的重要资源。然而,数据访问通常受到限制。研究人员如何在有效和道德的前提下收集用户数据?本文分享了一种创新的方法,通过众包收集超过5000名美国用户5年的亚马逊购买历史记录,这些数据通常无法获取。我们开发了一种数据收集工具,优先考虑参与者同意,并包括实验研究设计。该设计允许我们研究隐私感知和数据共享行为的多个方面。实验结果(N=6325)显示,透明度和货币激励都可以显著增加数据共享。年龄、种族、教育和性别也起到了作用,女性和受教育程度较低的参与者更有可能共享数据。我们的研究设计使我们能够独特地评估“隐私悖论”,即用户声称比实际更重视隐私。我们设置了真实和假设的数据共享情境,并发现在这些情境下共享率存在可衡量的相似和不同之处。例如,在真实情境下,增加货币激励对共享率的影响高达6倍。此外,我们研究了参与者对各种第三方如何使用数据的意见,同样发现人口统计学对此有显著影响。值得注意的是,大多数参与者不赞成政府机构使用购买数据,但大多数人赞成研究人员使用。总的来说,我们的研究强调了透明度、激励设计和用户人口统计学在道德数据收集实践中的关键作用,并为寻求众包用户生成数据的未来研究人员提供了指导。
  • 图表
  • 解决问题
    如何在保证研究伦理的前提下有效地收集用户数据?本论文通过开发一种数据收集工具,并采用实验研究设计,来解决这一问题。
  • 关键思路
    透明度和经济激励可以显著提高数据分享率。同时,用户的年龄、种族、教育程度和性别也会影响数据分享率。论文提供了未来研究者进行伦理数据收集的指导。
  • 其它亮点
    本论文通过众包的方式收集了5000多位美国用户5年的亚马逊购买历史数据,并进行了实验研究。实验结果显示,透明度和经济激励可以显著提高数据分享率。论文还研究了用户对数据使用的态度,并发现用户对政府机构使用购买数据持反对态度,但对研究者使用购买数据持赞成态度。
  • 相关研究
    在这个领域中,最近的相关研究包括《The Privacy Paradox: The Privacy Attitudes, Behaviors, and Concerns of Facebook Users》和《The Ethics of Using Hacked Data: Patreon's Data Hack and Academic Data Standards》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论