- 简介移动应用程序的广泛使用推动了该行业的增长,公司在定向广告和个性化服务等服务中严重依赖用户数据。在这种情况下,隐私法规(如《通用数据保护条例》)发挥着至关重要的作用。GDPR的要求之一是公司必须维护一份“处理活动记录”(RoPA)。RoPA包括各种细节,包括数据处理活动的描述、目的、涉及的数据类型和其他相关外部实体。由于资源限制和紧迫的时间表,小型应用程序开发公司在满足这些合规要求方面面临着挑战。为了帮助这些开发人员并避免罚款,我们提出了一种使用大型语言模型(LLMs)从用户编写的使用场景生成RoPA片段的方法。我们的方法采用了GPT-3.5 Turbo的少样本学习来总结使用场景并生成RoPA片段。我们评估了影响我们总结任务的少样本学习性能一致性的不同因素,包括少样本学习提示中的示例数量、重复和示例的顺序排列。我们的研究结果强调了提示中示例数量对总结F1分数的显着影响,同时证明了在多个提示重复中F1分数的可忽略变化。我们的提示实现了成功的处理活动总结,平均ROUGE-L F1分数为70%。最后,我们讨论了通过手动评估生成的摘要来改进结果的途径。
- 图表
- 解决问题使用大型语言模型生成RoPA摘要以满足GDPR要求的小型应用程序开发公司的合规性需求
- 关键思路使用GPT-3.5 Turbo的少量样本学习,将用户编写的使用场景摘要生成RoPA摘要
- 其它亮点通过多个实验,发现少量样本学习提示中的示例数量对于摘要F1分数具有重要影响,但对于F1分数的重复性影响微乎其微。该方法的平均ROUGE-L F1分数为70%。
- 最近的相关研究包括使用自然语言处理技术生成RoPA的研究,例如“Automated Generation of Process Documentation Using Natural Language Processing Techniques”和“Generating Privacy Policy Summaries Using Deep Learning”。
沙发等你来抢
去评论
评论
沙发等你来抢