PAE: LLM-based Product Attribute Extraction for E-Commerce Fashion Trends

2024年05月27日
  • 简介
    产品属性提取是电子商务业务中一个不断发展的领域,包括产品排名、产品推荐、未来的组合规划和改善在线购物客户体验等多个应用。了解客户需求是在线业务的关键部分,特别是对于时尚产品。零售商使用组合规划来确定在每个店铺和渠道中提供的产品组合,以保持对市场动态的响应,并管理库存和目录。目标是通过正确的渠道提供合适的款式、尺码和颜色。当购物者找到满足他们需求和欲望的产品时,他们更有可能返回进行未来的购买,从而促进客户忠诚度。产品属性是组合规划的关键因素。本文提出了PAE,一种用于未来趋势报告的产品属性提取算法,其中包括PDF格式的文本和图像。大多数现有方法侧重于从标题或产品描述中提取属性,或利用现有产品图像的视觉信息。与之前的工作相比,我们的工作侧重于从PDF文件中提取属性,其中解释了即将到来的时尚趋势。本文提出了一个更全面的框架,充分利用不同的模态进行属性提取,帮助零售商提前规划组合。我们的贡献有三个方面:(a) 我们开发了PAE,一个从非结构化数据(文本和图像)中提取属性的高效框架;(b) 我们提供了基于BERT表示的目录匹配方法,以发现使用即将到来的属性值的现有属性;(c) 我们进行了大量实验,使用几个基准测试,并展示PAE是一种有效、灵活且与现有最先进的属性值提取任务的框架相当或更好(avg 92.5% F1-Score)。
  • 作者讲解
  • 图表
  • 解决问题
    本论文旨在解决电子商务中的产品属性提取问题,特别是针对时尚产品的未来趋势报告,提出一种从PDF文件中提取产品属性的算法,以帮助零售商提前规划产品组合。
  • 关键思路
    本文提出了一个全面利用文本和图像的框架,以从未结构化的数据中提取属性。同时,使用基于BERT表示的目录匹配方法,发现现有属性并使用即将到来的属性值。相比现有方法,该框架在属性值提取任务上表现出更高的效率和灵活性。
  • 其它亮点
    本文提出的PAE算法是一种有效、灵活且优于现有技术的产品属性提取框架。实验结果表明,该算法的F1-Score平均达到92.5%。此外,本文还提供了目录匹配方法和数据集,以及开源代码,为后续研究提供了便利。
  • 相关研究
    与本文相关的研究包括:基于标题或产品描述的属性提取方法、利用现有产品图像的视觉信息提取方法等。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问