Extracting chemical food safety hazards from the scientific literature automatically using large language models

2024年05月01日
  • 简介
    食品安全领域发表的科学文章数量在过去几十年中一直在不断增加。因此,食品安全专家无法阅读与食品安全和食品链中危害发生有关的所有相关文献已经成为不可行的。然而,食品安全专家了解最新发现并能够轻松简洁地获取这些信息非常重要。本研究提出了一种通过大型语言模型自动提取科学文献中的化学危害的方法。大型语言模型直接应用于科学摘要,无需对模型进行额外的训练或使用大型计算集群。测试了三种不同的提示模式以评估哪种对于完成任务最为优化。这些提示使用两种验证食品(叶菜和贝类)进行了优化,并使用三种测试食品(乳制品、玉米和鲑鱼)评估了最佳提示的最终性能。发现提示的具体措辞对结果有相当大的影响,将任务分解成较小的步骤的提示总体表现最佳。该提示的平均准确率达到了93%,包含了许多已包含在食品监测计划中的化学污染物,验证了成功检索与食品安全领域相关的危害的可行性。结果展示了大型语言模型在从科学文献中自动提取信息的任务中可以发挥的巨大价值。
  • 作者讲解
  • 图表
  • 解决问题
    自动从科学文献中提取化学危害物的任务对于食品安全专家来说非常困难,因为相关文献数量不断增加,本文旨在通过大型语言模型自动提取化学危害物。
  • 关键思路
    本文使用大型语言模型自动提取化学危害物,无需额外训练模型或大型计算集群。通过测试三种不同的提示方式,最终找到了一种最优的提示方式,平均准确率达到93%。
  • 其它亮点
    本文展示了大型语言模型在从科学文献中自动提取信息方面的价值。实验设计合理,并使用了两个验证食品和三个测试食品。最终找到的最优提示方式的准确率高达93%。本文的方法可以用于食品安全领域的相关研究。
  • 相关研究
    最近的相关研究包括使用机器学习方法对食品安全进行分类和预测的研究,以及使用自然语言处理技术提取食品安全信息的研究。例如,"A Machine Learning Approach to Food Safety Prediction"和"Natural Language Processing Techniques for Food Safety Information Extraction"。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问