FoodSky: A Food-oriented Large Language Model that Passes the Chef and Dietetic Examination

2024年06月11日
  • 简介
    食物是人类生命的基石,不仅是营养的来源,也是文化认同和社交互动的基石。随着全球饮食需求和偏好的复杂性增加,需要食品智能来实现对各种任务的食品知觉和推理,包括食谱生成、饮食建议、饮食疾病相关性发现和理解。为了实现这一目标,在大型语言模型(LLMs)的各个领域和任务中具有强大能力,我们介绍了面向食品的LLM FoodSky,通过感知和推理来理解食品数据。考虑到中国菜肴的复杂性和典型性,我们首先从各种权威来源构建了一个全面的中国食品语料库FoodEarth,这可以被FoodSky利用来实现对食品相关数据的深入理解。然后,我们提出了基于主题的选择性状态空间模型(TS3M)和分层主题检索增强生成(HTRAG)机制,以增强FoodSky在捕捉细粒度的食品语义和生成上下文感知的食品相关文本方面的能力。我们广泛的评估表明,FoodSky在厨师和饮食考试中都显著优于通用LLMs,在中国国家厨师考试和国家饮食考试中的准确率分别为67.2%和66.4%。FoodSky不仅有望增强烹饪创意和促进更健康的饮食习惯,还为解决食品领域的复杂实际问题设定了新的领域特定LLMs标准。FoodSky的在线演示可在http://222.92.101.211:8200上获得。
  • 图表
  • 解决问题
    FoodSky旨在通过感知和推理来理解食物数据,以实现各种任务的强大能力,例如食谱生成和饮食建议。
  • 关键思路
    论文提出了基于主题的选择状态空间模型(TS3M)和分层主题检索增强生成(HTRAG)机制,以增强FoodSky在捕捉细粒度的食品语义和生成上下文感知的食品相关文本方面的能力。
  • 其它亮点
    FoodSky在厨师和饮食考试中的准确性分别为67.2%和66.4%,明显优于通用的LLMs。论文构建了一个综合的中国食品语料库FoodEarth,可用于FoodSky实现对食品相关数据的深入理解。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,例如:《基于深度学习的食品图像识别综述》、《利用深度学习技术进行食品分类和检测的研究》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论