介绍一篇最近由斯科普里大学计算机科学与工程学院Riste Stojanov等人发表在J MED INTERNET RES杂志上的文章。文章研究了最近发布的基于Transformer的双向编码表示(BERT)模型,该模型在信息提取方面提供了最先进的结果,可以对食品信息提取进行微调。

论文标题:A Fine-Tuned Bidirectional Encoder Representations From Transformers Model for Food Named-Entity Recognition: Algorithm Development and Validation

论文地址:https://www.jmir.org/2021/8/e28229

本文引入了一个可用于食物信息提取的微调BERT模型,称为FoodNER。它是使用预定义的BERT模型开发的,该模型可以是原始BERT或BioBERT的某些变体。使用它们,对FoodBase语料库进行微调,以解决几个不同的任务:食品或非食品实体和4种可区分的食品实体,取决于获取语义标签的语义资源。FoodNER的流程图如下图所示。

在本研究中,我们使用FoodBase ground truth语料库建立和评估FoodNER模型,用于区分食品与非食品实体,以及区分与Hansard语义标签相关的食品实体。

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除