斯坦福｜用大型语言模型改进元数据质量

大模型

白羽中 2023-07-27 14:19 分享

以下文章来源于arxiv.org

Making Metadata More FAIR Using Large Language Models

Sowmya S. Sundaram, Mark A. Musen
[Stanford University]

用大型语言模型改进元数据质量

动机：随着全球实验数据成品的增加，以统一方式利用它们遇到的主要障碍是糟糕的元数据。
方法：提出一个自然语言处理(NLP)信息化的应用，FAIRMetaText，用来比较元数据。具体来说，FAIRMetaText分析元数据的自然语言描述，并提供了两个术语之间的数学相似性度量。
优势：所提出算法在公开可用的研究成果上定性和定量地展示了其效果，证明了通过深入研究各种大型语言模型，可以在与元数据相关的任务中取得大幅度的提升。

提出FAIRMetaText，一个自然语言处理应用，通过分析元数据的自然语言描述，为两个术语之间的数学相似性度量提供工具，有效地解决了元数据质量问题。

论文：https://arxiv.org/abs/2307.13085

内容中包含的图片若涉及版权问题，请及时与我们联系删除

点赞收藏评论分享到Link

评论列表

沙发等你来抢

去评论