spaCy 是具有工业级强度的 Python NLP 工具包,被称为最快的工业级自然语言处理工具。它支持多种自然语言处理的基本功能,主要功能包括分词、词性标注、词干化、命名实体识别、名词短语提取等。近日,spaCy v3.0 正式发布,这是一次重大更新。

spaCy v3.0 有以下特点:

  • 具有新的基于 transformer 的 pipeline,这使得 spaCy 的准确率达到了当前的 SOTA 水平;
  • 提供了新的 workflow 系统,帮助用户将原型变为产品;
  • pipeline 配置更加简单,训练 pipeline 也更加轻松;
  • 与 NLP 生态系统的其他部分有许多新的和改进的集成。

spaCy 3.0 更新文档地址:https://github.com/explosion/spaCy/releases/tag/v3.0.0

内容中包含的图片若涉及版权问题,请及时与我们联系删除