CO-Fun: A German Dataset on Company Outsourcing in Fund Prospectuses for Named Entity Recognition and Relation Extraction

2024年03月22日
  • 简介
    网络映射的过程可以揭示金融实体和服务提供商之间的关系。本文围绕德国基金招股书中的公司外包实践,介绍了一个专门用于命名实体识别和关系提取任务的数据集。三位专家对948个句子进行了标注,得到了4种实体类型(外包、公司、地点和软件)的5,969个注释和4,102个关系注释(外包-公司、公司-地点)。最先进的深度学习模型被训练出来识别实体并提取关系,显示出了初步的有希望的结果。数据集的匿名版本以及用于模型训练的指南和代码都可以在https://www.dfki.uni-kl.de/cybermapping/data/CO-Fun-1.0-anonymized.zip上公开获取。
  • 图表
  • 解决问题
    本论文旨在通过构建一个特定的数据集,解决基于金融实体和服务提供商的关系识别问题,以及验证深度学习模型在该任务上的效果。
  • 关键思路
    论文的关键思路是通过构建一个针对金融实体关系识别的数据集,并使用深度学习模型进行实体识别和关系抽取。
  • 其它亮点
    论文通过对948个句子进行标注,构建了一个包含四种实体类型和4102个关系标注的数据集。使用深度学习模型进行实体识别和关系抽取,并取得了良好的效果。该数据集已经开源,并提供了模型训练的代码和指南。
  • 相关研究
    在该领域的相关研究包括:《A Survey of Named Entity Recognition and Classification》、《Relation Extraction: A Survey》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论