- 简介网络映射的过程可以揭示金融实体和服务提供商之间的关系。本文围绕德国基金招股书中的公司外包实践,介绍了一个专门用于命名实体识别和关系提取任务的数据集。三位专家对948个句子进行了标注,得到了4种实体类型(外包、公司、地点和软件)的5,969个注释和4,102个关系注释(外包-公司、公司-地点)。最先进的深度学习模型被训练出来识别实体并提取关系,显示出了初步的有希望的结果。数据集的匿名版本以及用于模型训练的指南和代码都可以在https://www.dfki.uni-kl.de/cybermapping/data/CO-Fun-1.0-anonymized.zip上公开获取。
- 图表
- 解决问题本论文旨在通过构建一个特定的数据集,解决基于金融实体和服务提供商的关系识别问题,以及验证深度学习模型在该任务上的效果。
- 关键思路论文的关键思路是通过构建一个针对金融实体关系识别的数据集,并使用深度学习模型进行实体识别和关系抽取。
- 其它亮点论文通过对948个句子进行标注,构建了一个包含四种实体类型和4102个关系标注的数据集。使用深度学习模型进行实体识别和关系抽取,并取得了良好的效果。该数据集已经开源,并提供了模型训练的代码和指南。
- 在该领域的相关研究包括:《A Survey of Named Entity Recognition and Classification》、《Relation Extraction: A Survey》等。
沙发等你来抢
去评论
评论
沙发等你来抢