How to Understand Named Entities: Using Common Sense for News Captioning

2024年03月11日
  • 简介
    新闻标题的目的是通过新闻文章正文来描述一张图片。它主要依赖于一组检测到的命名实体,包括现实世界中的人物、组织和地点。本文利用常识知识来理解新闻标题中的命名实体。所谓“理解”,是指将新闻内容与野外常识相关联,从而帮助代理人区分语义上相似的命名实体,并使用训练语料库之外的词语来描述命名实体。我们的方法由三个模块组成:(a)过滤模块旨在从两个方面澄清关于命名实体的常识:它是什么?它与什么相关?这将常识分为解释性知识和相关知识。 (b)区分模块从节点度、依赖和区分三个方面聚合解释性知识,以区分语义上相似的命名实体。 (c)丰富模块将相关知识附加到命名实体上,通过常识信息(例如身份和社会地位)丰富实体描述。最后,两个模块的概率分布被整合以生成新闻标题。在两个具有挑战性的数据集(GoodNews和NYTimes)上进行的大量实验证明了我们方法的优越性。消融研究和可视化进一步验证了它在理解命名实体方面的有效性。
  • 图表
  • 解决问题
    论文旨在通过利用常识知识来理解新闻标题中的命名实体,以提高新闻标题的质量和描述能力。
  • 关键思路
    通过三个模块来实现命名实体的理解:Filter Module用于澄清命名实体的常识含义和相关性,Distinguish Module用于区分语义相似的命名实体,Enrich Module用于丰富命名实体的描述。
  • 其它亮点
    论文在GoodNews和NYTimes数据集上进行了广泛的实验,并证明了其方法的优越性。论文还进行了消融实验和可视化,验证了其方法的有效性。
  • 相关研究
    在这个领域中,还有一些相关研究,例如:"A Survey on Commonsense Knowledge Graphs: Construction, Acquisition and Applications","Commonsense Knowledge Enhanced Named Entity Recognition with Neural Machine Translation"等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论