TLEX: An Efficient Method for Extracting Exact Timelines from TimeML Temporal Graphs

2024年06月07日
  • 简介
    时间轴提供了事件和时间的完全排序,对于许多自然语言理解任务非常有用。然而,可以直接从文本中派生出来的定性时间图(例如TimeML注释)通常只显式地揭示了事件和时间的部分顺序。在本文中,我们将先前解决点代数问题的工作应用于从TimeML注释文本中提取时间轴的任务,并开发了一种精确的端到端解决方案,称为TLEX(TimeLine EXtraction)。TLEX将TimeML注释转换为一个以主干和分支结构排列的时间轴集合。与先前的工作类似,TLEX检查并解决了时间图的一致性问题;但是,它增加了两个新的功能。首先,它确定了涉及不一致性的特定关系(然后可以手动更正),其次,TLEX执行了一种新的时间轴部分的识别方法,这对于下游任务(例如对齐来自不同时间轴的事件)非常重要。我们提供了TLEX算法组件的详细描述和分析,并通过将TLEX应用于来自四个语料库的385个TimeML注释文本进行实验评估。我们展示了123个文本不一致,181个文本有多个“真实世界”或主时间轴,并且在所有四个语料库中有2,541个不确定部分。采样评估表明,TLEX在五个维度上的准确率为98-100%,置信度为95%:时间点的排序,主时间轴的数量,时间点在主时间轴与从属时间轴上的位置,分支时间轴的连接点以及不确定部分的位置。我们提供了TLEX的参考实现,所有文本的提取时间轴以及不一致文本的手动更正。
  • 图表
  • 解决问题
    TLEX (TimeLine EXtraction) aims to extract timelines from TimeML annotated texts and solve the problem of partial orderings of events and times in qualitative temporal graphs.
  • 关键思路
    TLEX uses prior work on solving point algebra problems to transform TimeML annotations into a trunk-and-branch structure of timelines, while identifying specific relations involved in an inconsistency and sections of indeterminate order.
  • 其它亮点
    TLEX is evaluated on 385 TimeML annotated texts from four corpora, showing that 123 texts are inconsistent, 181 have more than one main timeline, and there are 2,541 indeterminate sections. The algorithm is 98-100% accurate with 95% confidence along five dimensions. TLEX provides a reference implementation, extracted timelines, and manual corrections of inconsistent texts.
  • 相关研究
    Related work includes prior work on solving point algebra problems, TimeML annotations, and extracting timelines from text. Some related papers include "Temporal annotation in the context of discourse" and "A flexible framework for temporal annotation".
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论