OpenDebateEvidence: A Massive-Scale Argument Mining and Summarization Dataset

2024年06月20日
  • 简介
    我们介绍了OpenDebateEvidence,这是一个全面的数据集,用于从美国辩论社区收集的论证挖掘和摘要。该数据集包括超过350万篇具有丰富元数据的文档,使其成为最全面的辩论证据收集之一。OpenDebateEvidence捕捉了高中和大学辩论中的论点复杂性,为培训和评估提供了有价值的资源。我们进行了广泛的实验,证明了对最先进的大型语言模型进行微调,可以在各种方法、模型和数据集上进行论证性抽象摘要的有效性。通过提供这个全面的资源,我们旨在推进计算论证,并支持辩手、教育工作者和研究人员的实际应用。OpenDebateEvidence是公开可用的,以支持计算论证的进一步研究和创新。在这里访问它:https://huggingface.co/datasets/Yusuf5/OpenCaselist
  • 图表
  • 解决问题
    本论文旨在提供一个全面的辩论数据集,以支持计算论证的发展和实际应用。同时,论文探索了使用最先进的大型语言模型进行辩论摘要的效果。
  • 关键思路
    本论文的关键思路是使用辩论社区的数据集来提高计算论证的效果,并使用最先进的大型语言模型来进行辩论摘要。相比当前领域的研究,这篇论文的思路在于使用辩论社区的数据集来提高计算论证的效果,这是一个新的尝试。
  • 其它亮点
    本论文提供了一个包含超过350万个文档的全面的辩论数据集,并使用了最先进的大型语言模型来进行辩论摘要。实验结果表明,该方法在各种方法、模型和数据集上都具有很高的效果。此外,该数据集对于辩手、教育工作者和研究人员来说都是非常有价值的资源。该数据集已公开发布以支持进一步的研究和创新。
  • 相关研究
    最近在这个领域中,还有一些相关的研究被进行。例如,Biran等人在2017年的论文“Argument Generation with Retrieval, Planning, and Realization”中探讨了使用检索、规划和实现来生成论点的方法。另外,Stab和Gurevych在2017年的论文“Parsing Argumentation Structures in Persuasive Essays”中介绍了一种用于解析论点结构的方法。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论