SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation

2024年03月26日
  • 简介
    科学新闻报道是一座桥梁,能够巧妙地将复杂的研究文章翻译成与广大公众相关的报道。自动生成这样的叙述可以增强学术洞见的可访问性。本文介绍了一个新的语料库,以促进这种范式的发展。我们的语料库包括九个学科的学术出版物及其相应的科学新闻报道的平行编译。为了展示我们的数据集的实用性和可靠性,我们进行了广泛的分析,突出了科学新闻叙述和学术手稿之间的可读性和简洁性差异。我们使用最先进的文本生成模型对我们的数据集进行基准测试。评估过程涉及自动评估和人工评估,为未来探索自动生成科学新闻报道奠定了基础。与本文相关的数据集和代码可在https://dongqi.me/projects/SciNews上获得。
  • 作者讲解
  • 图表
  • 解决问题
    这篇论文旨在提高科学新闻报道的可读性,通过自动生成科学新闻报道来更好地传达学术研究成果。
  • 关键思路
    该论文提出了一个跨九个领域的平行语料库,用于训练文本生成模型,以自动生成科学新闻报道。
  • 其它亮点
    通过对比学术论文和科学新闻报道的可读性和简洁性,展示了该语料库的可靠性和实用性。使用了最先进的文本生成模型进行测试和评估,并进行了人工评估,为未来的自动生成科学新闻报道的研究奠定了基础。
  • 相关研究
    最近的相关研究包括文本生成和自然语言处理领域的研究,如《Attention Is All You Need》和《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》。
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问