- 简介本文介绍了一种名为AraPoemBERT的阿拉伯语言模型,该模型是专门针对阿拉伯诗歌文本进行预训练的。阿拉伯诗歌具有丰富的语言特征和深刻的文化意义,这为自然语言处理领域提出了独特的挑战。为了准确分析其结构和上下文的复杂性,需要先进的计算模型。为了证明该模型的有效性,我们将AraPoemBERT与5种不同的阿拉伯语言模型进行了比较,并在与阿拉伯诗歌相关的各种自然语言处理任务中取得了最先进的结果。AraPoemBERT在两项新任务中均取得了前所未有的准确度,即诗人性别分类(99.34%准确度)和诗歌子节律分类(97.79%准确度)。此外,该模型在诗歌押韵分类(97.73%准确度)方面的准确度得分几乎等同于本研究中报告的最佳得分。此外,该模型在诗歌情感分析任务和诗歌节律分类任务中的表现显著优于以前的工作和其他比较模型,分别达到了78.95%和99.03%的准确度,并显着扩展了这两个问题的范围。本研究使用的数据集包含了来自在线资源的超过209万个诗句,每个诗句都与各种属性(如节律、子节律、诗人、押韵和主题)相关联。结果表明,该模型在理解和分析阿拉伯诗歌方面具有有效性,在多个任务中取得了最先进的结果,并且在研究中包括的以前的工作和其他语言模型中表现优异。AraPoemBERT模型已在\url{https://huggingface.co/faisalq}上公开发布。
- 图表
- 解决问题本论文旨在解决阿拉伯诗歌在自然语言处理(NLP)领域中的独特挑战,提出了一种仅在阿拉伯诗歌文本上进行预训练的阿拉伯语言模型AraPoemBERT,并在多个NLP任务上与其他5种阿拉伯语言模型进行了比较。
- 关键思路AraPoemBERT模型在阿拉伯诗歌分析方面取得了优异的性能,在两个新任务中实现了前所未有的准确性,并在情感分析和诗歌韵律分类等任务中显著优于以前的工作和其他比较模型。
- 其它亮点本论文使用了包含超过209万节诗句的数据集,每个诗句都与不同的属性(如韵律、子韵律、诗人、押韵和主题)相关联。AraPoemBERT模型在公开平台上可用。
- 最近在这个领域中,还有一些相关的研究,例如:《基于深度学习的阿拉伯语诗歌自动生成》、《阿拉伯语诗歌的情感分析:一种基于LSTM的深度学习方法》等。
沙发等你来抢
去评论
评论
沙发等你来抢