FASTopic: A Fast, Adaptive, Stable, and Transferable Topic Modeling Paradigm

2024年05月28日
  • 简介
    主题模型在过去几年中不断发展,从传统模型到最近的神经模型。然而,现有的主题模型通常在效果、效率或稳定性方面存在困难,严重阻碍了它们的实际应用。本文提出了FASTopic,一种快速、自适应、稳定和可转移的主题模型。FASTopic遵循一种新的范式:双语义关系重构(DSR)。DSR通过对文件、主题和单词嵌入之间的语义关系进行建模,通过重构发现潜在主题,而不是以前的传统、神经VAE或基于聚类的方法。这带来了一个简洁高效的主题建模框架。我们进一步提出了一种新颖的嵌入传输计划(ETP)方法。ETP明确地将语义关系规范为最优传输计划,而不是早期的简单方法。这解决了关系偏差问题,从而导致有效的主题建模。对基准数据集的广泛实验表明,与各种场景下的最先进基线相比,我们的FASTopic显示出卓越的效果、效率、适应性、稳定性和可转移性。我们的代码可在https://github.com/bobxwu/FASTopic上找到。
  • 图表
  • 解决问题
    论文旨在提出一种快速、自适应、稳定和可传递的主题模型,解决现有主题模型在效果、效率或稳定性方面存在的问题,以提高其实际应用性。
  • 关键思路
    FASTopic提出了一种新的双语义关系重建(DSR)方法来发现潜在的主题,通过对文档、主题和词嵌入之间的语义关系进行建模来进行重建,从而实现了一个简洁高效的主题建模框架。论文进一步提出了一种新颖的嵌入传输计划(ETP)方法,将语义关系明确规范为最优传输计划,以解决关系偏差问题,从而实现有效的主题建模。
  • 其它亮点
    论文通过对基准数据集的广泛实验表明,FASTopic在各种情况下都比现有的基准线表现出卓越的效果、效率、自适应性、稳定性和可传递性。论文代码可在https://github.com/bobxwu/FASTopic上获得。
  • 相关研究
    最近在该领域中的相关研究包括:1.基于VAE的主题模型;2.基于聚类的主题模型;3.基于神经网络的主题模型。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论