- 简介主题模型在过去几年中不断发展,从传统模型到最近的神经模型。然而,现有的主题模型通常在效果、效率或稳定性方面存在困难,严重阻碍了它们的实际应用。本文提出了FASTopic,一种快速、自适应、稳定和可转移的主题模型。FASTopic遵循一种新的范式:双语义关系重构(DSR)。DSR通过对文件、主题和单词嵌入之间的语义关系进行建模,通过重构发现潜在主题,而不是以前的传统、神经VAE或基于聚类的方法。这带来了一个简洁高效的主题建模框架。我们进一步提出了一种新颖的嵌入传输计划(ETP)方法。ETP明确地将语义关系规范为最优传输计划,而不是早期的简单方法。这解决了关系偏差问题,从而导致有效的主题建模。对基准数据集的广泛实验表明,与各种场景下的最先进基线相比,我们的FASTopic显示出卓越的效果、效率、适应性、稳定性和可转移性。我们的代码可在https://github.com/bobxwu/FASTopic上找到。
- 图表
- 解决问题论文旨在提出一种快速、自适应、稳定和可传递的主题模型,解决现有主题模型在效果、效率或稳定性方面存在的问题,以提高其实际应用性。
- 关键思路FASTopic提出了一种新的双语义关系重建(DSR)方法来发现潜在的主题,通过对文档、主题和词嵌入之间的语义关系进行建模来进行重建,从而实现了一个简洁高效的主题建模框架。论文进一步提出了一种新颖的嵌入传输计划(ETP)方法,将语义关系明确规范为最优传输计划,以解决关系偏差问题,从而实现有效的主题建模。
- 其它亮点论文通过对基准数据集的广泛实验表明,FASTopic在各种情况下都比现有的基准线表现出卓越的效果、效率、自适应性、稳定性和可传递性。论文代码可在https://github.com/bobxwu/FASTopic上获得。
- 最近在该领域中的相关研究包括:1.基于VAE的主题模型;2.基于聚类的主题模型;3.基于神经网络的主题模型。
沙发等你来抢
去评论
评论
沙发等你来抢