【标题】Automating DBSCAN via Deep Reinforcement Learning

【作者团队】Ruitong Zhang, Hao Peng, Yingtong Dou, Jia Wu, Qingyun Sun, Jingyi Zhang, Philip S. Yu

【发表日期】2022.8.9

【DEMO 链接】https://github.com/RingBDStack/DRL-DBSCAN

【论文链接】https://arxiv.org/pdf/2208.04537.pdf

【推荐理由】DBSCAN因其简单实用而被广泛应用于许多科学和工程领域。然而,由于其高灵敏度参数,聚类结果的准确性在很大程度上取决于实践经验。本文首先提出了新颖的深度强化学习引导的自动 DBSCAN 参数搜索框架,即 DRL-DBSCAN。该框架通过将聚类环境感知为马尔可夫决策过程来模拟调整参数搜索方向的过程,其目的是在没有人工帮助的情况下找到最佳的聚类参数。DRL-DBSCAN 使用弱监督奖励训练策略网络通过与集群交互来学习不同特征分布的最优聚类参数搜索策略。此外,还提出了由数据规模驱动的递归搜索机制,以有效且可控地处理大参数空间。基于提出的四种工作模式,对五个人工和真实世界的数据集进行了广泛的实验。离线和在线任务的结果表明,DRL-DBSCAN不仅能持续将DBSCAN的聚类准确率分别提高26%和25%,而且可以稳定地找到优势参数,计算效率高。

内容中包含的图片若涉及版权问题,请及时与我们联系删除