NetMamba: Efficient Network Traffic Classification via Pre-training Unidirectional Mamba

2024年05月19日
  • 简介
    网络流量分类是一个关键的研究领域,旨在提高服务质量、简化网络管理和加强网络安全。为了解决传输加密技术日益复杂的问题,已经提出了各种机器学习和深度学习方法。然而,现有方法面临两个主要挑战。首先,由于广泛使用的Transformer架构的二次复杂度,它们在模型效率方面存在困难。其次,由于舍弃重要的字节信息而保留不必要的偏见,它们在流量表示方面存在不足。为了解决这些问题,我们提出了NetMamba,一种高效的线性时间状态空间模型,配备了全面的流量表示方案。我们采用了专门选择和改进的单向Mamba架构,而不是Transformer,来解决效率问题。此外,我们设计了一种流量表示方案,从海量流量数据中提取有效信息,同时删除有偏见的信息。对六个公共数据集进行的评估实验涵盖了三个主要的分类任务,展示了NetMamba相对于最先进的基线模型的优越分类性能。它在所有任务中都实现了近乎99%(有些超过99%)的准确率。此外,NetMamba表现出优秀的效率,将推理速度提高了多达60倍,同时保持相对较低的内存使用率。此外,NetMamba展现了出色的少样本学习能力,使用更少的标记数据实现更好的分类性能。据我们所知,NetMamba是第一个为网络定制Mamba架构的模型。
  • 图表
  • 解决问题
    NetMamba论文试图解决网络流量分类中的两个主要问题:基于Transformer的模型效率低下和流量表示不充分。同时,论文也旨在验证NetMamba模型的性能是否优于当前最先进的模型。
  • 关键思路
    NetMamba采用了一种线性时间状态空间模型,配备了一种全面的流量表示方案,以解决模型效率和流量表示的问题。与Transformer相比,NetMamba采用了一种特别选定和改进的单向Mamba架构,以提高效率。此外,NetMamba的流量表示方案能够从海量流量数据中提取有效信息并消除偏差。
  • 其它亮点
    论文在六个公共数据集上进行了评估实验,展示了NetMamba相对于最先进的基线模型的卓越分类性能,所有任务的准确率均接近99%。此外,NetMamba表现出出色的效率和few-shot学习能力,并且开源了代码。值得进一步研究的工作包括将NetMamba模型应用于其他网络任务。
  • 相关研究
    最近的相关研究包括:《Deep Packet: A Novel Approach for Encrypted Traffic Classification Using Deep Learning》、《A Survey of Deep Learning for Scientific Discovery》、《A Comprehensive Survey of Deep Learning for Image Captioning》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论