NetBench: A Large-Scale and Comprehensive Network Traffic Benchmark Dataset for Foundation Models

2024年03月15日
  • 简介
    在计算机网络中,网络流量是指在互联的计算机或物联网系统之间以数据包形式传输的数据量。监测和分析网络流量对于确保网络的性能、安全性和可靠性至关重要。然而,在网络流量分析中的一个重要挑战是处理包括密文和明文在内的多样化数据包。虽然许多方法已被采用来分析网络流量,但它们通常依赖于不同的数据集进行性能评估。这种不一致性导致了大量的手动数据处理工作和不公平的比较。此外,一些数据处理方法可能会由于训练和测试数据的不当分离而导致数据泄漏。为了解决这些问题,我们介绍了NetBench,这是一个大规模和全面的基准数据集,用于评估机器学习模型,特别是基础模型,在网络流量分类和生成任务中。NetBench基于七个公开可用的数据集,并涵盖了20个任务的广泛领域,包括15个分类任务和5个生成任务。此外,我们使用我们的基准测试评估了8个最先进的分类模型(包括两个基础模型)和两个生成模型。结果显示,基础模型在流量分类方面显著优于传统的深度学习方法。我们相信NetBench将促进各种方法之间的公平比较,并推动基础模型在网络流量方面的发展。我们的基准测试可在 https://github.com/WM-JayLab/NetBench 上获得。
  • 图表
  • 解决问题
    本论文旨在解决网络流量分析中数据处理不一致、数据泄露等问题,提出了一个大规模的基准数据集NetBench用于评估机器学习模型在网络流量分类和生成任务中的表现。
  • 关键思路
    NetBench数据集整合了七个公开数据集,包括20个任务,作者使用8个SOTA分类模型和2个生成模型进行评估,并发现基础模型在流量分类中表现优异。
  • 其它亮点
    NetBench数据集是一个大规模、全面的基准数据集,可用于评估机器学习模型在网络流量分类和生成任务中的表现。作者使用多个SOTA模型进行评估,发现基础模型在流量分类中表现更好。该数据集已经开源,可用于未来研究。
  • 相关研究
    在网络流量分析领域,最近的相关研究包括:《Traffic Classification Using Machine Learning: A Systematic Review》、《A Comprehensive Survey of Deep Learning for Traffic Forecasting in Internet of Things》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论