Image Coding for Machines with Edge Information Learning Using Segment Anything

2024年03月07日
  • 简介
    本文介绍了一种名为“图像编码机器(ICM)”的图像压缩技术,用于图像识别。由于对图像识别人工智能的需求不断增长,这种技术变得至关重要。本文提出了一种名为SA-ICM的ICM方法,该方法专注于仅对图像中物体部分的边缘信息进行编码和解码。该方法是使用Segment Anything创建的边缘信息训练的“学习图像压缩(LIC)”模型。我们的方法可用于具有各种任务的图像识别模型。SA-ICM对输入数据的变化也很鲁棒,因此对于各种用例都很有效。此外,我们的方法从隐私角度提供了好处,因为它在编码器端删除人脸信息,从而保护隐私。此外,该LIC模型训练方法可用于训练视频神经表示(NeRV)模型,这是一种视频压缩模型。通过使用Segment Anything创建的边缘信息训练NeRV,可以创建一种对图像识别(SA-NeRV)有效的NeRV。实验结果证实了SA-ICM的优点,在图像压缩方面表现最佳。我们还展示了SA-NeRV在机器视频压缩方面优于普通的NeRV。
  • 图表
  • 解决问题
    SA-ICM是一种针对图像识别的图像压缩技术,论文旨在提出一种新的方法来解决图像压缩的问题,并验证其有效性。
  • 关键思路
    SA-ICM通过对图像中对象部分的边缘信息进行编码和解码来实现图像压缩,这种方法可以用于各种图像识别任务,并且对输入数据的变化具有鲁棒性。此外,该方法还具有隐私保护的好处,因为它可以在编码器端删除人脸信息。
  • 其它亮点
    论文使用Segment Anything生成的边缘信息来训练学习图像压缩(LIC)模型SA-ICM,并展示了其在图像压缩方面的优势。此外,论文还提出了使用相同方法训练神经表示视频(NeRV)的SA-NeRV模型,并展示了其在视频压缩方面的优越性。实验结果表明,SA-ICM在图像压缩方面表现最佳。
  • 相关研究
    最近的相关研究包括使用深度学习进行图像压缩的方法,例如End-to-End Optimized Image Compression和Generative Adversarial Networks for Extreme Learned Image Compression。
许愿开讲
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论