随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。


HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。


除此之外,GitHub 上超火的项目「Segment Anything 分割万物」也上线 hyper.ai 超神经官网的「教程」板块啦!快来体验一下图像分割的世界吧!

在线运行:https://go.hyper.ai/4GUjy


1

COCONut 大规模图像分割数据集

发布机构:字节跳动

发布时间:2024 年

预估大小:2.27 GB

下载地址:https://go.hyper.ai/D1XHs


COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集,包含约 383K 图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR 2024。


2

Pascal Panoptic Parts 全景分割数据集


发布机构:埃因霍温理工大学

发布时间:2021 年

预估大小:157.78 MB

下载地址:https://go.hyper.ai/KD9NU


该数据集由 PASCAL VOC 2010 数据集上的 part-aware Panoptic Segmentation 任务的标注组成。相关成果已入选 CVPR 2021。


3

PASCAL-5i 小样本图像分割数据集


发布机构:佐治亚理工学院

发布时间:2020 年

预估大小:112.42 MB

下载地址:https://go.hyper.ai/oNGRX


PASCAL-5i 是一个用于评估小样本图像分割的数据集。该数据集被细分为 4 个部分,每个部分包含 5 个类别,共计 20 个类别。


4

SUN09 图像分割数据集


发布机构:麻省理工大学

发布时间:2010 年

预估大小:8.15 GB

下载地址:https://go.hyper.ai/PWjWo


SUN09 数据集由 12,000 张带标注的图像组成,包含 200 多个对象类别。该数据集包含了自然、室内和室外的图像。每幅图像平均包含 7 个不同的标注对象,每个对象的平均占用面积是图像大小的 5 % 。该数据集已发表于 2010 年 IEEE CVPR。


5

PASCAL VOC 2011 图像分割数据集


发布机构:利兹大学

发布时间:2011 年

预估大小:1.7 GB

下载地址:https://go.hyper.ai/bXb4O


PASCAL VOC 2011 是一个图像分割数据集。其中训练集包含 2,223 张图像,由 5,034 个目标对象组成;测试集包含 1,111 个图像和 2,028 个目标对象。总共有超过 5,000 个精确分割的对象用于训练。


6

PhraseCut 基于语言的图像分割数据集


发布机构:马萨诸塞大学阿默斯特分校 

发布时间:2020 年

下载地址:https://go.hyper.ai/bvzRm


PhraseCut 数据集包含 77,262 张图像和 345,486 个短语-区域对。该数据集搜集自 Visual Genome 数据集,并使用现有的标注来生成一组具有挑战性的参考短语,对这些短语的相应区域进行人工标注。


7

MPI3D 3D 图像分离数据集


发布机构:马克斯-普朗克智能系统研究所

发布时间:2019 年

下载地址:https://go.hyper.ai/JfmOO


MPI 全称 Moldflow Plastic Insight,由 100 多万张物理 3D 物体图像组成。图像有七个变化因素,如物体的颜色、形状、大小和位置等。该数据集可用于测试模拟环境和真实环境中的表征学习算法。相关成果已入选 NeurIPS 2019。


8

CryoNuSeg 实例分割数据集


发布机构:维也纳医科大学

发布时间:2023 年

预估大小:160 MB

下载地址:https://go.hyper.ai/Ybpbg


CryoNuSeg 是一个用于冰冻切片 H&E 染色组织图像核实例分割的数据集。该数据集包含来自 10 个人体器官的图像,具有 512×512 像素的固定大小,并提供了 3 个人工标注,以允许测量观察者内和观察者间的变异性。


9

TrashCan 实例分割数据集


发布机构:University Digital Conservancy

发布时间:2020 年

预估大小:18.3 GB

下载地址:https://go.hyper.ai/dxw78


TrashCan 是一个水下垃圾的实例分割数据集,由 7,212 张标注图像组成,记录了各种水下垃圾、无人潜水器和海底动植物群的活动。该数据集的标注采用了实例分割标注的格式,其图像来源于 J-EDI 数据集。


10

FSS-1000 小样本图片分割数据集


发布机构:香港科技大学

发布时间:2019 年

预估大小:7.56 GB

下载地址:https://go.hyper.ai/eTDiv


FSS-1000 是一个小样本分割的数据集,包含 1,000 个类。该数据集探究仅通过 5 张人工标注的图像,训练模型完成图像识别任务。数据集包含大量在以前的数据集中,从未出现过或标注过的物体,如日常小物件、商品、卡通人物、 logo 等。


SegmentAnything 分割万物教程



Segment Anything Model (SAM) 是一个可以根据点或框等输入提示生成高质量的图像分割的机器视觉模型,可用于为图像中的所有对象生成对应蒙版。该模型在包含 1,100 万张图像和 11 亿个掩模的数据集上进行训练,在各种分割任务上具有强大的零样本性能,实现了真正意义上的分割万物。


在线运行:https://go.hyper.ai/D1XHs


以上就是HyperAI超神经为大家汇总的 10 个图像分割分类数据集,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!


关于 HyperAI超神经 (hyper.ai)


HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:


* 为 1200+ 公开数据集提供国内加速下载节点

* 收录 300+ 经典及流行在线教程

* 解读 100+ AI4Science 论文案例

* 支持 500+ 相关词条查询

* 托管国内首个完整的 Apache TVM 中文文档


访问官网开启学习之旅:

https://hyper.ai/