- 简介漫画作为一种媒介,独特地将文字和图像以风格与现实世界视觉常有所不同的方式相结合。过去三十年,对漫画的计算研究从基本的目标检测发展到更复杂的任务。然而,该领域面临着持续的挑战,如小型数据集、不一致的注释、不可访问的模型权重以及由于不同的训练/测试分割和指标而无法直接比较的结果。为了解决这些问题,我们旨在标准化跨数据集的注释,将各种漫画风格引入数据集,并建立具有清晰、可复制设置的基准结果。我们提出的漫画数据集框架将数据集注释标准化为通用格式,并通过引入Comics100来解决漫画过度代表的问题,这是来自数字漫画博物馆的100本精选书籍,已在我们的统一格式中进行了检测注释。我们使用漫画数据集框架基准测试了各种检测架构。所有相关代码、模型权重和详细的评估过程都可在https://github.com/emanuelevivoli/cdf上找到,确保透明度并促进复制。这项举措是改进漫画目标检测的重大进展,为依赖于精确目标识别的更复杂的计算任务奠定了基础。
- 图表
- 解决问题本论文旨在解决漫画目标检测领域中的一些挑战,如小数据集、不一致的注释、模型权重不可访问以及由于不同的训练/测试集和指标而无法直接比较结果等问题。该论文提出了一个标准化注释框架,并通过引入各种漫画样式的数据集来解决漫画类型过于单一的问题。
- 关键思路本论文的关键思路是使用提出的漫画数据集框架来标准化注释,使得漫画目标检测的结果更加可靠。此外,该论文提出了一个由100本漫画书组成的精选集,可以用于检测在该框架下的目标物体。
- 其它亮点该论文使用提出的漫画数据集框架对各种检测架构进行了基准测试,并提供了代码、模型权重和详细的评估过程,以确保透明度并促进复制。该研究为改进漫画目标检测打下了基础,并为依赖于精确目标识别的更复杂的计算任务奠定了基础。
- 在最近的相关研究中,还有一些关于漫画目标检测的论文,如《DeepVisual: Deep learning for comic panel classification》、《Manga109 object recognition dataset》等。
沙发等你来抢
去评论
评论
沙发等你来抢