复制

系统教程530 更新时间：2025-09-23 03:05:40

2023年11月25日发(作者：)

复制-粘贴⼤法（Copy-Paste）：简单⽽有效的数据增强

论⽂标题：

Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation

论⽂地址：

⾮官⽅代码：

⽬录

1、摘要

建⽴有效的实例分割模型，并能处理罕见的对象类别是计算机视觉中⼀个重要的挑战。数据增强是应对这⼀挑战的⼀个有前途的⽅向。在这

⾥，我们在实例分割⽅向对复制-粘贴增强进⾏了系统的研究，如随机地将对象粘贴到⼀张图像上。先前对复制粘贴的研究依赖于对周围视

觉环境的建模来。然⽽，我们发现随机粘贴对象的简单机制已经⾜够好了，并且可以在强baseline之上提供稳定的增益。此外，我们通过半

是指利⽤公式将两幅图像的内容混合在⼀起；公式中，是粘贴对象所在的图像，是主

图像，是mask掩模；公式的意思其实很淳朴，就是将中mask部分的像素抠出来，然后粘贴到中，当然，这个过程有很⼤的随

机性。

混合粘贴的效果如下图：

机性：（1）选择⽤于粘贴的源图和⽬标图的随机性；（2）选择粘贴源图中哪些对象的随机性；（3）选择粘贴到⽬标图像的哪些位置的随

⼤尺度抖动

⼤尺度抖动（Large Scale Jittering，LSJ）是相较于标准尺度抖动（standard scale jittering，SSJ）⽽⾔更为⼤胆的⼀种尺度抖动⽅

法。在SSJ中，尺度变化的范围是0.8~1.25，⽽在LSJ中，尺度变化范围是0.1~2.0；如此⼤范围的抖动，会产⽣对⽐强烈的抖动效果。此

外，⽆论LSJ还是SSJ，都使⽤了随机⽔平翻转。LSJ的最终效果如下图：

此外，结合⾃训练，此⽅法同样能够带来可叠加的收益。

4.2 和mixup的对⽐

可以看出，在SSJ的实验（左）中，mixup和Copy-Past都能带来收益，但Copy-Past带来的收益更⼤；但在LSJ的实验（右）中，mixpu

带来的收益就⼏乎没有了，猜测原因应该是LSJ已经⾜够优秀了，常规的增强⽅法并不能带来超出LSJ的收益，⽽Copy-Past就可以。

4.3 在不同backbone和输⼊尺⼨上的对⽐

从下表可以看出，使⽤了复制粘贴⼤法，在所有模型、输⼊尺度上都能带来稳定收益。

4.4 结合⾃训练和复制粘贴

⾃训练利⽤未标记数据，可带来1.5 Box AP，复制粘贴同样也能带来类似的收益；将两者结合起来⽤，可以带来“1+1=2”的线性叠加的

收益！（能够使收益线性叠加，是真的强！）

将coco中的对象粘贴到coco和粘贴到伪标签数据的对⽐，可以看出，⽆论粘贴到哪⾥都能带来收益，但两者都粘贴则能带来“1+1>2”的

收益：

4.5 在coco的SOTA模型上的实验

相⽐SOTA模型，添加了复制粘贴和⾃训练的⽅法后，带来的收益同样可观：

4.6 在 PASCAL VOC⽬标检测和语义分割上的实验

实验表明，复制粘贴⼤法对⽬标检测和实例分割同样有效：

4.7 LVIS数据集上的实验

5 总结

数据增强是许多视觉系统的核⼼。本⽂对复制-粘贴数据增强⽅法进⾏了严格的研究，发现该⽅法是⾮常有效和健壮的。在强⼤的baseline

本文发布于:2023-11-25，感谢您对本站的认可！

本文链接:https://www.fzithome.com/xitong/1700905785a8312.html

复制

发布评论取消回复

最近发表

相关推荐

标签列表

复制

发布评论 取消回复

最近发表

相关推荐

标签列表

发布评论取消回复