Skip to content

Latest commit

 

History

History
144 lines (109 loc) · 4.94 KB

semantic_segmentation.md

File metadata and controls

144 lines (109 loc) · 4.94 KB

语义分割手动标注

{: .note } 有关数据集导入导出训练/验证/测试集划分步骤请参快速开始文档

image

PaddleLabel 将语义分割和实例分割视为两种项目类型,目前二者之间不支持转换。在语义分割项目中,每个像素有一个分类,表示其为背景或前景中的某一类别。实例分割项目在逐像素分类的基础上给每个像素一个实例 id,即不仅区分像素所属类别,而且区分同一类别下像素属于哪个实例。

PaddleLabel 支持多种分割数据集格式,各种类型的数据集导入后都可以使用多边形和笔刷两种标注工具。数据集导出时

  • 如果导出掩膜格式,多边形标注会被转换成掩模格式
  • 如果导出多边形格式,会跳过所有掩膜格式标注

数据结构

掩膜格式

{: .label } v0.1.0+

掩膜格式数据集中图片和掩膜一般都是图片文件,二者需要通过所在文件夹进行区分。创建此类型标注项目时,请将待标注图片放在JPEGImages文件夹中,将已有标注放在Annotations文件夹中,数据集路径请填写二者的上层目录(下方示例中的数据集路径)。

{: .note} 此类型项目可以导入 EISeg 保存的灰度和伪彩色掩膜。不过 EISeg 保存伪彩色掩膜时文件名格式为 图片名_pseudo.png ,导入前需要去掉伪彩色掩膜文件名中的_pseudo部分,重命名为 图片名.png

样例格式如下:

数据集路径
├── Annotations
│   ├── A0001.png
│   ├── B0001.png
│   ├── H0002.png
│   └── ...
├── JPEGImages
│   ├── A0001.jpg
│   ├── B0001.png
│   ├── H0002.bmp
│   └── ...
├── labels.txt
├── test_list.txt
├── train_list.txt
└── val_list.txt

# labels.txt
background
optic_disk - 128 0 0 // 对于伪彩色掩膜,需要按此结构提供每个类别的颜色。灰度掩膜的id默认为从0开始依次递增

COCO 格式

{: .label } v0.1.0+

COCO 格式的图片和标注对应规则可以参考检测项目中的描述。

样例格式如下:

数据集路径
├── image
│   ├── 0001.jpg
│   ├── 0002.jpg
│   ├── 0003.jpg
│   └── ...
├── train.json
├── val.json
└── test.json

COCO 文件的格式如下:

{
    "info": info,
    "images": [image],
    "annotations": [annotation],
    "licenses": [license],
    "categories": [category],
}

image{
    "id": int,
    "width": int,
    "height": int,
    "file_name": str,
    "license": int,
    "flickr_url": str,
    "coco_url": str,
    "date_captured": datetime,
}

annotation{
    "id": int,
    "image_id": int,
    "category_id": int,
    "segmentation": RLE or [polygon],
    "area": float,
    "bbox": [x,y,width,height],
    "iscrowd": 0 or 1,
}

category{
 "id": int,
 "name": str,
 "supercategory": str,
 "color": str // this feature is specific to PP Label. It's not in the coco spec.
}

数据标注

语义分割项目支持多边形和笔刷/橡皮掩膜标注两种标画工具

多边形标注

  1. 在右侧“类别列表”中点击选中一个类别,在左侧工具栏中点击“多边形”按钮激活该工具
  2. 在图像中沿待标注物体的边缘点击,使用多边形包围该物体。完成后点击鼠标右键结束对该物体的标注,标注结果将自动保存。这一过程可以重复多次,通常一个多边形只框选一个物体
  3. 如需要修改多边形顶点可以在左侧工具栏中点击“编辑”,之后拖动顶点位置
  4. 完成一张图片标注后点击画布两侧的 < > 按钮切换图片

掩膜标注

  1. 在右侧“类别列表”中点击选中一个类别,在左侧工具栏中点击“笔刷”按钮激活该工具
  2. 鼠标悬浮在笔刷工具上方时,可以在弹出的悬浮框中调整笔刷大小
  3. 在图像中使用笔刷标画所有属于该类别的像素。可以使用橡皮擦工具擦除过多的标画。每笔标注会自动保存
  4. 完成一张图片标画后点击画布两侧 < > 按钮切换图片

下一步

您可以继续浏览交互式分割使用方法了解如何使用 PaddleLabel-ML 提高语义分割标注效率