インスタンスセグメンテーション

SOLOv2、Mask R-CNN、SAM などの事前学習済み AI モデルを使用してグラウンドトゥルースにラベルを付け、インスタンスセグメンテーションを実行する、もしくは転移学習を使用してカスタムネットワークに学習させる

Computer Vision Toolbox™ のインスタンスセグメンテーションツールを使用すると、複数のオブジェクトが重なり合っている場合でも、イメージ内の個々のオブジェクトを検出、分類、およびセグメント化できます。イメージラベラーアプリとビデオラベラーアプリを使用して、ラベル付きのグラウンドトゥルースを作成することから始められます。これらのアプリは、対話形式および AI アシストによる、多角形または矩形の ROI を使用したオブジェクトインスタンスの注釈付けをサポートしています。詳細については、Label Objects Using Polygons for Instance Segmentationを参照してください。

ツールボックスは、SOLOv2 や Mask R-CNN などの事前学習済みインスタンスセグメンテーションネットワークを提供します。これらのモデルを推論に直接使用することも、転移学習を通じて特定の用途に合わせて調整することもできます。詳細については、Get Started with Instance Segmentation Using Deep LearningとGet Started with SOLOv2 for Instance Segmentationを参照してください。クラスに依存しないインスタンスセグメンテーションのために、ツールボックスは imsegsam 関数と segmentAnythingModel オブジェクトを通じて Segment Anything モデル (SAM) をサポートしています。

学習データの準備のために、ツールボックスには、データセットの管理と整理、データ拡張、および前処理のためのユーティリティが用意されています。詳細については、Postprocess Exported Labels for Instance Segmentation Trainingを参照してください。

事前学習済みモデルまたはカスタムモデルを使用して予測を生成した後、インスタンスセグメンテーションのパフォーマンスを評価し、セグメンテーション精度、オブジェクトレベルの適合率、およびさまざまなオブジェクトサイズにわたるパフォーマンスについて、詳細な洞察を得ることができます。これらのメトリクスは、マスク予測と境界ボックス位置推定の両方の品質を評価するのに役立ちます。詳細については、evaluateInstanceSegmentation を参照してください。

ツールボックスは、Pose Mask R-CNN フレームワークを介したインスタンスセグメンテーションによる 3 次元オブジェクト姿勢推定もサポートしており、オブジェクトの向きや構造をきめ細かく解析することが可能です。詳細については、深層学習を使用したビンピッキングの 6-DoF 姿勢推定の実行を参照してください。

Instance segmentation using SOLOv2: Left — A segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — A segmented image of PVC pipe connectors

アプリ

イメージラベラー	コンピュータービジョンの応用に使用するラベルイメージ
ビデオラベラー	Label video for computer vision applications

関数

すべて展開する

事前学習済みインスタンスセグメンテーションネットワーク

SOLOv2

`solov2`	Segment objects using SOLOv2 instance segmentation network (R2023b 以降)
`segmentObjects`	Segment objects using SOLOv2 instance segmentation (R2023b 以降)

Mask R-CNN

`maskrcnn`	Detect objects using Mask R-CNN instance segmentation (R2021b 以降)
`segmentObjects`	Segment objects using Mask R-CNN instance segmentation (R2021b 以降)

Segment Anything モデル (SAM)

`imsegsam`	Perform automatic full image segmentation using Segment Anything Model 2 (SAM 2) (R2024b 以降)
`segmentAnythingModel`	セマンティックセグメンテーションのための事前学習済み Segment Anything モデル (SAM) (R2024a 以降)

カスタムインスタンスセグメンテーションネットワークの学習

学習データの読み込み

`boxLabelDatastore`	Datastore for bounding box label data
`groundTruth`	グラウンドトゥルースラベルデータ
`imageDatastore`	イメージデータのデータストア
`combine`	複数のデータストアのデータを統合

インスタンスセグメンテーションネットワークの学習

`trainSOLOV2`	Train SOLOv2 network to perform instance segmentation (R2023b 以降)
`trainMaskRCNN`	Train Mask R-CNN network to perform instance segmentation (R2022a 以降)

学習データの拡張と前処理

`poly2mask`	関心領域 (ROI) の多角形を領域マスクに変換
`bwboundaries`	バイナリイメージのオブジェクト境界をトレース
`balanceBoxLabels`	Balance bounding box labels for object detection
`bboxcrop`	境界ボックスのトリミング
`bboxerase`	Remove bounding boxes
`bboxresize`	境界ボックスのサイズ変更
`bboxwarp`	Apply geometric transformation to bounding boxes
`bbox2points`	Convert rectangle to corner points list
`imwarp`	イメージへの幾何学的変換の適用
`imcrop`	イメージのトリミング
`imresize`	イメージのサイズ変更
`randomAffine2d`	ランダムな 2 次元アフィン変換の作成
`centerCropWindow2d`	四角形の中央トリミングウィンドウの作成
`randomWindow2d`	Randomly select rectangular region in image

予測結果の評価

`evaluateInstanceSegmentation`	Evaluate instance segmentation data set against ground truth (R2022b 以降)
`instanceSegmentationMetrics`	Instance segmentation quality metrics (R2022b 以降)
`metricsByArea`	Evaluate instance segmentation across object mask size ranges (R2023b 以降)

結果の可視化

`insertObjectMask`	Insert masks in image or video stream
`insertObjectAnnotation`	トゥルーカラーイメージ、グレースケールイメージ、またはビデオへの注釈付け
`insertShape`	イメージまたはビデオへの形状の挿入
`insertText`	イメージまたはビデオへのテキストの挿入
`showShape`	Display shapes on image, video, or point cloud

インスタンスセグメンテーションを使用した姿勢推定の実行

`posemaskrcnn`	Predict object pose using Pose Mask R-CNN pose estimation (R2024a 以降)
`predictPose`	Estimate object pose using Pose Mask R-CNN deep learning network (R2024a 以降)
`trainPoseMaskRCNN`	Train Pose Mask R-CNN network to perform pose estimation (R2024a 以降)

トピック

開始

Get Started with Instance Segmentation Using Deep Learning
Segment objects using an instance segmentation model such as SOLOv2 or Mask R-CNN.
Get Started with SOLOv2 for Instance Segmentation
Perform multiclass instance segmentation using SOLOv2 and deep learning.
インスタンスセグメンテーションの Mask R-CNN 入門
Mask R-CNN と深層学習を使用してマルチクラスインスタンスセグメンテーションを実行する。
Get Started with Segment Anything Model for Image Segmentation
Perform interactive image segmentation using Segment Anything Model 2 (SAM 2) and deep learning.

インスタンスセグメンテーション用のグラウンドトゥルースの作成

Label Objects Using Polygons for Instance Segmentation
Label ground truth objects using polygons for instance segmentation.
Postprocess Exported Labels for Instance Segmentation Training
Postprocess exported ground truth labels and create training datastore for training instance segmentation networks such as SOLOv2 or Mask R-CNN.

インスタンスセグメンテーション用の学習データの準備

Create Instance Segmentation Training Data From Ground Truth
This example shows how to create instance segmentation training data from a groundTruth object.
深層学習用イメージ前処理とイメージ拡張の入門
サイズ変更などの確定的演算を使用して深層学習アプリケーション用にデータを前処理する。あるいは、ランダムトリミングなどのランダム演算を使用して学習データを拡張する。
深層学習用のデータストア (Deep Learning Toolbox)
深層学習アプリケーションでデータストアを使用する方法を学びます。

注目の例

新規

Automate Ground Truth Polygon Labeling Using Grounded SAM Model

Combine Grounding DINO and the Segment Anything Model 2 (SAM 2) to automatically produce polygon labels using the Video Labeler app.

R2026a 以降
ライブスクリプトを開く

新規

Automate Ground Truth Labeling for Instance Segmentation

Create an automation algorithm to automatically label data for instance segmentation using a pretrained SOLOv2 network in the Video Labeler app.

R2026a 以降
ライブスクリプトを開く

新規

Automatically Search and Label Video Frames Using VLMs

Automatically search and detect objects based on natural language text queries using vision-language models (VLMs).

R2026a 以降
ライブスクリプトを開く

SOLOv2 を使用したインスタンスセグメンテーションの実行

この例では、深層学習 SOLOv2 ネットワークを使用して、ビン内のランダムに回転する機械部品のオブジェクトインスタンスをセグメント化する方法を示します。

ライブスクリプトを開く

Mask R-CNN を使用したインスタンスセグメンテーションの実行

この例では、マルチクラスの Mask R-CNN (Region-based Convolutional Neural Network) を使用して、人と自動車の個々のインスタンスをセグメント化する方法を説明します。

ライブスクリプトを開く

Automatically Label Ground Truth Using Segment Anything Model

Produce pixel labels for semantic segmentation using the Segment Anything Model (SAM) in the イメージラベラー app. The SAM is an automatic segmentation technique that you can use to segment object regions to label with just a few clicks, or automatically segment the entire image and instantaneously create labels for selected regions. In this example, you interactively label pixels for semantic segmentation in two ways.