メインコンテンツ

インスタンス セグメンテーション

SOLOv2、Mask R-CNN、SAM などの事前学習済み AI モデルを使用してグラウンド トゥルースにラベルを付け、インスタンス セグメンテーションを実行する、もしくは転移学習を使用してカスタム ネットワークに学習させる

Computer Vision Toolbox™ のインスタンス セグメンテーション ツールを使用すると、複数のオブジェクトが重なり合っている場合でも、イメージ内の個々のオブジェクトを検出、分類、およびセグメント化できます。イメージ ラベラー アプリとビデオ ラベラー アプリを使用して、ラベル付きのグラウンド トゥルースを作成することから始められます。これらのアプリは、対話形式および AI アシストによる、多角形または矩形の ROI を使用したオブジェクト インスタンスの注釈付けをサポートしています。詳細については、Label Objects Using Polygons for Instance Segmentationを参照してください。

ツールボックスは、SOLOv2 や Mask R-CNN などの事前学習済みインスタンス セグメンテーション ネットワークを提供します。これらのモデルを推論に直接使用することも、転移学習を通じて特定の用途に合わせて調整することもできます。詳細については、Get Started with Instance Segmentation Using Deep LearningGet Started with SOLOv2 for Instance Segmentationを参照してください。クラスに依存しないインスタンス セグメンテーションのために、ツールボックスは imsegsam 関数と segmentAnythingModel オブジェクトを通じて Segment Anything モデル (SAM) をサポートしています。

学習データの準備のために、ツールボックスには、データ セットの管理と整理、データ拡張、および前処理のためのユーティリティが用意されています。詳細については、Postprocess Exported Labels for Instance Segmentation Trainingを参照してください。

事前学習済みモデルまたはカスタム モデルを使用して予測を生成した後、インスタンス セグメンテーションのパフォーマンスを評価し、セグメンテーション精度、オブジェクトレベルの適合率、およびさまざまなオブジェクト サイズにわたるパフォーマンスについて、詳細な洞察を得ることができます。これらのメトリクスは、マスク予測と境界ボックス位置推定の両方の品質を評価するのに役立ちます。詳細については、evaluateInstanceSegmentation を参照してください。

ツールボックスは、Pose Mask R-CNN フレームワークを介したインスタンス セグメンテーションによる 3 次元オブジェクト姿勢推定もサポートしており、オブジェクトの向きや構造をきめ細かく解析することが可能です。詳細については、深層学習を使用したビン ピッキングの 6-DoF 姿勢推定の実行を参照してください。

Instance segmentation using SOLOv2: Left — A segmented and labeled road scenario using a sample modified RGB image from the CamVid data set, Right — A segmented image of PVC pipe connectors

アプリ

イメージ ラベラーコンピューター ビジョンの応用に使用するラベル イメージ
ビデオ ラベラーLabel video for computer vision applications

関数

すべて展開する

SOLOv2

solov2Segment objects using SOLOv2 instance segmentation network (R2023b 以降)
segmentObjectsSegment objects using SOLOv2 instance segmentation (R2023b 以降)

Mask R-CNN

maskrcnnDetect objects using Mask R-CNN instance segmentation (R2021b 以降)
segmentObjectsSegment objects using Mask R-CNN instance segmentation (R2021b 以降)

Segment Anything モデル (SAM)

imsegsamPerform automatic full image segmentation using Segment Anything Model 2 (SAM 2) (R2024b 以降)
segmentAnythingModelセマンティック セグメンテーションのための事前学習済み Segment Anything モデル (SAM) (R2024a 以降)

学習データの読み込み

boxLabelDatastoreDatastore for bounding box label data
groundTruthグラウンド トゥルース ラベル データ
imageDatastoreイメージ データのデータストア
combine複数のデータストアのデータを統合

インスタンス セグメンテーション ネットワークの学習

trainSOLOV2Train SOLOv2 network to perform instance segmentation (R2023b 以降)
trainMaskRCNNTrain Mask R-CNN network to perform instance segmentation (R2022a 以降)

学習データの拡張と前処理

poly2mask関心領域 (ROI) の多角形を領域マスクに変換
bwboundariesバイナリ イメージのオブジェクト境界をトレース
balanceBoxLabelsBalance bounding box labels for object detection
bboxcrop境界ボックスのトリミング
bboxeraseRemove bounding boxes
bboxresize境界ボックスのサイズ変更
bboxwarpApply geometric transformation to bounding boxes
bbox2pointsConvert rectangle to corner points list
imwarpイメージへの幾何学的変換の適用
imcropイメージのトリミング
imresizeイメージのサイズ変更
randomAffine2dランダムな 2 次元アフィン変換の作成
centerCropWindow2d四角形の中央トリミング ウィンドウの作成
randomWindow2dRandomly select rectangular region in image
evaluateInstanceSegmentationEvaluate instance segmentation data set against ground truth (R2022b 以降)
instanceSegmentationMetricsInstance segmentation quality metrics (R2022b 以降)
metricsByAreaEvaluate instance segmentation across object mask size ranges (R2023b 以降)
insertObjectMask Insert masks in image or video stream
insertObjectAnnotationトゥルーカラー イメージ、グレースケール イメージ、またはビデオへの注釈付け
insertShapeイメージまたはビデオへの形状の挿入
insertTextイメージまたはビデオへのテキストの挿入
showShapeDisplay shapes on image, video, or point cloud
posemaskrcnnPredict object pose using Pose Mask R-CNN pose estimation (R2024a 以降)
predictPoseEstimate object pose using Pose Mask R-CNN deep learning network (R2024a 以降)
trainPoseMaskRCNNTrain Pose Mask R-CNN network to perform pose estimation (R2024a 以降)

トピック

開始

インスタンス セグメンテーション用のグラウンド トゥルースの作成

インスタンス セグメンテーション用の学習データの準備

注目の例