メインコンテンツ

セマンティック セグメンテーション

事前学習済み AI モデルを使用してグラウンド トゥルースにラベルを付け、セマンティック セグメンテーションを実行し、転移学習を使用して U-Net などのカスタム ネットワークに学習させる

Computer Vision Toolbox™ のセマンティック セグメンテーション ツールを使用すると、事前学習済みの AI モデルとカスタム深層学習ネットワークの両方を使用して、イメージのピクセルレベルの分類を実行できます。イメージ ラベラー アプリとビデオ ラベラー アプリを使用して、ラベル付きのグラウンド トゥルースを作成することから始められます。これらのアプリは、対話形式および AI アシストによる、クラス ラベル付きのイメージやビデオ内でのピクセルレベルの注釈付けをサポートしています。詳細については、セマンティック セグメンテーションのピクセルのラベル付けを参照してください。

ツールボックスは、BiSeNet V2 などの事前学習済みセマンティック セグメンテーション モデルを提供します。これらのモデルは推論に直接使用することも、特定の用途に合わせて調整することもできます。U-Net、3 次元 U-Net、DeepLab v3+ などのアーキテクチャを用いた転移学習を使用して、カスタム セグメンテーション ネットワークに学習させることもできます。詳細については、深層学習を使用したセマンティック セグメンテーション入門を参照してください。

学習データを準備するために、ツールボックスには、データ セットの読み込みと管理に加え、ラベル分布の整理と解析を行うためのユーティリティが用意されています。ツールボックスは、データ拡張と前処理もサポートしています。詳細については、オブジェクト検出およびセマンティック セグメンテーション用の学習データを参照してください。

事前学習済みモデルまたはカスタム モデルを使用して予測を生成した後、セグメンテーション予測をグラウンド トゥルースと比較して評価し、輪郭マッチング スコア、Sørensen-Dice 類似度、Jaccard 類似度、混同行列などの評価メトリクスを計算できます。詳細については、evaluateSemanticSegmentation を参照してください。

Input image of a seascape, then a series of cubes representing a deep learning network, and a semantically segmented output image of the input image.

アプリ

イメージ ラベラーコンピューター ビジョンの応用に使用するラベル イメージ
ビデオ ラベラーLabel video for computer vision applications

関数

すべて展開する

bisenetv2Create BiSeNet v2 convolutional neural network for semantic segmentation (R2025a 以降)
semanticseg深層学習を使用したセマンティック イメージ セグメンテーション
bisenetv2Create BiSeNet v2 convolutional neural network for semantic segmentation (R2025a 以降)
unetセマンティック セグメンテーション用の U-Net 畳み込みニューラル ネットワークの作成 (R2024a 以降)
unet3dCreate 3-D U-Net convolutional neural network for semantic segmentation of volumetric images (R2024a 以降)
deeplabv3plusセマンティック イメージ セグメンテーション用の DeepLab v3+ 畳み込みニューラル ネットワークの作成 (R2024a 以降)
focalCrossEntropyCompute focal cross-entropy loss
generalizedDiceGeneralized Sørensen-Dice similarity coefficient for image segmentation
combine複数のデータストアのデータを統合
countEachLabelCount occurrence of pixel or box labels
groundTruthグラウンド トゥルース ラベル データ
imageDatastoreイメージ データのデータストア
pixelLabelDatastoreピクセル ラベル データのデータストア
pixelLabelTrainingDataCreate training data for semantic segmentation from ground truth
balancePixelLabelsBalance pixel labels by oversampling block locations in large images
imwarpイメージへの幾何学的変換の適用
imcropイメージのトリミング
imresizeイメージのサイズ変更
transformデータストアの変換
randomAffine2dランダムな 2 次元アフィン変換の作成
randomWindow2dRandomly select rectangular region in image
centerCropWindow2d四角形の中央トリミング ウィンドウの作成
evaluateSemanticSegmentationグラウンド トゥルースに対してセマンティック セグメンテーション データ セットを評価する
bfscoreイメージのセグメンテーションのための輪郭マッチング スコア
diceイメージ セグメンテーションのための Sørensen-Dice 類似度係数
jaccardイメージ セグメンテーションのための Jaccard 類似度係数
segmentationConfusionMatrixConfusion matrix of multi-class pixel-level image segmentation
semanticSegmentationMetricsSemantic segmentation quality metrics
labeloverlay2 次元イメージ上のラベル行列領域の重ね合わせ
volshowボリュームの表示
insertObjectMask Insert masks in image or video stream

トピック

開始

セマンティック セグメンテーション用のグラウンド トゥルースの作成

セマンティック セグメンテーション用の学習データの準備

注目の例