Main Content

イメージ ラベラー

コンピューター ビジョン アプリケーションに使用するイメージのラベル付け

説明

イメージ ラベラー アプリを使って、イメージ コレクションのグラウンド トゥルース データにラベルを付けることができます。このアプリを使用して以下ができます。

  • 四角形の関心領域 (ROI) ラベル、ポリライン ROI ラベル、ピクセル ROI ラベル、多角形 ROI ラベル、およびシーン ラベルを定義します。これらのラベルを使って、グラウンド トゥルース データに対話形式でラベルを付けます。

  • 組み込みの検出または追跡アルゴリズムを使用して、グラウンド トゥルース データにラベル付けします。

  • 独自のカスタム オートメーション アルゴリズムを記述、インポート、および使用して、グラウンド トゥルースに自動的にラベル付けします。ラベル付け用オートメーション アルゴリズムの作成を参照してください。

  • 視覚的な概要を使用してラベル オートメーション アルゴリズムのパフォーマンスを評価します。グラウンド トゥルース ラベルの概要の表示を参照してください。

  • ラベル付きのグラウンド トゥルースを groundTruth オブジェクトとしてエクスポートします。このオブジェクトは、システムの検証や、オブジェクト検出器やセマンティック セグメンテーション ネットワークの学習に使用できます。オブジェクト検出およびセマンティック セグメンテーション用の学習データを参照してください。

イメージ ラベラー アプリは、関数 imread でサポートされるすべてのイメージ ファイル形式をサポートしています。また、超音波ビデオなどのマルチフレーム データ読み込み機能を含む Digital Imaging and Communications in Medicine (DICOM) 形式もサポートしています。イメージ ラベラー アプリでサポートされている追加のファイル形式を読み取るには、imageDatastore を作成し、ReadFcn プロパティを使用できます。DICOM、Neuroimaging Informatics Technology Initiative (NIfTI)、または nearly raw raster data (NRRD) ファイル形式で格納されている 2 次元または 3 次元の医用イメージ データにラベルを付けるには、医用画像ラベラー (Medical Imaging Toolbox)を使用します。

"イメージ ラベラー" アプリには、イメージのサイズが 8,000 ピクセルを超える場合、またはイメージが多重解像度である場合、イメージを読み込むときに、イメージをブロック化されたイメージに変換するオプションがあります。"ブロック化されたイメージ" は、メモリに収まる小さなブロックに分割された 1 つの大きなイメージで構成されます。イメージ ラベラーでは、大きなイメージをブロックに変換した後、他のイメージと同じようにアプリで処理できます。ブロック化されたイメージを使用することで、他の方法では処理できないイメージをアプリで処理できるようになりますが、いくつかの制限があります。詳細については、Label Large Images in the Image Labelerを参照してください。

このアプリの詳細については、イメージ ラベラー入門を参照してください。

Image Labeler app

イメージ ラベラー アプリを開く

  • MATLAB® ツールストリップ: [アプリ] タブで、[イメージ処理とコンピューター ビジョン] の下にあるアプリ アイコンをクリックします。

  • MATLAB コマンド プロンプト: imageLabeler と入力します。

プログラムでの使用

すべて展開する

imageLabeler でアプリの新しいセッションが開き、イメージのグラウンド トゥルース データをラベル付けできます。

imageLabeler(imageFolder) でアプリが開き、imageFolder という名前のフォルダーからすべてのイメージが読み込まれます。

フォルダーの中のイメージは、順序やサイズがばらばらになっている場合があります。ビデオまたはビデオに似た一連の順番付きイメージにラベルを付けるには、代わりにビデオ ラベラー アプリを使います。

imageLabeler(imageDatastore) でアプリが開き、imageDatastore オブジェクトからすべてのイメージを読み取ります。imageDatastore オブジェクトの ReadFcn プロパティでは、データの読み取り方法を指定します。

たとえば、アプリを開いて一時停止標識イメージ コレクションを読み込む方法は以下です。

   stopSignsFolder = fullfile(toolboxdir('vision'),'visiondata','stopSignImages');
   imds = imageDatastore(stopSignsFolder)
   imageLabeler(imds)

imageLabeler(sessionFile) でアプリが開き、保存されたイメージ ラベラー セッション sessionFile が読み込まれます。sessionFile 入力には、パスとファイル名が含まれます。sessionFile がポイントする MAT ファイルには保存されたセッションが含まれます。

imageLabeler(gTruth) は、アプリを開き、groundTruth オブジェクトを読み込みます。グラウンド トゥルース オブジェクトのデータ ソースは、イメージ コレクションまたは imageDatastore でなければなりません。

詳細

すべて展開する

アルゴリズム

すべて展開する

ラベル オートメーション アルゴリズムを使用して、アプリ内でのラベル付けを高速化できます。アプリ内で使用する独自のラベル オートメーション アルゴリズムを作成するには、ラベル付け用オートメーション アルゴリズムの作成を参照してください。次の手順に従って、組み込みアルゴリズムのいずれかを使用することもできます。

  1. ラベルを付けるデータをインポートし、少なくとも 1 つのラベル定義を作成します。

  2. アプリのツールストリップで [アルゴリズムの選択] をクリックし、組み込みのオートメーション アルゴリズムのいずれかを選択します。

  3. [自動化] をクリックしてから、自動化ウィンドウの右側のペインにある自動化の手順に従います。

バージョン履歴

R2018a で導入