Main Content

グラウンド トゥルース データにラベルを付けるためのアプリの選択

Computer Vision Toolbox™、Automated Driving Toolbox™、Lidar Toolbox™、Audio Toolbox™、Signal Processing Toolbox™、および Medical Imaging Toolbox™ アプリを使用して、グラウンド トゥルース データへのラベル付けができます。このラベル付けされたデータを使用して、イメージ分類器、オブジェクト検出器、セマンティック セグメンテーション ネットワーク、インスタンス セグメンテーション ネットワーク、および深層学習アプリケーションなどのアルゴリズムの検証や学習ができます。ラベル付けアプリの選択は、サポートされているデータ ソース、ラベルおよびオートメーションの種類など、いくつかの要素に応じて異なります。

主要な考慮事項の 1 つは、ラベル付けを行うデータの種類です。

  • データがイメージ コレクションである場合、イメージ ラベラー (Computer Vision Toolbox) アプリを使用します。"イメージ コレクション" は、サイズがさまざまなイメージの順番付けのないセットです。たとえば、アプリを使用して、書籍のイメージにラベルを付け、分類器に学習させることができます。イメージ ラベラーは、非常に大きいイメージ (最低でも、1 つの次元が 8K を超える) を扱うこともできます。

  • データが単一のビデオまたはイメージ シーケンスである場合、ビデオ ラベラー (Computer Vision Toolbox) アプリを使用します。"イメージ シーケンス" は、ビデオに似たイメージの順番付けされたセットです。たとえば、このアプリを使用して、ハイウェイを走行している車両のビデオまたはイメージ シーケンスにラベルを付け、オブジェクト検出器に学習させることができます。

  • ビデオ、イメージ シーケンス、または LiDAR の信号など、時間がオーバーラップした信号がデータに複数含まれている場合は、グラウンド トゥルース ラベラー (Automated Driving Toolbox) アプリを使用します。たとえば、車両に取り付けられた複数のセンサーによって取得した単一のシーンのデータにラベルを付けることができます。

  • データが LiDAR 信号のみの場合は、LiDAR ラベラー (Lidar Toolbox)を使用します。たとえば、このアプリを使用して、点群センサーから取得されたデータにラベルを付けることができます。

  • データがシングルチャネルまたはマルチチャネルの 1 次元信号で構成されている場合は、信号ラベラー (Signal Processing Toolbox)を使用します。たとえば、生物医学、音声、通信、または振動のデータにラベルを付けることができます。また、信号ラベラーを使用すると、音声検出、音声からテキストへの文字起こしといった音声関連のタスクを実行できます。

  • データが 2 次元の医用画像、2 次元の医用画像シリーズ、または 3 次元の医用画像ボリュームである場合、医用画像ラベラー (Medical Imaging Toolbox)を使用します。たとえば、胸部のコンピューター断層撮影 (CT) 画像ボリュームにラベルを付けることで、セマンティック セグメンテーション ネットワークに学習させることができます。

この表は、ラベル付けアプリの主な機能をまとめたものです。

ラベル付けアプリデータ ソースラベルのサポートオートメーション追加機能
イメージ ラベラー (Computer Vision Toolbox)
  • イメージ コレクション

  • 非常に大きいイメージ (最低でも、1 つの次元が 8K を超える)

  • 四角形の関心領域 (ROI)

  • 回転した四角形の関心領域 (ROI)

  • 投影された直方体 (ROI)

  • 線 ROI

  • ピクセル ROI

  • 多角形 ROI

  • サブラベル

  • 属性

  • シーン

  • 組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • ブロック化されたイメージのオートメーション アルゴリズム

  • ラベル付けされたデータの視覚的な概要を表示する

ビデオ ラベラー (Computer Vision Toolbox)
  • ビデオ

  • イメージ シーケンス

  • カスタム イメージ データ ソース

  • 四角形 ROI

  • 回転した四角形 ROI

  • 投影された直方体 ROI

  • 線 ROI

  • ピクセル ROI

  • 多角形 ROI

  • サブラベル

  • 属性

  • シーン

  • 組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 時間的オートメーション アルゴリズム

  • ラベル付けされたデータの視覚的な概要を表示する

グラウンド トゥルース ラベラー (Automated Driving Toolbox)
  • ビデオ

  • イメージ シーケンス

  • カスタム イメージ データ ソース

  • 点群シーケンス (PCD または PLY ファイル)

  • Velodyne® LiDAR ファイル

  • rosbag (ROS Toolbox が必要)

  • 四角形 ROI

  • 回転した四角形 ROI

  • 投影された直方体 ROI

  • 直方体 ROI

  • 線 ROI

  • ピクセル ROI

  • 多角形 ROI

  • サブラベル

  • 属性

  • シーン

  • 車両検出アルゴリズムや車線検出アルゴリズム、点群時間的内挿アルゴリズムなどの組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 時間的オートメーション アルゴリズム

  • 多重信号オートメーション

  • ラベル付けされたデータの視覚的な概要を表示する

  • LiDAR や CAN バス データといった時間同期信号を表示するために外部ツールをアプリに接続する

  • 追加のデータ ソースをサポートするために、読み込みインターフェイスをカスタマイズする

LiDAR ラベラー (Lidar Toolbox)
  • 点群シーケンス (PCD または PLY ファイル)

  • Velodyne LiDAR ファイル

  • LAS/LAZ ファイル シーケンス

  • rosbag (ROS Toolbox が必要)

  • 直方体 ROI

  • 属性

  • シーン

  • LiDAR オブジェクト トラッカーや点群時相内挿などを含む、組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 時間的オートメーション アルゴリズム

  • 直方体のラベルを上面図、側面図、正面図で表示する

  • カスタム カメラ ビューを保存して再利用する

  • 外部ツールに接続して、ビデオなどのラベル付けを簡単にするために時間同期信号を表示し、ラベル付け時の参照として使用する

信号ラベラー (Signal Processing Toolbox)
  • 数値配列、MATLAB® timetable、MATLAB ワークスペース内の labeledSignalSet オブジェクト

  • MAT ファイルと CSV ファイル

  • オーディオ ファイル (WAVE、OGG、FLAC、AU、AIFF、AIFC、MP3、MPEG-4 AAC)

  • 時間ベースの ROI

  • 時間ベースの ROI の特徴

  • 時間ベースの点

  • 属性

  • 属性の特徴

  • ファイル レベルのラベル

  • サブラベル

  • 組み込みのピーク ラベル付け

  • 組み込みの特徴抽出

  • カスタム オートメーション アルゴリズム

  • 音声検出

  • 音声からテキストへの文字起こし (speech2text (Audio Toolbox) 用の Audio Toolbox 拡張機能が必要)

  • ラベル付けされたデータの詳細を展開、折りたたみ、参照する

  • 信号スペクトルとスペクトログラムを表示する

  • スペクトログラムを使用して ROI と点にラベルを付ける

  • 信号に一括でラベルを付ける

  • ラベル ビューアーを使用してラベルを表示および比較する

  • 音声の再生

  • オーディオ ファイル情報の検査

  • 抽出された特徴の分類学習器 (Statistics and Machine Learning Toolbox)へのエクスポート

医用画像ラベラー (Medical Imaging Toolbox)
  • 2 次元の医用画像および医用画像シリーズ (DICOM ファイルまたは NIfTI ファイル)

  • 3 次元の医用画像ボリューム (DICOM ファイル、NIfTI ファイル、または NRRD ファイル)

  • ピクセル ROI

  • 組み込みのオートメーション アルゴリズム

  • カスタム オートメーション アルゴリズム

  • 冠状面、矢状面、横断面での 3 次元医用画像の表示

  • カスタマイズ可能なボリューム レンダリングを使用した 3 次元医用画像の表示

  • 関連する複数の画像または画像ボリュームの 1 つのアプリ セッションでのラベル付け

関連するトピック