Ground truth (グランドトゥルース)

機械学習やディープラーニングの出力を実環境と照合しながらのテスト

Ground truth とは、AI モデルの出力の学習やテストに使用される実際のデータを表す用語です。自動運転音声認識など、多くの AI アプリケーションで Ground truth データが必要となります。

AI アルゴリズムの開発に際しては、次の 2 つの段階で Ground truth データが不可欠です。

  1. モデルの学習: Ground truth データを学習データとして使用することで、アルゴリズムが特定のアプリケーションに適した特徴や解を学習します
  2. モデルのテスト: Ground truth データをテストデータとして使用することで、学習を行ったアルゴリズムのモデル精度をテストします

Ground truth データには、画像データ、信号データ、テキストデータなど、さまざまな形式があります (図 1)。Ground truth データを手動で取得すると時間がかかりますが、MATLAB® を使用すれば、画像信号音声Lidar アプリケーション用のラベラーアプリを活用してプロセスを高速化できます。

図 1: 信号 (左上)、画像 (右上)、テキスト (下) 形式の Ground truth データ。

図 1.信号 (左上)、画像 (右上)、テキスト (下) 形式の Ground truth データ

Ground truth データの作成方法

Ground truth データの生成には、 Ground truth のラベル付けが必要です。ラベル付けとは、生データに、そのデータの示す意味を表すラベルを付けることです。教師あり学習モデルの学習には、ラベル付けされた出力が必要です。ラベル付けの精度を高めれば、モデルの精度も高まります。多くの AI モデルは、正確な結果の生成に数千から数百万のラベル付けされたデータ出力を必要とするため、Ground truth データを手動でラベル付けすると時間がかかる可能性があります。

MATLAB の以下のラベラーアプリには、ラベル付けプロセスを完全自動化または半自動化するオプションがあり、手動のラベル付けにかかる時間を短縮できます。

イメージのラベル付け

イメージラベラーを使用すると、セマンティック セグメンテーションのためのピクセルのラベル付けや、オブジェクト検出ワークフローの境界ボックスなど、画像中の関心領域にラベル付けができます。

図 2: イメージ ラベラー アプリを使用した画像のラベル付け。

図 2.イメージ ラベラー アプリを使用した画像のラベル付け。

信号のラベル付け

信号ラベラーを使用すると、可視化およびカスタム関数によって、データの探索や、信号属性、関心領域、信号点のラベル付けができます。

図 3. 信号ラベラーアプリを使用した信号のラベル付け。

図 3.信号ラベラーアプリを使用した信号のラベル付け。

Lidar のラベル付け

Lidar ラベラーを使用すると、3D オブジェクトの周囲に境界ボックスを作成し、点群データのクラスタリング、地面の除去、トラッキングを自動化できます。

図 4. Lidar ラベラーアプリを使用した Lidar 点群のラベル付け。

図 4.Lidar ラベラーアプリを使用した Lidar 点群のラベル付け。



ソフトウェア リファレンス

参考: ディープラーニング, 畳み込みニューラル ネットワーク