グラウンドトゥルースとは?
Ground truth とは、AI モデルの出力の学習やテストに使用される実際のデータを表す用語です。自動運転や音声認識など、多くの AI アプリケーションで Ground truth データが必要となります。
AI アルゴリズムの開発に際しては、次の 2 つの段階で Ground truth データが不可欠です。
- モデルの学習: Ground truth データを学習データとして使用することで、アルゴリズムが特定のアプリケーションに適した特徴や解を学習します
- モデルのテスト: Ground truth データをテストデータとして使用することで、学習を行ったアルゴリズムのモデル精度をテストします
Ground truth データには、画像データ、信号データ、テキストデータなど、さまざまな形式があります (図 1)。Ground truth データを手動で取得すると時間がかかりますが、MATLAB® を使用すれば、画像、信号、音声、Lidar アプリケーション用のラベラーアプリを活用してプロセスを高速化できます。
Ground truth データの作成方法
Ground truth データの生成には、 Ground truth のラベル付けが必要です。ラベル付けとは、生データに、そのデータの示す意味を表すラベルを付けることです。教師あり学習モデルの学習には、ラベル付けされた出力が必要です。ラベル付けの精度を高めれば、モデルの精度も高まります。多くの AI モデルは、正確な結果の生成に数千から数百万のラベル付けされたデータ出力を必要とするため、Ground truth データを手動でラベル付けすると時間がかかる可能性があります。
MATLAB の以下のラベラーアプリには、ラベル付けプロセスを完全自動化または半自動化するオプションがあり、手動のラベル付けにかかる時間を短縮できます。
イメージのラベル付け
イメージラベラーを使用すると、セマンティック セグメンテーションのためのピクセルのラベル付けや、オブジェクト検出ワークフローの境界ボックスなど、画像中の関心領域にラベル付けができます。
信号のラベル付け
信号ラベラーを使用すると、可視化およびカスタム関数によって、データの探索や、信号属性、関心領域、信号点のラベル付けができます。
Lidar のラベル付け
Lidar ラベラーを使用すると、3D オブジェクトの周囲に境界ボックスを作成し、点群データのクラスタリング、地面の除去、トラッキングを自動化できます。