オブジェクト検出器の選択

Computer Vision Toolbox™ では、イメージやビデオ内のオブジェクトを検出および分類するために使用するオブジェクト検出器を提供しています。オブジェクト検出器関数を使用して検出器に学習させ、機械学習および深層学習と共に使用して、イメージ内のオブジェクトの位置を迅速かつ正確に予測します。

検出器を選択するときは、次の特徴が必要かどうかを検討してください。

アプリケーションとパフォーマンス

単一クラスと複数クラス — 複数のクラスには、イメージまたはビデオの複数の場所とスケールで使用されるさまざまな分類器のバリエーションが必要です。
ランタイムパフォーマンス — 検出器のパフォーマンスは、イメージ内のオブジェクトの検出にかかる時間によって異なります。単一のクラス用に学習させた検出器、または姿勢と形状が類似しているオブジェクトを検出するように学習させた検出器は、複数のオブジェクトで学習させた深層学習検出器よりもランタイムパフォーマンスが高くなります。さらに重要なことに、深層学習は、機械学習や特徴ベースの検出アプローチよりも多くの計算を必要とするため、時間がかかります。
機械学習 — 機械学習では、既知の入力データと出力データでモデルに学習させて将来の出力を予測できるようにする教師あり学習と、入力データの隠れたパターンや固有の構造を見つける教師なし学習の 2 種類の手法を使用します。詳細については、MATLAB の機械学習 (Statistics and Machine Learning Toolbox)を参照してください。
深層学習 — アルゴリズム、事前学習済みのモデル、およびアプリを使用して深層ニューラルネットワークを実装します。畳み込みニューラルネットワークを使用して、イメージの分類と回帰を実行できます。詳細については、深層学習を使用したオブジェクト検出入門を参照してください。

展開

C/C++コード生成 — SSD、YOLO、ACF、および System object ベースの検出器は、デスクトップシステムから組み込みハードウェアまで、さまざまなハードウェアプラットフォーム用の MATLAB^® Coder™ C および C++ コード生成をサポートします。詳細については、MATLAB Coder を参照してください。
GPU コード生成 — 深層学習ベースの検出器は、組み込みビジョンや自律型システム用に、GPU Coder™ によって最適化された CUDA^® を使った GPU コード生成をサポートします。詳細については、GPU Coder を参照してください。

オブジェクト検出器機能を参照および比較するには、次のセクションの表を使用します。

最新の One-Stage オブジェクト検出器

検出器	複数クラスのサポート	深層学習のサポート	コード生成のサポート	GPU サポート	例	説明
`rtmdetObjectDetector`	あり	あり	あり	あり	Detect Objects Using Pretrained RTMDet Object Detector	RTMDet は、完全な解像度での学習、フル解像度でのシングルショット推論、タイルイメージを使用した学習をサポートするアンカーフリーのオブジェクト検出器です。最適なパフォーマンスを得るには GPU が必要です。この検出器は、特に計算リソースが限られている状態でリアルタイム処理を必要とするシナリオにおいて、高いパフォーマンスと効率のバランスを取る必要がある場合に使用します。データに多様なオブジェクトクラスのセットが含まれている場合は、さまざまなスケールと方向で高い検出精度を維持するために、YOLO ベースの検出器ではなく RTMDet ベースの検出器を選択してください。
`groundingDinoObjectDetector`	あり	あり	なし	あり	Perform Zero-Shot Object Detection Using Grounding DINO	Grounding DINO は、自然言語による説明 (テキストプロンプト) を使用して、イメージ内の任意のオブジェクトを特定および位置推定するゼロショットオブジェクト検出器です。最適なパフォーマンスを得るには GPU が必要です。説明フレーズで指定されたオブジェクトを検出する必要がある場合、または元の学習セットに存在しない新規オブジェクトクラスのオープンボキャブラリ検出が必要な場合は、従来のカテゴリベースの検出器よりも Grounding DINO を選択してください。
`yoloxObjectDetector` (Automated Visual Inspection Library for Computer Vision Toolbox)	あり	あり	あり	あり	オブジェクト検出のための YOLOX 入門 YOLOX ネットワークを使用したプリント基板の欠陥の検出	YOLOX は、完全な解像度での学習、フル解像度でのシングルショット推論、タイルイメージを使用した学習をサポートするアンカーフリーのオブジェクト検出器です。最適なパフォーマンスを得るには GPU が必要です。この検出器は、小さなオブジェクトの検出で YOLO v4 よりもパフォーマンスを向上させる必要がある場合、または学習と推論の両方で任意のイメージサイズを使用する必要がある場合に使用します。
`yolov4ObjectDetector`	あり	あり	あり	あり	YOLO v4 深層学習を使用したオブジェクトの検出 Object Detection in Large Satellite Imagery Using Deep Learning	YOLO v4 は、YOLO v3 よりも高速かつ高精度な one-stage オブジェクト検出器です。この検出器は、spatial pyramid pooling とパスアグリゲーションネットワークを使用して集約された特徴を計算します。また、さまざまなサイズの小さなオブジェクトを検出できます。最適なパフォーマンスを得るには GPU が必要です。
`yolov3ObjectDetector`	あり	あり	あり	あり	YOLO v3 深層学習を使用したオブジェクトの検出	YOLO v3 は、マルチスケールの特徴を使用し、さまざまなサイズのオブジェクトの検出をより適切に処理する one-stage ネットワークです。パフォーマンス速度と精度を向上させるために、YOLO v4 の使用を検討してください。最適なパフォーマンスを得るには GPU が必要です。
`yolov2ObjectDetector`	あり	あり	あり	あり	YOLO v2 深層学習を使用したオブジェクトの検出 YOLO v2 深層学習を使用したマルチクラスオブジェクト検出	YOLO v2 は、オブジェクト検出を行うために one-stage ネットワークを使用します。さまざまなサイズでパフォーマンスを向上させるには、SSD または YOLO v4 の使用を検討してください。最適なパフォーマンスを得るには GPU が必要です。
`ssdObjectDetector`	あり	あり	あり	あり	SSD 深層学習を使用したオブジェクト検出	シングルショット検出器 (SSD) は、one-stage 検出ネットワークを使用し、マルチスケールの特徴を使用してオブジェクトを検出します。最適なパフォーマンスを得るには GPU が必要です。この検出器は、さまざまなサイズのオブジェクトを検出する必要があり、ランタイムパフォーマンスを向上させる必要がある場合に使用します。 YOLO v2 よりも実行時のパフォーマンスが優れています。

剛体オブジェクト検出用オブジェクト検出器

検出器複数クラスのサポート深層学習のサポートコード生成のサポート GPU サポート例説明

検出器	複数クラスのサポート	深層学習のサポート	コード生成のサポート	GPU サポート	例	説明
`acfObjectDetector`	なし	なし	あり	なし	ACF ベースの一時停止標識検出器の学習	単一クラスのオブジェクト検出に適した剛体オブジェクト検出器。複数のオブジェクトクラスを検出する必要がある場合や、同じクラスに属しているものの構成や姿勢が異なるオブジェクトがある場合は、深層学習オブジェクト検出器の使用を検討してください。この検出器は、検出するオブジェクトの姿勢と形状が類似していて、ランタイムパフォーマンスが重要な場合に使用します。 CPU 上の深層学習ベースの検出器よりもランタイムパフォーマンスが優れています。 ACF は、フロント、サイド、リアなどのさまざまな視点から車両を検出するときにはうまく機能しません。
`vision.CascadeObjectDetector`	なし	なし	あり	なし	顔の正面分類モデルを使用したイメージ内の顔の検出	剛体オブジェクト検出に適した Viola-Jones オブジェクト検出器。HAAR、HOG、または LBP 特徴を使用します。新しい検出器に学習させる場合は、パフォーマンスを向上させるために ACF から始めることを検討してください。この検出器は、検出したいオブジェクトクラスに対して事前学習済みの検出器が利用でき、オブジェクトの姿勢や形状にほとんどバリエーションがない場合に使用します。

acfObjectDetector

なし

あり

なし

ACF ベースの一時停止標識検出器の学習

単一クラスのオブジェクト検出に適した剛体オブジェクト検出器。
複数のオブジェクトクラスを検出する必要がある場合や、同じクラスに属しているものの構成や姿勢が異なるオブジェクトがある場合は、深層学習オブジェクト検出器の使用を検討してください。
この検出器は、検出するオブジェクトの姿勢と形状が類似していて、ランタイムパフォーマンスが重要な場合に使用します。
CPU 上の深層学習ベースの検出器よりもランタイムパフォーマンスが優れています。

ACF は、フロント、サイド、リアなどのさまざまな視点から車両を検出するときにはうまく機能しません。

vision.CascadeObjectDetector

なし

あり

なし

顔の正面分類モデルを使用したイメージ内の顔の検出

剛体オブジェクト検出に適した Viola-Jones オブジェクト検出器。HAAR、HOG、または LBP 特徴を使用します。
新しい検出器に学習させる場合は、パフォーマンスを向上させるために ACF から始めることを検討してください。
この検出器は、検出したいオブジェクトクラスに対して事前学習済みの検出器が利用でき、オブジェクトの姿勢や形状にほとんどバリエーションがない場合に使用します。

車両および人物の検出用オブジェクト検出器

検出器	複数クラスのサポート	深層学習のサポート	コード生成のサポート	GPU サポート	例	説明
`vehicleDetectorACF` (Automated Driving Toolbox)	事前学習済み	なし	あり	なし	Track Multiple Vehicles Using a Camera (Automated Driving Toolbox)	事前学習済みの ACF 検出器
`vehicleDetectorFasterRCNN` (Automated Driving Toolbox)	事前学習済み	あり	なし	あり	深層学習車両検出器の学習 (Automated Driving Toolbox)	事前学習済みの Faster R-CNN 検出器
`vehicleDetectorYOLOv2` (Automated Driving Toolbox)	事前学習済み	あり	あり	あり	Detect Vehicles Using Monocular Camera and YOLO v2 (Automated Driving Toolbox)	事前学習済みの YOLO v2 検出器
`peopleDetectorACF`	事前学習済み	なし	あり	なし	走行中の自動車からの歩行者の追跡	この事前学習済みの検出器は、直立した人物を検出するために使用します。
`vision.PeopleDetector`	事前学習済み	なし	あり	なし	ステレオビデオからの深度推定	この事前学習済みのカスケード型オブジェクト検出器は、直立した人物を検出するために使用します。

参考

オブジェクト検出器の選択

最新の One-Stage オブジェクト検出器

剛体オブジェクト検出用オブジェクト検出器

車両および人物の検出用オブジェクト検出器

参考

アプリ

オブジェクト

関数

トピック