このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
オブジェクトの検出
オブジェクト検出は、イメージまたはビデオ内のオブジェクトのインスタンスを特定するためのコンピューター ビジョンの手法です。オブジェクト検出アルゴリズムは通常、機械学習または深層学習を活用して、意味のある結果を生成します。イメージやビデオを見るとき、人間は関心を向ける対象オブジェクトを瞬時に認識して特定できます。オブジェクト検出の目的は、コンピューターを使用してこのインテリジェンスを模倣することです。オブジェクト検出の最適なアプローチは、アプリケーションや解決しようとする問題によって異なります。
深層学習手法では、多数のラベル付き学習イメージを必要とするため、モデルに学習させるのに必要な時間を短縮するために GPU を使用することを推奨します。深層学習ベースのオブジェクト検出では、R-CNN や YOLO などの畳み込みニューラル ネットワーク (CNN または ConvNet) を使用するか、シングルショット検出 (SSD) を使用します。カスタム オブジェクト検出器に学習させることも、転移学習を活用して事前学習済みのオブジェクト検出器を使用し、事前学習済みのネットワークから始めて、アプリケーションに合わせて微調整することもできます。畳み込みニューラル ネットワークには Deep Learning Toolbox™ が必要です。学習と予測は CUDA® 対応 GPU でサポートされます。GPU を使用することが推奨され、これには Parallel Computing Toolbox™ が必要になります。詳細については、Computer Vision Toolbox の基本設定およびMathWorks 製品での並列計算のサポート (Parallel Computing Toolbox)を参照してください。
オブジェクト検出の機械学習手法には、集約チャネル特徴 (ACF)、勾配方向ヒストグラム (HOG) 特徴を使用したサポート ベクター マシン (SVM) 分類、および人間の顔や上半身を検出するための Viola-Jones アルゴリズムなどがあります。事前学習済みのオブジェクト検出器から開始することも、アプリケーションに合わせてカスタム オブジェクト検出器を作成することもできます。
関数
ブロック
Deep Learning Object Detector | 学習済み深層学習オブジェクト検出器を使用したオブジェクトの検出 (R2021b 以降) |
トピック
開始
- 深層学習を使用したオブジェクト検出入門
深層学習ニューラル ネットワークを使用してオブジェクト検出を実行する。 - オブジェクト検出器の選択
YOLOX や YOLOv4 などのオブジェクト検出深層学習モデルを比較する。 - 局所特徴の検出と抽出
局所特徴の検出と抽出の利点と用途の学習。 - カスケード型オブジェクト検出器入門
カスタム分類器に学習させる。 - 特徴点のタイプ
いくつかの種類の特徴の点オブジェクトを返したり受け入れたりする関数の選択。 - Getting Started with OCR
Detect and recognize text in multiple languages, train OCR models to recognize custom text. - bag of visual words を用いたイメージの分類
Computer Vision Toolbox™ 関数を使用して bag of visual words を作成することで、イメージをカテゴリに分類します。 - 座標系
ピクセル インデックス、空間座標、および 3 次元座標系の指定。
オブジェクト検出用およびインスタンスのセグメンテーション用の学習データ
- イメージ ラベラー入門
四角形の ROI (オブジェクト検出用)、ピクセル (セマンティック セグメンテーション用)、多角形 (インスタンス セグメンテーション用)、およびシーン (イメージ分類用) に対話形式でラベルを付ける。 - ビデオ ラベラー入門
ビデオおよびイメージのシーケンス内の四角形の ROI (オブジェクト検出用)、ピクセル (セマンティック セグメンテーション用)、多角形 (インスタンス セグメンテーション用)、およびシーン (イメージ分類用) に対話形式でラベルを付ける。 - 深層学習用のデータストア (Deep Learning Toolbox)
深層学習アプリケーションでデータストアを使用する方法を学びます。 - オブジェクト検出およびセマンティック セグメンテーション用の学習データ
イメージ ラベラーやビデオ ラベラーを使用して、オブジェクト検出器やセマンティック セグメンテーションの学習データを作成します。 - 深層学習用イメージ前処理とイメージ拡張の入門
サイズ変更などの確定的演算を使用して深層学習アプリケーション用にデータを前処理する。あるいは、ランダム トリミングなどのランダム演算を使用して学習データを拡張する。
深層学習入門
- MATLAB による深層学習 (Deep Learning Toolbox)
畳み込みニューラル ネットワークを使用して分類や回帰を行う MATLAB® の深層学習機能を確認します。これには、事前学習済みのネットワークと転移学習のほか、GPU、CPU、クラスター、およびクラウドでの学習が含まれます。 - 事前学習済みの深層ニューラル ネットワーク (Deep Learning Toolbox)
分類、転移学習、特徴抽出用の事前学習済みの畳み込みニューラル ネットワークのダウンロード方法と使用方法を学習します。