Computer Vision Toolbox

コンピューター ビジョン、3 次元ビジョン、および映像処理システムの設計およびテスト

 

Computer Vision Toolbox™ は、コンピューター ビジョン、3 次元ビジョン、および映像処理システムの設計とテストのためのアルゴリズム、関数、およびアプリを提供します。特徴の検出、抽出、マッチングに加えて、オブジェクトの検出と追跡を行うことができます。3 次元ビジョンでは、単一、ステレオ、および魚眼レンズカメラのキャリブレーション、ステレオ ビジョン、3 次元構造の再構築、LiDAR 点群と 3 次元点群の処理がサポートされています。コンピューター ビジョンアプリはグラウンドトゥルース ラベリングとカメラ キャリブレーションのワークフローを自動化します。

YOLO v2、Faster R-CNN、および ACF などのディープラーニングおよび機械学習アルゴリズムを使用して、カスタムのオブジェクト検出器の学習を実行できます。セマンティック セグメンテーションでは、SegNet、U-Net、および DeepLab などのディープラーニング アルゴリズムを使用できます。学習済みモデルを使用すると、顔や歩行者、その他のオブジェクトを検出できます。

アルゴリズムはマルチコア プロセッサおよび GPU 上で実行することで高速化できます。ツールボックスのほとんどのアルゴリズムでは、既存のコードとの統合、デスクトップ プロトタイピング、および組み込み画像システム展開を統合するための C/C++ コード生成をサポートしています。

詳細を見る:

ディープラーニングと機械学習

ディープラーニングと機械学習によるオブジェクトの検出、認識、セグメンテーション。

オブジェクトの検出と認識

YOLO v2、Faster R-CNN、ACF、Viola-Jones などのオブジェクト検出器の学習、評価、展開を行うフレームワーク。オブジェクト認識機能には、bag-of-visual-words と OCR が含まれています。学習済みモデルにより、顔や歩行者、その他のオブジェクトが検出されます。

Faster R-CNN を使用したオブジェクト検出。 

セマンティック セグメンテーション

SegNet、FCN、U-Net、DeepLab v3+ などのネットワークを使用して個々のピクセルとボクセルを分類することで、画像と 3 次元ボリュームをセグメント化します。

グラウンド トゥルースのラベル付け

ビデオラベラー アプリとイメージラベラー アプリを使用したオブジェクト検出、セマンティック セグメンテーション、シーン分類のラベル付けを自動化します。

ビデオラベラーアプリを使用したグラウンドトゥルースのラベル付け。

LiDAR 点群と 3 次元点群の処理

LiDAR 点群または 3 次元点群のデータを使用した幾何学的形状のセグメンテーション、クラスタリング、ダウンサンプリング、ノイズ除去、レジストレーション、および近似。

LiDAR および点群 I/O

ファイル、LiDAR、RGB-D センサーから点群の読み取り、書き込み、表示を行います。

点群のレジストレーション

正規分布変換 (NDT)、反復最近接点 (ICP)、コヒーレント点ドリフト (CPD) アルゴリズムを使用して 3 次元点群のレジストレーションを行います。

点群のレジストレーションと繋ぎ合わせ。

セグメンテーションおよび形状の近似

点群をクラスターにセグメント化し、幾何学的形状を点群に近似させます。自動運転アプリケーションとロボット工学アプリケーション用に LiDAR データ内の基平面をセグメント化します。

セグメント化された LiDAR 点群。

カメラ キャリブレーション

カメラの内部、外部、およびレンズ歪みのパラメーターを推定します。

単一カメラのキャリブレーション

カメラ キャリブレーター アプリを使用して、チェッカーボードの検出を自動化し、ピンホールカメラと魚眼レンズカメラのキャリブレーションを行います。

ステレオ カメラ キャリブレーション

深度の計算と 3 次元シーンの再構成を行うために、ステレオペアをキャリブレーションします。

ステレオ カメラ キャリブレーター アプリ。

3 次元ビジョンとステレオ ビジョン

複数の 2 次元ビューから、シーンの 3 次元構造を抽出します。ビジュアルオドメトリを使用して、カメラの動きと姿勢を推定します。

ステレオ ビジョン

ステレオカメラのペアを使用して、深度を推定し、3 次元シーンを再構築します。

相対深度を表すステレオ視差マップ。

特徴点検出、特徴量抽出およびマッチング

オブジェクト検出、画像レジストレーション、オブジェクト認識のための特徴ベースのワークフロー。

特徴点の検出、抽出、およびマッチングによる要素の多いシーンでのオブジェクト検出。

特徴に基づく画像レジストレーション

複数の画像において特徴をマッチングし、画像間の幾何学的変換を推定し、イメージシーケンスのレジスタリングを行います。

特徴に基づくレジストレーションによって作成されたパノラマ。

オブジェクト追跡と動き推定

ビデオシーケンスとイメージシーケンス内の動きを推定し、オブジェクトを追跡します。

追跡したオブジェクトの軌跡を示す追跡痕。

動き推定

オプティカルフロー、ブロックマッチング、およびテンプレート マッチングを使用して、ビデオフレーム間の動きを推定します。

固定カメラを使用した移動するオブジェクトの検出。

OpenCV インターフェイス

MATLAB と OpenCV ベースプロジェクトのインターフェイス。

コード生成

アルゴリズムの開発を、ラピッド プロトタイピング、実装および検証のワークフローと統合します。

新機能

Video lablerおよび Image Labeler

ピクセルラベルのコピーおよび貼り付け、改善したパンとズーム、フレーム移動、ライン ROI、および Image Labeler にサブラベルを追加

オブジェクト検出器でのデータ強化

画像と境界ボックスを変換

セマンティック セグメンテーション

DeepLab v3+ と 3D U-Net ネットワークを使用して画像と 3D ボリュームの個別のピクセルを分類

ディープラーニングでのオブジェクト検出

より高速な R-CNN エンドツーエンド学習、アンカーボックスの推定、マルチチャネル画像データの使用

ディープラーニングの加速

MEX 高速化を使用した YOLO v2 とセマンティック セグメンテーションの最適化

これらの機能および対応する関数の詳細については、リリースノートを参照してください。

無料評価版を入手する

30 日間の無料評価版はこちら

今すぐダウンロード

あなたは学生ですか?

MATLAB および Simulink 学生向けソフトウェアの入手

詳細を見る