メインコンテンツ

Computer Vision Toolbox

Computer Vision Toolbox™ は、コンピューター ビジョン システムを設計し、テストするためのアルゴリズムとアプリを提供します。外観検査、オブジェクトの検出と追跡、および特徴の検出、抽出、マッチングを実行できます。単一カメラ、魚眼レンズ、ステレオ カメラ、およびマルチカメラ構成のキャリブレーション ワークフローを自動化できます。3 次元ビジョン向けの機能として、ツールボックスでは、ステレオ ビジョン、点群処理、structure from motion、およびリアルタイムでの Visual SLAM と点群 SLAM をサポートします。コンピューター ビジョン アプリを使用すると、自動化を使ってチームベースでグラウンド トゥルースをラベル付けできるだけでなく、カメラのキャリブレーションを行うことができます。

ツールボックスには、事前学習済みの畳み込みニューラル ネットワーク (CNN)、ビジョン トランスフォーマー、視覚言語モデルなど、さまざまな AI 技術が含まれています。イメージ分類、オブジェクト検出、セグメンテーション、姿勢推定、キャプション生成、および光学式文字認識 (OCR) などのタスクには、既製のモデルを使用することも、転移学習によって既製のモデルをさらにカスタマイズすることもできます。

C コード、C++ コード、GPU 実行用コード、およびハードウェア記述言語 (HDL) で書かれたコードを生成できます。

Computer Vision Toolbox 入門

Computer Vision Toolbox の基礎を学ぶ

特徴の検出、抽出、およびマッチング

関心点の検出、特徴記述子の抽出、特徴のマッチング、イメージのレジストレーションと検索

グラウンド トゥルースのイメージおよびビデオ

AI アシストによる自動化を使用してイメージやビデオに対話形式でラベルを付け、AI モデル用の学習データを作成し、大規模データ セットに対するチーム共同でのラベル付けを管理する

オブジェクトの検出とセグメント化

AI モデルを使用して、オブジェクト検出、テキスト認識 (OCR)、バーコード認識、基準マーカー認識、セマンティック セグメンテーション、およびインスタンス セグメンテーションを実行する

イメージとビデオの分類

AI モデルを使用してイメージやビデオを分類し、アクティビティ認識を実行する

視覚言語モデル

視覚言語モデルを使用して、イメージ分類、検索、キャプション生成、およびオブジェクト検出タスクを実行する

カメラのキャリブレーション

単一カメラ、魚眼レンズ、ステレオ カメラ、マルチカメラ、およびロボット ハンドアイの各構成における内部パラメーターおよび外部パラメーターのキャリブレーション ワークフローを自動化する

3 次元ビジョン

カメラ姿勢の推定、ステレオ ビジョンの実行、ステレオ イメージまたは structure from motion (SfM) からの 3 次元シーンの再構成、慣性センサー フュージョンによるリアルタイム visual SLAM の実装

オブジェクトの追跡と動きの推定

複数のオブジェクトの追跡、特徴点の追跡、オブジェクトの再識別 (ReID)、オプティカルフロー、およびテンプレート マッチング