Main Content

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

光学式文字認識 (OCR)

光学式文字認識を使用したテキストの認識

イメージ内のテキストの認識は、コンピューター ビジョン アプリケーションでは一般的なタスクです。たとえば、走行中の車からビデオをキャプチャして、ドライバーに交通標識について知らせることができます。要素の多いシーンからテキストを切り出すと、光学式文字認識 (OCR) などの関連タスクが容易になります。

OCR 言語データ サポート ファイルには、OCR エンジンのページ Tesseract オープン ソース OCR エンジンからの学習済みの言語データ ファイルが含められています。これは関数 ocr で使用します。追加の言語ファイルは、関数 visionSupportPackages またはアドオン エクスプローラーを使用してダウンロードできます。アドオンのダウンロードの詳細は、アドオンの取得と管理を参照してください。

手順と例については、OCR 言語データ ファイルのインストールを参照してください。

アプリ

OCR トレーナー特定の文字セットを認識するよう光学式文字認識モデルを学習させる

関数

ocr光学式文字認識を使用したテキストの認識
ocrTextObject for storing OCR results
visionSupportPackagesStart installer to download, install, or uninstall Computer Vision Toolbox data

トピック

開始

光学式文字認識の使用