認識する言語。'Language
' と文字ベクトル 'English'
、'Japanese'
、または文字ベクトルの cell 配列で構成されるコンマ区切りのペアとして指定します。追加の言語の OCR 言語データ ファイルのインストール パッケージをインストールしたり、カスタム言語を追加したりすることもできます。複数の言語を指定すると、選択したすべての言語の同時認識が可能になります。ただし、1 つ以上の言語を選択すると、精度が低下し、OCR の実行にかかる時間が長くなる場合があります。
OCR 言語データ ファイルのインストール パッケージに含まれる追加言語を指定するには、組み込みの言語と同じ方法で言語を表す文字ベクトルを使用します。パスを指定する必要はありません。
txt = ocr(img,'Language','Finnish');
サポート パッケージの OCR 言語のリスト
'Afrikaans'
'Albanian'
'AncientGreek'
'Arabic'
'Azerbaijani'
'Basque'
'Belarusian'
'Bengali'
'Bulgarian'
'Catalan'
'Cherokee'
'ChineseSimplified'
'ChineseTraditional'
'Croatian'
'Czech'
'Danish'
'Dutch'
'English'
'Esperanto'
'EsperantoAlternative'
'Estonian'
'Finnish'
'Frankish'
'French'
'Galician'
'German'
'Greek'
'Hebrew'
'Hindi'
'Hungarian'
'Icelandic'
'Indonesian'
'Italian'
'ItalianOld'
'Japanese'
'Kannada'
'Korean'
'Latvian'
'Lithuanian'
'Macedonian'
'Malay'
'Malayalam'
'Maltese'
'MathEquation'
'MiddleEnglish'
'MiddleFrench'
'Norwegian'
'Polish'
'Portuguese'
'Romanian'
'Russian'
'SerbianLatin'
'Slovakian'
'Slovenian'
'Spanish'
'SpanishOld'
'Swahili'
'Swedish'
'Tagalog'
'Tamil'
'Telugu'
'Thai'
'Turkish'
'Ukrainian'
独自のカスタム言語を使用するには、学習済みのデータ ファイルへのパスを言語を表す文字ベクトルとして指定します。<language>.traineddata
の形式でファイルに名前を付けなければなりません。ファイルは、'tessdata
' という名前のフォルダーに含まれていなければなりません。次に例を示します。
txt = ocr(img,'Language','path/to/tessdata/eng.traineddata');
複数のカスタム言語を文字ベクトルの cell 配列として読み込むことができます。
txt = ocr(img,'Language', ...
{'path/to/tessdata/eng.traineddata',...
'path/to/tessdata/jpn.traineddata'});
保存フォルダーは、cell 配列で指定したすべてのファイルについて常に同じでなければなりません。前述の例では、cell 配列のすべての
traineddata
ファイルがフォルダー ‘
path/to/tessdata
’ に含まれます。次のコードは 2 つの異なる保存フォルダーを指定しているため、機能しません。
txt = ocr(img,'Language', ...
{'path/one/tessdata/eng.traineddata',...
'path/two/tessdata/jpn.traineddata'});
言語ファイルによっては別の言語に依存している場合があります。たとえば、ヒンディー語の学習は英語に依存します。ヒンディー語を使用する場合は、ヒンディー語の
traineddata
ファイルと同じフォルダーに英語の
traineddata
ファイルも含まれていなければなりません。
ocr
は、
tesseract-ocr
3.02 または
OCR トレーナーを使用して作成された
traineddata
ファイルのみをサポートします。
MATLAB® Coder™ によって生成された配布先の場合: 生成された OCR 実行可能ファイルと言語データ ファイル フォルダーが同一場所に存在しなければなりません。tessdata
フォルダーの名前を tessdata
にしなければなりません。
英語の場合: C:/path/tessdata/eng.traineddata
日本語の場合: C:/path/tessdata/jpn.traineddata
カスタム データ ファイルの場合: C:/path/tessdata/customlang.traineddata
C:/path/ocr_app.exe
次から英語と日本語の学習済みデータ ファイルをコピーできます。
fullfile(matlabroot, 'toolbox','vision','visionutilities','tessdata');