最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

回転補正

この例では、ハフ変換と Polyfit ブロックを使用して、ビデオ シーケンス内で回転するテキストを水平に揃える方法を説明します。ここで説明する手法は、映像安定化および光学式文字認識 (OCR) に使用できます。

モデル例

次の図は「回転補正」のモデル例を示しています。

Hough Transform サブシステムを使用したテキストの整列

Smudge text サブシステム内のモルフォロジー演算子は、文字をぼかして、異なる 2 行からなるバイナリ イメージを作成します。このプロセスの結果は [Smudged Video] ウィンドウで確認できます。

ここではバイナリ イメージをハフ パラメーター空間に変換することで、Smudge text サブシステムで作成された 2 行の theta 値と rho 値を決定します。テキスト行の theta 値が判明したら、Rotate ブロックを使用して大きい角度変化を排除します。

後処理: Polynomial Fit サブシステムを使用したテキストの整列

この例では、Polyfit ブロック (slope correction サブシステム内) と Rotate ブロックを使用して、テキスト内の小さい角度変化を排除します。Polyfit ブロックは、不鮮明なテキストに直線をあてはめます。その後、slope correction サブシステムでラインの勾配と傾斜角を計算します。Rotate ブロックはこの角度を使用して小さい回転を補正します。

回転補正の結果

[Input Video] ウィンドウには元のビデオが表示されます。[Smudged video] ウィンドウには、異なる 2 行をもつバイナリ イメージを作成するために文字をぼかして得た結果が表示されます。[Hough Matrix] ウィンドウでは、2 つの際立った黄色いドットの x 座標と y 座標が、テキスト行の theta 値と rho 値にそれぞれ対応しています。[Corrected video] ウィンドウには、回転補正プロセスの結果が表示されます。