Normalized Reciprocal HDL Optimized

CORDIC アルゴリズムを使って正規化逆数を計算して最適化された HDL コードを生成

このページをすべて展開する

ライブラリ:
Fixed-Point Designer HDL Support / Math Operations

説明

Normalized Reciprocal HDL Optimized ブロックは u の正規化逆数を計算します。0.5 < |y| ≤ 1 および 2^ey = 1/u となる y および e として返されます。

u = 0 で u が固定小数点データ型またはスケーリングされた double データ型の場合、y = 1 – eps(y) で e = 2^nextpow2(w) – w + f です。ここで w は u の語長、f は u の小数部の長さです。
u = 0 で u が浮動小数点データ型の場合、y = Inf で e = 1 です。

例

HDL 用に最適化した正規化逆数の使用方法

この例では、関数 normalizedReciprocal および Normalized Reciprocal HDL Optimized ブロックを使用して入力の正規化逆数を計算する方法と、使用のタイミングを示します。

スクリプトを開く

Customize Output Value of Real Divide HDL Optimized Block When Denominator Is Zero

Use the divideByZero port to customize the value of the block output when division by zero occurs.

ライブスクリプトを開く

How to Set CORDIC Input Word Length and Maximum Shift Value to Achieve Desired Precision

Provides a starting point for the input data type and number of iterations or maximum shift value required for the CORDIC algorithm to achieve a desired accuracy.

ライブスクリプトを開く

端子

入力

すべて展開する

u — 正規化逆数を求める値
実数スカラー

正規化逆数を求める値。実数のスカラーとして指定します。

傾きとバイアス表現は固定小数点データ型ではサポートされていません。

データ型: single | double | fixed point

validIn — 入力が有効であるかどうか
`Boolean` スカラー

入力が有効であるかどうか。boolean スカラーとして指定します。この制御信号は u 入力端子からのデータが有効であるかどうかを示します。この値が 1 (true) の場合、ブロックは u 入力端子の値を取得します。この値が 0 (false) の場合、ブロックは入力サンプルを無視します。

データ型: Boolean

出力

すべて展開する

y — 正規化逆数
スカラー

0.5 < |y| ≤ 1 および 2^ey = 1/u となる正規化逆数。スカラーとして返されます。

端子 u の入力が語長 w の符号付きの固定小数点データ型またはスケーリングされた double データ型の場合、y は語長が w で小数部の長さが w – 2 の符号付きの固定小数点データ型またはスケーリングされた double データ型です。
端子 u の入力が語長 w の符号なしの固定小数点データ型またはスケーリングされた double データ型の場合、y は語長が w で小数部の長さが w – 1 の符号なしの固定小数点データ型またはスケーリングされた double データ型です。
端子 u の入力が double の場合、y は double です。
端子 u の入力が single の場合、y は single です。

データ型: single | double | fixed point

e — 指数
整数スカラー

0.5 < |y| ≤ 1 および 2^ey = 1/u となる指数。整数スカラーとして返されます。

データ型: int32

divideByZero — 出力の値がゼロ除算の結果であるかどうか
`Boolean` スカラー

R2024b 以降

y および e 出力端子の値がゼロ除算演算の結果であるかどうか。boolean スカラーとして返されます。この信号の値が 1 (true) の場合、y および e 端子の対応する出力値は、ゼロ除算の結果です。この信号の値が 0 (false) の場合、y および e 端子の対応する出力値は、非ゼロ値による除算の結果です。

除数 u がゼロかどうか。boolean スカラーとして返されます。この信号の値が 1 (true) の場合、u 端子の入力はゼロであり、ゼロ除算演算になります。この信号の値が 0 (false) の場合、u 端子の入力は非ゼロ値です。

依存関係

この端子を有効にするには、[ゼロ除算端子を表示] パラメーターを選択します。

ヒント

既定のゼロ除算の動作の説明については、ゼロ除算の動作を参照してください。

データ型: Boolean

validOut — 出力データが有効であるかどうか
`Boolean` スカラー

出力データが有効であるかどうか。boolean スカラーとして返されます。この制御信号の値が 1 (true) の場合、ブロックは端子 y および e の出力を正常に計算しています。この値が 0 (false) の場合、出力データは有効ではありません。

データ型: Boolean

パラメーター

すべて展開する

ゼロ除算端子を表示 — `divideByZero` 端子を表示するかどうか
`off` (既定値) | `on`

R2024b 以降

divideByZero 端子を表示する場合は、このパラメーターを選択します。

プログラムでの使用

ブロックパラメーターの値をプログラムで設定するには、関数 set_param を使用します。

ブロックパラメーターの値をプログラムで取得するには、関数 get_param を使用します。

パラメーター:	`dbzPort`
値:	`0` (false) (既定値) \| `1` (true)
データ型:	`logical`

例: set_param(gcb,"dbzPort",1)

入力の語長に基づいて CORDIC の最大シフト値を自動選択 — 入力の語長に基づいて CORDIC の最大シフト値を自動選択
`on` (既定値) | `off`

R2024b 以降

入力の語長に基づいて CORDIC の最大シフト値を自動選択します。このパラメーターが選択されている場合、既定の CORDIC の maximumShiftValue は wl - 1 に等しくなります。ここで、wl = u.WordLength + ~issigned(u) です。

プログラムでの使用

ブロックパラメーターの値をプログラムで設定するには、関数 set_param を使用します。

ブロックパラメーターの値をプログラムで取得するには、関数 get_param を使用します。

パラメーター:	`autoMaximumShiftVal`
値:	`on` (既定値) \| `off`
データ型:	`char` \| `string`

例: set_param(gcb,"autoMaximumShiftVal","off")

CORDIC の最大シフト値 — 双曲線ベクトル CORDIC の最大シフト値
`wl - 1` (既定値) | `10` | 正の整数値のスカラー

R2024b 以降

双曲線ベクトル CORDIC の最大シフト値。正の整数値スカラーとして指定します。このパラメーターの既定値は wl - 1 です。ここでは wl = u.WordLength + ~issigned(u) です。

依存関係

このパラメーターを有効にするには、[入力の語長に基づいて CORDIC の最大シフト値を自動選択] パラメーターを選択解除します。

ヒント

詳細については、カスタマイズ可能なパイプラインを参照してください。

プログラムでの使用

ブロックパラメーターの値をプログラムで設定するには、関数 set_param を使用します。

ブロックパラメーターの値をプログラムで取得するには、関数 get_param を使用します。

パラメーター:	`maximumShiftValue`
値:	`10` (既定値) \| positive integer-valued scalar
データ型:	`char` \| `string`

例: set_param(gcb,"maximumShiftValue","10")

パイプラインレジスタあたりの反復回数 — パイプラインステージごとに実行する CORDIC の反復回数
`1` (既定値) | 正の整数値のスカラー

R2024b 以降

パイプラインステージごとに実行する CORDIC の反復回数。正の整数値のスカラーとして指定します。

ヒント

詳細については、カスタマイズ可能なパイプラインを参照してください。
詳細と、このパラメーターがレイテンシとハードウェアリソースの使用率に与える影響を示す例については、Normalized Reciprocal HDL Optimized ブロックとのインターフェイスとハードウェアリソースの使用を参照してください。

プログラムでの使用

ブロックパラメーターの値をプログラムで設定するには、関数 set_param を使用します。

ブロックパラメーターの値をプログラムで取得するには、関数 get_param を使用します。

パラメーター:	`nIterPerReg`
値:	`1` (既定値) \| positive integer-valued scalar
データ型:	`char` \| `string`

例: set_param(gcb,"nIterPerReg","2")

ヒント

Normalized Reciprocal HDL Optimized ブロックの動作は normalizedReciprocal 関数と同じです。入力のデータ型が 2 進小数点スケーリングによる固定小数点の場合、関数とブロックはビット単位で正確に一致する結果を提供します。

アルゴリズム

すべて展開する

CORDIC

CORDIC は、COordinate Rotation DIgital Computer の略語です。ギブンス回転に基づく CORDIC アルゴリズムは、Shift-Add 反復演算のみを必要とするため、ハードウェア効率が最も優れたアルゴリズムの 1 つです (参考文献を参照)。CORDIC アルゴリズムは、明示的な乗数を必要としません。CORDIC を使用すると、正弦関数、余弦関数、逆正弦関数、逆余弦関数、逆正接関数、ベクトル振幅関数などのさまざまな関数を計算できます。また、このアルゴリズムは除算、平方根、双曲線、対数などの関数にも使用できます。

CORDIC アルゴリズムの精度は、使用されるデータ型と CORDIC カーネルの最大シフト値または最大反復回数の関数になります。より語長が長いデータ型を使用し、CORDIC アルゴリズムの反復回数を増やすほど、結果の数値誤差を減らすことができます。ただし、これを行うと計算のレイテンシも増加し、より多くのハードウェアリソースが利用されます。詳細については、How to Set CORDIC Input Word Length and Maximum Shift Value to Achieve Desired Precisionを参照してください。

Normalized Reciprocal HDL Optimized ブロックとのインターフェイス

Normalized Reciprocal HDL Optimized ブロックは、完全にパイプライン化されるという性質から、連続するクロックサイクルを含む任意のサイクルで入力データを受け入れることができます。入力データをブロックに送信するには、validIn 信号が true でなければなりません。ブロックが計算を終え、出力を送信する準備ができると、1 クロックサイクルの間、validOut を true に変更します。連続するサイクルの入力のセットの場合、連続するサイクルでも validOut が true に設定されます。

レイテンシは入力から対応する出力までとして定義されます。レイテンシは入力のデータ型によって異なります。これを次の表にまとめます。

入力の型レイテンシ

入力の型	レイテンシ
固定小数点またはスケーリングされた double `fi`	`ceil((nextpow2(u.WordLength) + maximumShiftValue)/nIterPerReg) + 1` ここで、 `wl = u.WordLength + ~issigned(u)` `maximumShiftValue = wl - 1` (またはユーザーが指定した値)
浮動小数点	`0`

固定小数点またはスケーリングされた double fi

ceil((nextpow2(u.WordLength) + maximumShiftValue)/nIterPerReg) + 1

ここで、

wl = u.WordLength + ~issigned(u)

maximumShiftValue = wl - 1 (またはユーザーが指定した値)

浮動小数点

0

カスタマイズ可能なパイプライン

Normalized Reciprocal HDL Optimized ブロックは、反復正規化と CORDIC ベースの除算アルゴリズムを実装する完全にパイプライン化されたアーキテクチャを使用します。入力 u が固定小数点またはスケーリングされた double データ型の場合、ブロックは計算に複数のパイプラインステージを使用します。入力が符号付きデータ型の場合、正規化には nextpow2(u.WordLength) 回の反復が必要です。CORDIC の反復回数は、[CORDIC の最大シフト値] パラメーターの値によって異なります。語長が長いほど分解能は高くなりますが、処理にはより多くの反復が必要になります。Normalized Reciprocal HDL Optimized ブロックはパイプラインステージごとに複数回の反復を実行できます。そのため、生成された HDL コードでクリティカルパスは長くなりますが、レイテンシは短縮します。

たとえば、入力 u の語長が 18 の場合、正規化には 5 回の反復が必要です。[入力の語長に基づいて CORDIC の最大シフト値を自動選択] パラメーターが選択されている場合、CORDIC の最大シフト値は 18 - 1 = 17 となり、17 回の反復が必要になります。反復の総数は 5 + 17 = 22 で、ブロックのレイテンシは ceil((total number of iterations)/nIterPerReg) + 1 です。パイプラインレジスタごとの反復回数が 1 に設定されている場合、ブロックレイテンシは 23 です。パイプラインレジスタごとの反復回数が 2 に設定されている場合、ブロックレイテンシは 12 といったようになります。パイプラインレジスタごとの反復回数が必要な反復の総数より大きい場合、ブロックは 1 つのパイプラインステージですべての反復を実行し、合計レイテンシは 2 に最小化されます。

ハードウェアリソースの使用

このブロックは、Simulink^® HDL ワークフローアドバイザーを使用した HDL コード生成をサポートしています。例については、Simulink モデルからの HDL コード生成と FPGA 合成 (HDL Coder)およびImplement Digital Downconverter for FPGA (DSP HDL Toolbox)を参照してください。

この例のデータは、Xilinx^® Zynq^®-7000 xc7z045 SoC でブロックを合成して生成したものです。合成ツールは Vivado^® v2023.1.2 です。

次の合成結果は、レイテンシとハードウェアリソースの使用率に対する [パイプラインレジスタあたりの反復回数] パラメーターの影響を示しています。

nIterPerReg = 1

合成には次のパラメーターが使用されました。

入力データ型: sfix18_en10
入力の語長に基づいて CORDIC の最大シフト値を自動選択: on
パイプラインレジスタあたりの反復回数: 1
ターゲット周波数: 500 MHz
この構成のレイテンシ: 23

リソース	使用	使用可能	使用率 (%)
スライス LUT	586	218600	0.27
スライスレジスタ	703	437200	0.16
DSP	0	900	0.00
ブロック RAM タイル	0	545	0.00
URAM	0	0

	値
要件	2 ns (500 MHz)
データパス遅延	1.74 ns
スラック	0.109 ns
クロック周波数	528.82 MHz

nIterPerReg = 2

合成には次のパラメーターが使用されました。

入力データ型: sfix18_en10
入力の語長に基づいて CORDIC の最大シフト値を自動選択: on
パイプラインレジスタあたりの反復回数: 2
ターゲット周波数: 300 MHz
この構成のレイテンシ: 12

リソース	使用	使用可能	使用率 (%)
スライス LUT	470	218600	0.22
スライスレジスタ	374	437200	0.09
DSP	0	900	0.00
ブロック RAM タイル	0	545	0.00
URAM	0	0

	値
要件	3.3333 ns (300 MHz)
データパス遅延	2.65 ns
スラック	0.676 ns
クロック周波数	376.32 MHz

nIterPerReg = 3

合成には次のパラメーターが使用されました。

入力データ型: sfix18_en10
入力の語長に基づいて CORDIC の最大シフト値を自動選択: on
パイプラインレジスタあたりの反復回数: 3
ターゲット周波数: 200 MHz
この構成のレイテンシ: 9

リソース	使用	使用可能	使用率 (%)
スライス LUT	451	218600	0.21
スライスレジスタ	281	437200	0.06
DSP	0	900	0.00
ブロック RAM タイル	0	545	0.00
URAM	0	0

	値
要件	5 ns (200 MHz)
データパス遅延	3.863 ns
スラック	1.13 ns
クロック周波数	258.40 MHz

参照

[1] Volder, Jack E. “The CORDIC Trigonometric Computing Technique.” IRE Transactions on Electronic Computers. EC-8, no. 3 (Sept. 1959): 330–334.

[2] Andraka, Ray. “A Survey of CORDIC Algorithm for FPGA Based Computers.” In Proceedings of the 1998 ACM/SIGDA Sixth International Symposium on Field Programmable Gate Arrays, 191–200. https://dl.acm.org/doi/10.1145/275107.275139.

[3] Walther, J.S. “A Unified Algorithm for Elementary Functions.” In Proceedings of the May 18-20, 1971 Spring Joint Computer Conference, 379–386. https://dl.acm.org/doi/10.1145/1478786.1478840.

[4] Schelin, Charles W. “Calculator Function Approximation.” The American Mathematical Monthly, no. 5 (May 1983): 317–325. https://doi.org/10.2307/2975781.

拡張機能

すべて展開する

C/C++ コード生成
Simulink® Coder™ を使用して C および C++ コードを生成します。

傾きとバイアス表現は固定小数点データ型ではサポートされていません。

HDL コード生成
HDL Coder™ を使用して FPGA 設計および ASIC 設計のための VHDL、Verilog および SystemVerilog のコードを生成します。

HDL Coder™ には、HDL の実装および合成されたロジックに影響する追加のコンフィギュレーションオプションがあります。

HDL アーキテクチャ

このブロックには 1 つの既定の HDL アーキテクチャがあります。

HDL ブロックプロパティ

一般
ConstrainedOutputPipeline	既存の遅延を設計内で移動することによって出力に配置するレジスタの数。分散型パイプラインではこれらのレジスタは再分散されません。既定の設定は `0` です。詳細については、ConstrainedOutputPipeline (HDL Coder)を参照してください。
R2024b において: FlattenHierarchy	生成された HDL コードから PWM Reference Generator ブロック階層を削除します。既定の設定は `[inherit]` です。FlattenHierarchy (HDL Coder)も参照してください。
InputPipeline	生成されたコードに挿入する入力パイプラインステージ数。分散型パイプラインと制約付き出力パイプラインでは、これらのレジスタを移動できます。既定の設定は `0` です。詳細については、InputPipeline (HDL Coder)を参照してください。
OutputPipeline	生成されたコードに挿入する出力パイプラインステージ数。分散型パイプラインと制約付き出力パイプラインでは、これらのレジスタを移動できます。既定の設定は `0` です。詳細については、OutputPipeline (HDL Coder)を参照してください。

制限

固定小数点データ型のみをサポートします。

バージョン履歴

R2020a で導入

すべて展開する

R2024b: カスタムパイプライン、レイテンシとリソース使用率の改善、オプションのゼロ除算端子

Normalized Reciprocal HDL Optimized ブロックにいくつかの改善が加えられました。

カスタムパイプラインが新しい [CORDIC の最大シフト値] パラメーターと [パイプラインレジスタあたりの反復回数] パラメーターを介してサポートされます。
このブロックのレイテンシが短縮されました。レイテンシは、指定されたデータ型とパイプライン構成によって異なります。詳細については、Normalized Reciprocal HDL Optimized ブロックとのインターフェイスを参照してください。
HDL リソースの使用率がさらに最適化され、必要なハードウェアリソースが減りました。合成結果の例については、ハードウェアリソースの使用を参照してください。
対応する出力がゼロ除算の結果である場合にフラグを出力するオプションの divideByZero 端子が追加されました。

参考

関数

normalizedReciprocal

Normalized Reciprocal HDL Optimized

説明

例

HDL 用に最適化した正規化逆数の使用方法

Customize Output Value of Real Divide HDL Optimized Block When Denominator Is Zero

How to Set CORDIC Input Word Length and Maximum Shift Value to Achieve Desired Precision

端子

入力

u — 正規化逆数を求める値 実数スカラー

validIn — 入力が有効であるかどうか Boolean スカラー

出力

y — 正規化逆数 スカラー

e — 指数 整数スカラー

divideByZero — 出力の値がゼロ除算の結果であるかどうか Boolean スカラー

依存関係

ヒント

validOut — 出力データが有効であるかどうか Boolean スカラー

パラメーター

ゼロ除算端子を表示 — divideByZero 端子を表示するかどうか off (既定値) | on

プログラムでの使用

入力の語長に基づいて CORDIC の最大シフト値を自動選択 — 入力の語長に基づいて CORDIC の最大シフト値を自動選択 on (既定値) | off

プログラムでの使用

CORDIC の最大シフト値 — 双曲線ベクトル CORDIC の最大シフト値 wl - 1 (既定値) | 10 | 正の整数値のスカラー

依存関係

ヒント

プログラムでの使用

パイプライン レジスタあたりの反復回数 — パイプライン ステージごとに実行する CORDIC の反復回数 1 (既定値) | 正の整数値のスカラー

ヒント

プログラムでの使用

ヒント

アルゴリズム

CORDIC

Normalized Reciprocal HDL Optimized ブロックとのインターフェイス

カスタマイズ可能なパイプライン

ハードウェア リソースの使用

参照

拡張機能

C/C++ コード生成 Simulink® Coder™ を使用して C および C++ コードを生成します。

HDL コード生成 HDL Coder™ を使用して FPGA 設計および ASIC 設計のための VHDL、Verilog および SystemVerilog のコードを生成します。

バージョン履歴

R2024b: カスタム パイプライン、レイテンシとリソース使用率の改善、オプションのゼロ除算端子

参考

関数

u — 正規化逆数を求める値
実数スカラー

validIn — 入力が有効であるかどうか
`Boolean` スカラー

y — 正規化逆数
スカラー

e — 指数
整数スカラー

divideByZero — 出力の値がゼロ除算の結果であるかどうか
`Boolean` スカラー

validOut — 出力データが有効であるかどうか
`Boolean` スカラー

ゼロ除算端子を表示 — `divideByZero` 端子を表示するかどうか
`off` (既定値) | `on`

入力の語長に基づいて CORDIC の最大シフト値を自動選択 — 入力の語長に基づいて CORDIC の最大シフト値を自動選択
`on` (既定値) | `off`

CORDIC の最大シフト値 — 双曲線ベクトル CORDIC の最大シフト値
`wl - 1` (既定値) | `10` | 正の整数値のスカラー

パイプラインレジスタあたりの反復回数 — パイプラインステージごとに実行する CORDIC の反復回数
`1` (既定値) | 正の整数値のスカラー

ハードウェアリソースの使用

C/C++ コード生成
Simulink® Coder™ を使用して C および C++ コードを生成します。

HDL コード生成
HDL Coder™ を使用して FPGA 設計および ASIC 設計のための VHDL、Verilog および SystemVerilog のコードを生成します。

R2024b: カスタムパイプライン、レイテンシとリソース使用率の改善、オプションのゼロ除算端子