実行速度

生成した C/C++ コードの実行速度の向上

コード生成オプションや最適化を使用して、生成されたコードの実行速度を向上させます。動的メモリ割り当てを変更または無効化できます。これらは、実行速度に影響を与える可能性があります。並列化されたコードは parfor ループを使用して生成できます。可能な場合は、最適化された既存の C コードと特殊なライブラリを利用して、実行速度を向上させます。

特定の条件に合わせたコードの最適化方法の詳細については、生成された C/C++ および MEX コードの最適化を参照してください。

関数

すべて展開する

実行時間の測定

`coder.timeit`	Measure execution time of generated C/C++ code (R2024b 以降)
`coder.perfCompare`	Compare execution times of MATLAB code and code generated using multiple configuration objects (R2024b 以降)

ループの最適化

`coder.loop.interchange`	Interchange loop indices in generated code (R2023a 以降)
`coder.loop.parallelize`	生成コードで特定の `for` ループを並列化 (自動並列化を無効化)
`coder.loop.reverse`	Reverse loop iteration order in generated code (R2023a 以降)
`coder.loop.tile`	Tile `for`-loops in the generated code (R2023a 以降)
`coder.loop.unrollAndJam`	Unroll and jam `for`-loops in the generated code (R2023a 以降)
`coder.loop.vectorize`	Vectorize `for` loops in generated code (R2023a 以降)
`coder.unroll`	各ループ反復でループ本体のコピーを作成することで、`for` ループを展開
`parfor`	`for` ループを並列化する

インライン化

`coder.inline`	生成されたコードで現在の関数のインライン化を制御する
`coder.inlineCall`	生成されたコードで呼び出される関数をインライン化する (R2024a 以降)
`coder.nonInlineCall`	生成されたコードで呼び出される関数のインライン化を防止する (R2024a 以降)

可変サイズデータ

`coder.areUnboundedVariableSizedArraysSupported`	現在のコンフィグレーション設定で非有界の可変サイズ配列が許可されているかどうかを確認する (R2024a 以降)
`coder.varsize`	サイズ非互換性エラーを解決して上限を宣言

定数畳み込み

coder.const 生成コードでの定数への式の畳み込み

外部コードの統合

coder.ceval 生成コードから C/C++ 関数を呼び出す

クラス

`coder.BLASCallback`	BLAS ライブラリと CBLAS ヘッダーおよび生成コードの BLAS 呼び出しのデータ型情報を指定する抽象クラス
`coder.LAPACKCallback`	生成されたコードでの LAPACK 呼び出しの LAPACK ライブラリおよび LAPACKE ヘッダーファイルを指定するための抽象クラス
`coder.fftw.StandaloneFFTW3Interface`	生成されたコード内で FFTW 呼び出しに対して FFTW ライブラリを指定する抽象クラス
`coder.loop.Control`	Customize loop optimizations in generated code (R2023a 以降)

トピック

生成コードの最適化

生成された C/C++ および MEX コードの最適化
生成された C/C++ および MEX コードの実行速度またはメモリ使用量を最適化する。
生成コードの MATLAB Coder の最適化
生成コードのパフォーマンスを改善するには、コードジェネレーターで最適化を使用します。
生成コードでの暗黙的な拡張の最適化
生成コードでの暗黙的な拡張は既定で有効になっています。

memcpy 最適化と memset 最適化

memcpy 最適化
コードジェネレーターは memcpy を使用して、生成されたコードを最適化します。
memset の最適化
コードジェネレーターは memset を使用して、生成されたコードを最適化します。

可変サイズの配列

可変サイズの配列に対するメモリ割り当ての制御
動的メモリ割り当てが使用される場合に制御します。
動的な配列のアクセスの最適化
生成された C コードでの動的な配列の実行時間を改善する。

配列のレイアウト

行優先の配列レイアウトを使用するコードの生成
行要素がメモリに連続して格納される C/C++ コードを生成します。

ループ

並列 for ループ (parfor) を使用したアルゴリズムの高速化
parfor ループの MEX 関数を生成します。
parfor ループ内での変数の分類
parfor ループ内の変数はループ変数、スライス化された変数、ブロードキャスト変数、リダクション変数または一時変数に分類されます。
parfor ループ内のスレッドの最大数の指定
特定の数の使用可能なコアでループ反復を並列に実行する MEX 関数を生成します。
生成コードで並列 for ループを実行するための最大スレッド数の指定
生成コードにおいて特定の数の使用可能なコアで並列 for ループを実行する。
parfor ループ内のリダクション代入
リダクション変数は、すべてのループ反復に同時に依存する値を累積します。
parfor ループのコンパイルの制御
parfor ループを、単一のスレッドで実行される parfor ループとして処理します。
macOS プラットフォームへの OpenMP ライブラリのインストール
OpenMP ライブラリをインストールして、macOS プラットフォームで並列 for ループを生成します。
ループ内の冗長な演算の最小化
可能であれば演算をループ外に移動します。
for ループおよび parfor ループの展開
ループ展開を制御します。
生成コードでの for ループの自動並列化
MATLAB^® Coder™ は、生成される C/C++ コードにおいて、既定では Open Multiprocessing (OpenMP) ライブラリを使用して for ループを自動的に並列化します。
Reduction Operations Supported for Automatic Parallelization of for-loops
Supported operations for automatic parallelization of for-loops.
Generate SIMD Code from MATLAB Functions for Intel Platforms
Improve the execution speed of the generated code using Intel^® SSE and Intel AVX technology.
Optimize Loops in Generated Code
Generate code with loop transformations according to your performance requirements.

関数呼び出し

生成されたコードでの関数入力のデータコピーの回避
入力引数に参照渡しを使用するコードを生成する。
生成コードのパフォーマンスと可読性を微調整するためのインライン化の制御
インライン化によって関数呼び出しのオーバーヘッドは排除されますが、大きい C/C++ コードが生成され、コードの可読性が低下する可能性があります。

数値的なエッジケース

整数オーバーフローまたは非有限のサポートの無効化
整数オーバーフローまたは非有限を処理するサポートコードの生成を抑制してパフォーマンスを改善します。

外部コードの統合

生成されたコードでの LAPACK 呼び出し
LAPACK 関数の呼び出しによって、特定の線形代数関数に対して生成されたコードの実行速度を改善します。
生成されたコードでの BLAS 呼び出し
BLAS 関数の呼び出しによって、特定の低水準なベクトルと行列の演算用に生成されたコードの実行速度が改善します。
高速フーリエ変換関数の生成コードの最適化
ワークフローおよびターゲットハードウェアに応じた正しい高速フーリエ変換の実装を選択する。
外部コードまたはカスタムコードの統合
独自に最適化したコードを統合してパフォーマンスを改善します。
Speed Up of Standalone Generated Code Using Preconfigured BLAS and LAPACK Callbacks
Use BLAS and LAPACK calls to improve the execution speed of generated code.
生成されたスタンドアロンコードでの LAPACK 呼び出しを使用した線形代数の高速化
特定の線形代数関数に対して LAPACK 呼び出しを生成する。使用する LAPACK ライブラリを指定する。
生成されたスタンドアロンコードでの BLAS 呼び出しを使用した行列演算の高速化
特定の低水準行列演算の BLAS 呼び出しを生成します。使用する BLAS ライブラリを指定します。
生成されたスタンドアロンコードでの FFTW ライブラリ呼び出しを使用した高速フーリエ変換の高速化
高速フーリエ変換のための FFTW ライブラリ呼び出しを生成する。FFTW ライブラリを指定する。
生成されたスタンドアロンコードでのマルチスレッドアクセスの FFTW 計画との同期
FFT ライブラリコールバッククラスのメソッドを実装し、サポート C コードを提供して FFTW 計画への同時アクセスを行わないようにする。