最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。
GPU Coder™ で生成されたコードが予想どおりに実行されない最もよくある理由は、以下のとおりです。
CUDA® カーネルが作成されていない。
ホストからデバイスおよびデバイスからホストへのメモリ転送 (cudaMemcpy
) によってパフォーマンスが抑制されている。
並列化不足またはデバイスに問題がある。
このトピックでは、これらの現象の一般的な原因について詳しく説明し、組み込みのスクリーナーを利用してこれらの問題を検出する方法を説明します。また、これらの問題に対処し、より効率的な CUDA コードを生成する方法についての情報も見つけることができます。
GPU Coder | MATLAB コードからの GPU コードの生成 |
Check GPU Install | GPU コード生成環境の検証と設定 |
codegen | MATLAB コードから C/C++ コードを生成する |
gpucoder | GPU Coder アプリを開く |
coder.gpu.kernel | for ループを GPU カーネルにマッピングするプラグマ |
coder.gpu.kernelfun | 関数を GPU カーネルにマッピングするプラグマ |
coder.gpu.nokernel | ループのカーネル作成を無効にするプラグマ |
gpucoder.profile | 生成された CUDA コード用の実行プロファイル レポートの作成 |
coder.gpuConfig | GPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター |
coder.CodeConfig | MATLAB コードから C/C++ コードを生成するための構成パラメーター |
coder.EmbeddedCodeConfig | Embedded Coder で MATLAB コードから C/C++ コードを生成するための構成パラメーター |
coder.gpuEnvConfig | GPU コード生成環境チェックを実行するために coder.checkGpuInstall に渡されるパラメーターが含まれる構成オブジェクトの作成 |
GPU Coder トラブルシューティング ワークフロー。
コード生成レポートを作成して確認する。
生成された CUDA コードおよび MATLAB ソース コード間でのトレース
GPU で実行される MATLAB コードのセクションを強調表示する。
MATLAB コードから生成されたコードに対する GPU コード メトリクス レポートの作成
GPU 静的コード メトリクス レポートを作成して確認する。
効率的な CUDA カーネルを生成するための推奨事項。
GPU Coder を使用するとメモリ ボトルネックの問題が減る。
MATLAB アルゴリズムとその生成された CUDA コードについての SIL による詳細なプロファイリング。
NVIDIA Profiler (nvvp) から取得された情報を使用したパフォーマンスの改善。
GPU Coder の現在の制限を確認する。