Main Content

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

パフォーマンス

コード生成の問題をトラブルシューティングし、コード実行時間を改善して、生成コードのメモリ使用量を削減する

GPU Coder™ で生成されたコードが予想どおりに実行されない最もよくある理由は、以下のとおりです。

  • CUDA® カーネルが作成されていない。

  • ホストからデバイスおよびデバイスからホストへのメモリ転送 (cudaMemcpy) によってパフォーマンスが抑制されている。

  • 並列化不足またはデバイスに問題がある。

このトピックでは、これらの現象の一般的な原因について詳しく説明し、組み込みのスクリーナーを利用してこれらの問題を検出する方法を説明します。また、これらの問題に対処し、より効率的な CUDA コードを生成する方法についての情報も見つけることができます。

アプリ

すべて展開する

GPU CoderMATLAB コードからの GPU コードの生成
GPU 環境のチェックGPU コード生成環境の検証と設定

関数

すべて展開する

codegenMATLAB コードから C/C++ コードを生成する
gpucoderGPU Coder アプリを開く
gpucoder.profile生成された CUDA コード用の実行プロファイル レポートの作成
coder.gpu.kernelfor ループを GPU カーネルにマッピングするプラグマ
coder.gpu.kernelfun関数を GPU カーネルにマッピングするプラグマ
coder.gpu.nokernelループのカーネル作成を無効にするプラグマ

オブジェクト

すべて展開する

coder.gpuConfigGPU Coder を使用した MATLAB コードからの CUDA コード生成用の構成パラメーター
coder.CodeConfigMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.EmbeddedCodeConfigEmbedded CoderMATLAB コードから C/C++ コードを生成するための構成パラメーター
coder.gpuEnvConfigGPU コード生成環境チェックを実行するために coder.checkGpuInstall に渡されるパラメーターが含まれる構成オブジェクトの作成

トピック