Main Content

gpucoder.transpose

MATLAB 関数 transpose の最適化された GPU 実装

説明

B = gpucoder.transpose(A) は共有メモリを使用して GPU でアウトオブプレースの効率的な非共役転置を実行します。MATLAB® (コード生成コンテキスト外) から呼び出す場合、gpucoder.transpose は組み込み関数 transpose を呼び出します。

すべて折りたたむ

この例は CUDA® コードを生成して行列を転置します。

1 つのファイル内に、行列入力 A を受け入れるエントリポイント関数 myTranspose を記述します。関数 gpucoder.transpose を使用して A を転置する GPU の効率的な実装を生成します。

function B = myTranspose(A)
     B = gpucoder.transpose(A);
end

関数 codegen を使用して CUDA MEX 関数を生成します。

codegen -config coder.gpuConfig('mex') -args {ones(1024,1024,'double')} -report myTranspose

入力引数

すべて折りたたむ

入力配列。ベクトルまたは行列として指定します。

データ型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical | char
複素数のサポート: あり

出力引数

すべて折りたたむ

転置された配列。ベクトルまたは行列として返されます。

データ型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical | char

制限

  • gpucoder.transpose は、2 より大きい次元の入力をサポートしません。

バージョン履歴

R2019a で導入