ARM Neon ターゲット用の深層学習コードのクロスコンパイル

この例では次を使用します。

この例では、生成された深層学習コードをクロスコンパイルして、ライブラリまたは実行可能なファイルを作成し、ライブラリまたは実行可能なファイルを Hikey 960 や Rock 960 などの ARM® ターゲットで展開する方法を説明します。この例では、codegen コマンドを使用します。

ARM® ターゲットの深層学習コードのクロスコンパイルには、次の手順が含まれます。

インストールされているクロスコンパイラツールチェーンを設定して、ホスト MATLAB® でコンパイルを実行します。ホストコンピューターの MATLAB で codegen コマンドを実行すると、コンパイルが行われます。
codegen コマンドを使用して、生成されたコードをビルドし、ホストコンピューター上にライブラリまたは実行可能なファイルを作成します。
生成されたライブラリまたは実行可能なファイルと、その他のサポートファイルをターゲットハードウェアにコピーします。ホストコンピューター上にライブラリを生成する場合は、コピーした makefile をターゲットでコンパイルして実行可能ファイルを作成します。
生成された実行可能ファイルをターゲット ARM ハードウェアで実行します。

このワークフローは、Neon|SIMD 命令セットをサポートする任意の ARM Neon ターゲットで使用できます。この例は、ホスト Linux® プラットフォームでのみサポートされます。

前提条件

NEON|SIMD 拡張をサポートする ARM プロセッサ
ARM Compute Library (ホストコンピューター上)
MATLAB® Coder™
MATLAB Coder Interface for Deep Learning サポートパッケージ
Deep Learning Toolbox™
Deep Learning Toolbox Model for Inception-v3 Network サポートパッケージ
Image Processing Toolbox™
armv7 (32 ビット Arm アーキテクチャ) ターゲットに展開する場合、GNU/GCC g++-arm-linux-gnueabihf ツールチェーン
armv8 (64 ビット Arm アーキテクチャ) ターゲットに展開する場合、GNU/GCC g++-aarch64-linux-gnu ツールチェーン
クロスコンパイラおよびライブラリの環境変数

クロスコンパイラツールチェーンをインストールし、関連する環境変数を設定する方法の詳細については、ARM Compute Library を使用する深層学習コードのクロスコンパイル (MATLAB Coder)を参照してください。

この例で使用されている ARM Compute Library のバージョンは、コード生成でサポートされている最新バージョンではない可能性があります。サポートされているライブラリのバージョン、および環境変数の詳細については、深層学習に MATLAB Coder を使用するための前提条件 (MATLAB Coder)を参照してください。

この例のコード行はコメントアウトされています。例を実行する前に、コメントを解除してください。

この例は、MATLAB Online ではサポートされていません。

エントリポイント関数 `inception_predict_arm`

この例では、Inception-V3 イメージ分類ネットワークを使用します。MATLAB 用の事前学習済み Inception-V3 ネットワークは、Deep Learning Toolbox Model for Inception-V3 Network サポートパッケージに含まれています。エントリポイント関数 inception_predict_arm は、Inception-V3 ネットワークを永続的なネットワークオブジェクトに読み込みます。それ以降、この関数を呼び出すと、永続オブジェクトが再利用されます。

type inception_predict_arm

function out = inception_predict_arm(in)

persistent net;
if isempty(net)
    net = coder.loadDeepLearningNetwork('inceptionv3','inceptionv3');
end

out = net.predict(in);

end

深層学習構成オブジェクトの設定

coder.ARMNEONConfig オブジェクトを作成します。ARM Compute Library のバージョンと ARM アーキテクチャを指定します。

dlcfg = coder.DeepLearningConfig('arm-compute');
dlcfg.ArmComputeVersion = '20.02.1';
dlcfg.ArmArchitecture = 'armv8'; % or 'armv7'

入力イメージ peppers.png を分類するには、イメージをテキストファイルに変換します。

generateImagetoTxt('peppers.png');

1 番目の方法: ホスト上でのエントリポイント関数のスタティックライブラリの作成

この方法では、最初に、生成されたコードをクロスコンパイルして、ホストコンピューター上にスタティックライブラリを作成します。次に、生成されたスタティックライブラリ、ARM Compute Library ファイル、makefile、その他のサポートファイルをターゲットハードウェアに転送します。ターゲットハードウェアで makefile を実行して、実行可能ファイルを生成します。最後に、ターゲットハードウェアで実行可能ファイルを実行します。

コード生成構成オブジェクトの設定

スタティックライブラリ用のコード生成構成オブジェクトを作成します。ターゲット言語を C++ に指定します。

cfg = coder.config('lib');
cfg.TargetLang = 'C++';

コード生成構成オブジェクトに深層学習構成オブジェクトを追加します。

cfg.DeepLearningConfig = dlcfg;

クロスコンパイラツールチェーンの設定

ターゲットデバイスの ARM アーキテクチャに基づいてクロスコンパイラツールチェーンを設定します。

cfg.Toolchain =  'Linaro AArch64 Linux v6.3.1';% When the Arm Architecture is armv8

cfg.Toolchain =  'Linaro AArch32 Linux v6.3.1';% When the Arm Architecture is armv7

codegen を使用したホストコンピューターでのスタティックライブラリの生成

codegen コマンドを使用して、エントリポイント関数のコードを生成し、生成されたコードをビルドし、ターゲット ARM アーキテクチャのスタティックライブラリを作成します。

codegen -config cfg inception_predict_arm -args {ones(299,299,3,'single')} -d arm_compute_cc_lib -report

生成されてクロスコンパイルされたスタティックライブラリのターゲットハードウェアへのコピー

スタティックライブラリ、ビンファイル、およびヘッダーファイルを、生成されたフォルダー arm_compute_cc_lib からターゲット ARM ハードウェアにコピーします。このコード行とその後に続く他のコード行で、次のように置き換えます。

password: 自分のパスワード
username: 自分のユーザー名
hostname: 自分のデバイス名
targetDir: ファイルの保存先フォルダー

system('sshpass -p password scp -r arm_compute_cc_lib/*.bin arm_compute_cc_lib/*.lib arm_compute_cc_lib/*.h arm_compute_cc_lib/*.hpp username@hostname:targetDir/');

ARM Compute Library ファイルのターゲットハードウェアへのコピー

実行可能ファイルは、実行時に ARM Compute Library ファイルを使用します。ターゲットボードは、実行可能ファイルの生成時と実行可能ファイルの実行時にヘッダーファイルを必要としません。ライブラリを目的のパスにコピーします。

system(['sshpass -p password scp -r ' fullfile(getenv('ARM_COMPUTELIB'),'lib') ' username@hostname:targetDir/']);

サポートファイルのターゲットハードウェアへのコピー

次のファイルをターゲット ARM ハードウェアにコピーします。

スタティックライブラリから実行可能ファイルを生成する makefile Makefile_Inceptionv3。
分類する入力イメージ inputimage.txt。
net.Layers(end).Classes によって返される ClassNames を含むテキストファイル synsetWords.txt。
関数 inception_predict_arm 用に生成されたコードを呼び出すメインラッパーファイル main_inception_arm.cpp。

system('sshpass -p password scp synsetWords.txt ./Makefile_Inceptionv3 ./inputimage.txt ./main_inception_arm.cpp username@hostname:targetDir/');

ターゲットでの実行可能ファイルの作成

ターゲットで makefile をコンパイルして、スタティックライブラリから実行可能ファイルを生成します。この makefile は、スタティックライブラリをメインラッパーファイル main_inception_arm.cpp にリンクし、実行可能ファイルを生成します。

system('sshpass -p password ssh username@hostname "make -C targetDir -f Makefile_Inceptionv3 arm_inceptionv3 "');

ターゲットでの実行可能ファイルの実行

生成された実行可能ファイルをターゲットで実行します。実行可能ファイルの実行時には、ARM Compute Library ファイルを指す LD_LIBRARY_PATH を必ずエクスポートしてください。

system('sshpass -p password ssh username@hostname "export LD_LIBRARY_PATH=targetDir/lib; cd targetDir;./inception_predict_arm.elf inputimage.txt out.txt"');

2 番目の方法: ホスト上でのエントリポイント関数の実行可能ファイルの作成

この方法では、最初に、生成されたコードをクロスコンパイルして、ホストコンピューター上に実行可能ファイルを作成します。次に、生成された実行可能ファイル、ARM Compute Library ファイル、その他のサポートファイルをターゲットハードウェアに転送します。最後に、ターゲットハードウェアで実行可能ファイルを実行します。

コード生成構成オブジェクトの設定

実行可能ファイルの生成用にコード生成構成オブジェクトを作成します。ターゲット言語を C++ に設定します。

cfg = coder.config('exe');
cfg.TargetLang = 'C++';

コード生成構成オブジェクトに深層学習構成オブジェクトを追加します。

cfg.DeepLearningConfig = dlcfg;

メインラッパーファイル main_inception_arm.cpp をカスタムソースファイルとして宣言します。

cfg.CustomSource = 'main_inception_arm.cpp';

クロスコンパイラツールチェーンの設定

ターゲットデバイスの ARM アーキテクチャに基づいてクロスコンパイラツールチェーンを設定します。

cfg.Toolchain =  'Linaro AArch64 Linux v6.3.1'; % When the Arm Architecture is armv8,

cfg.Toolchain =  'Linaro AArch32 Linux v6.3.1';% When the Arm Architecture is armv7,

`codegen` を使用したホストコンピューターでの実行可能ファイルの生成

codegen コマンドを使用して、エントリポイント関数のコードを生成し、生成されたコードをビルドし、ターゲット ARM アーキテクチャの実行可能ファイルを作成します。

codegen -config cfg inception_predict_arm -args {ones(299,299,3,'single')} -d arm_compute_cc_exe -report

生成された実行可能ファイルのターゲットハードウェアへのコピー

生成された実行可能ファイルとビンファイルをターゲット ARM ハードウェアにコピーします。このコード行とその後に続く他のコード行で、次のように置き換えます。

password: 自分のパスワード
username: 自分のユーザー名
hostname: 自分のデバイス名
targetDir: ファイルの保存先フォルダー

system('sshpass -p password scp -r arm_compute_cc_exe/*.bin username@hostname:targetDir/');
system('sshpass -p password scp inception_predict_arm.elf username@hostname:targetDir/');

ARM Compute Library ファイルのターゲットハードウェアへのコピー

実行可能ファイルは、実行時に ARM Compute Library ファイルを使用します。実行時にヘッダーファイルを使用しません。ライブラリファイルを目的のパスにコピーします。

system(['sshpass -p password scp -r ' fullfile(getenv('ARM_COMPUTELIB'),'lib') ' username@hostname:targetDir/']);

サポート対象のファイルのターゲットハードウェアへのコピー

次のファイルをターゲット ARM ハードウェアにコピーします。

分類する入力イメージ inputimage.txt。
net.Layers(end).Classes によって返される ClassNames を含むテキストファイル synsetWords.txt。
関数 inception_predict_arm 用に生成されたコードを呼び出すメインラッパーファイル main_inception_arm.cpp。

system('sshpass -p password scp synsetWords.txt ./inputimage.txt ./main_inception_arm.cpp username@hostname:targetDir/');

ターゲットハードウェア上での実行可能ファイルの実行

system('sshpass -p password ssh username@hostname "export LD_LIBRARY_PATH=targetDir/lib; cd targetDir;./inception_predict_arm.elf inputimage.txt out.txt"');

ターゲットから MATLAB への出力データの転送

生成された出力をホストコンピューターの現在の MATLAB セッションにコピーします。

system('sshpass -p password scp username@hostname:targetDir/out.txt ./');

予測スコアのラベルへのマッピング

上位 5 つの予測スコアを学習済みネットワークの対応するラベルにマッピングします。

outputImage = mapPredictionScores;

imshow(outputImage);

参考

coder.ARMNEONConfig (MATLAB Coder) | coder.DeepLearningConfig (MATLAB Coder) | coder.hardware (MATLAB Coder)

トピック

ARM Compute Library を使用した、深層学習ネットワークのためのコード生成 (MATLAB Coder)
SqueezeNet ネットワークのコード生成と Raspberry Pi への展開 (MATLAB Coder)
ARM Compute Library を使用する深層学習コードのクロスコンパイル (MATLAB Coder)

ARM Neon ターゲット用の深層学習コードのクロス コンパイル

前提条件

エントリポイント関数 inception_predict_arm

深層学習構成オブジェクトの設定

1 番目の方法: ホスト上でのエントリポイント関数のスタティック ライブラリの作成

コード生成構成オブジェクトの設定

クロスコンパイラ ツールチェーンの設定

codegen を使用したホスト コンピューターでのスタティック ライブラリの生成

生成されてクロスコンパイルされたスタティック ライブラリのターゲット ハードウェアへのコピー

ARM Compute Library ファイルのターゲット ハードウェアへのコピー

サポート ファイルのターゲット ハードウェアへのコピー

ターゲットでの実行可能ファイルの作成

ターゲットでの実行可能ファイルの実行

2 番目の方法: ホスト上でのエントリポイント関数の実行可能ファイルの作成

コード生成構成オブジェクトの設定

クロスコンパイラ ツールチェーンの設定

codegen を使用したホスト コンピューターでの実行可能ファイルの生成

生成された実行可能ファイルのターゲット ハードウェアへのコピー

ARM Compute Library ファイルのターゲット ハードウェアへのコピー

サポート対象のファイルのターゲット ハードウェアへのコピー

ターゲット ハードウェア上での実行可能ファイルの実行

ターゲットから MATLAB への出力データの転送

予測スコアのラベルへのマッピング

参考

トピック

ARM Neon ターゲット用の深層学習コードのクロスコンパイル

エントリポイント関数 `inception_predict_arm`

1 番目の方法: ホスト上でのエントリポイント関数のスタティックライブラリの作成

クロスコンパイラツールチェーンの設定

codegen を使用したホストコンピューターでのスタティックライブラリの生成

生成されてクロスコンパイルされたスタティックライブラリのターゲットハードウェアへのコピー

ARM Compute Library ファイルのターゲットハードウェアへのコピー

サポートファイルのターゲットハードウェアへのコピー

クロスコンパイラツールチェーンの設定

`codegen` を使用したホストコンピューターでの実行可能ファイルの生成

生成された実行可能ファイルのターゲットハードウェアへのコピー

ARM Compute Library ファイルのターゲットハードウェアへのコピー

サポート対象のファイルのターゲットハードウェアへのコピー

ターゲットハードウェア上での実行可能ファイルの実行