メインコンテンツ

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

方策の展開

コード生成および学習済みの方策の展開

強化学習エージェントに学習させたら、最適な方策を展開するためのコードを生成できます。たとえば、MATLAB® Coder™ と GPU Coder™ を使用すると、C++ または CUDA® のコードを生成し、組み込みプラットフォームにニューラル ネットワークの方策を展開できます。

エージェントの展開の概要については、Deploy Trained Reinforcement Learning Policiesを参照してください。

関数

generatePolicyFunctionGenerate MATLAB function that evaluates policy of an agent or policy object
generatePolicyBlockGenerate Simulink block that evaluates policy of an agent or policy object (R2022b 以降)
policyParametersObtain structure of policy parameters to update policy during simulation or deployment (R2025a 以降)
updatePolicyParametersUpdate policy according to structure of policy parameters given as input argument (R2025a 以降)

ブロック

Policy強化学習方策 (R2022b 以降)

トピック

注目の例