Main Content

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

random

ランダム ノイズがある応答を一般化線形回帰モデルに対するシミュレート

説明

ysim = random(mdl,Xnew) は、一般化線形回帰モデル mdl を使用し、ランダム ノイズを追加して、Xnew 内の予測子データに対する応答をシミュレートします。

ysim = random(mdl,Xnew,Name,Value) では、1 つ以上の名前と値のペアの引数を使用して追加オプションを指定します。たとえば、二項分布の試行回数や、あてはめるために使用するオフセット値を指定できます。

すべて折りたたむ

一般化線形回帰モデルを作成し、新しいデータに対するランダム ノイズのある応答をシミュレートします。

元となる 1 つの予測子 X をもつポアソン乱数を使って標本データを生成します。

rng('default') % For reproducibility
X = rand(20,1);
mu = exp(1 + 2*X);
y = poissrnd(mu);

ポアソン データの一般化線形回帰モデルを作成します。

mdl = fitglm(X,y,'y ~ x1','Distribution','poisson');

予測に使用するデータ点を作成します。

Xnew = (0:.05:1)';

データ点でランダム ノイズがある応答をシミュレートします。

ysim = random(mdl,Xnew);

シミュレートされた値と元の値をプロットします。

plot(X,y,'rx',Xnew,ysim,'bo',Xnew,feval(mdl,Xnew),'g-')
legend('Data','Simulated Response with Noise','Predicted Response', ...
    'Location','best')

一般化線形回帰モデルをあてはめてから、saveLearnerForCoder を使用してモデルを保存します。loadLearnerForCoderを使用してモデルを読み込み、あてはめたモデルの関数 predict を呼び出す、エントリポイント関数を定義します。その後、codegen (MATLAB Coder) を使用して C/C++ コードを生成します。C/C++ コードの生成には MATLAB® Coder™ が必要であることに注意してください。

この例では、コマンド ラインで線形回帰モデルの予測を行うためのコード生成ワークフローについて簡単に説明します。詳細は、機械学習モデルの予測をコマンド ラインで行うコードの生成を参照してください。MATLAB Coder アプリを使用してコードを生成することもできます。詳細については、機械学習モデルの予測を MATLAB Coder アプリを使用して行うコードの生成を参照してください。

モデルの学習

次の分布で予測子 x および応答 y の標本データを生成します。

  • xN(1,0.52).

  • β0=1 および β=-2

  • yBinomial(10,exp(1+xβ)1+exp(1+xβ)).

rng('default') % For reproducibility
x = 1 + randn(100,1)*0.5;
beta = -2;
p = exp(1 + x*beta)./(1 + exp(1 + x*beta)); % Inverse logit
n = 10;
y = binornd(n,p,100,1);

二項データの一般化線形回帰モデルを作成します。二項標本サイズとして 10 を指定します。

mdl = fitglm(x,y,'y ~ x1','Distribution','Binomial','BinomialSize',n);

モデルの保存

あてはめた一般化線形回帰モデルを saveLearnerForCoder を使用して GLMMdl.mat というファイルに保存します。

saveLearnerForCoder(mdl,'GLMMdl');

エントリポイント関数の定義

現在のフォルダーで、以下を行う myrandomGLM.m という名前のエントリポイント関数を定義します。

  • 新しい予測子入力と、有効な名前と値のペアの引数を受け入れます。

  • GLMMdl.mat 内のあてはめた一般化線形回帰モデルを loadLearnerForCoder を使用して読み込みます。

  • 読み込んだ GLM モデルから応答をシミュレートします。

function y = myrandomGLM(x,varargin) %#codegen
%MYRANDOMGLM Simulate responses using GLM model 
%   MYRANDOMGLM simulates responses for the n observations in the n-by-1
%   vector x using the GLM model stored in the MAT-file GLMMdl.mat, and
%   then returns the simulations in the n-by-1 vector y.
CompactMdl = loadLearnerForCoder('GLMMdl');
narginchk(1,Inf);
y = random(CompactMdl,x,varargin{:});
end

MATLAB のアルゴリズムについてのコードを生成しようとしていることを指示するため、コンパイラ命令 %#codegen (またはプラグマ) をエントリポイント関数のシグネチャの後に追加します。この命令を追加すると、MATLAB Code Analyzer はコード生成時にエラーになる違反の診断と修正を支援します。

コードの生成

codegen (MATLAB Coder) を使用して、エントリポイント関数のコードを生成します。C および C++ は静的な型の言語なので、エントリポイント関数内のすべての変数のプロパティをコンパイル時に決定しなければなりません。データ型と正確な入力配列のサイズを指定するため、特定のデータ型および配列サイズをもつ一連の値を表す MATLAB® 式を渡します。名前と値のペアの引数の名前に対してcoder.Constant (MATLAB Coder)を使用します。

予測子データ x と二項パラメーター n を指定します。

codegen -config:mex myrandomGLM -args {x,coder.Constant('BinomialSize'),coder.Constant(n)}

codegen は、プラットフォームに依存する拡張子をもつ MEX 関数 myrandomGLM_mex を生成します。

コンパイル時に観測値の個数が不明である場合、coder.typeof (MATLAB Coder) を使用して可変サイズの入力を指定することもできます。詳細は、コード生成用の可変サイズ引数の指定エントリポイント関数の入力のプロパティの指定 (MATLAB Coder) を参照してください。

生成されたコードの確認

MEX 関数を使用して応答をシミュレートします。予測子データ x と二項パラメーター n を指定します。

ysim = myrandomGLM_mex(x,'BinomialSize',n);

シミュレートした値とデータを同じ Figure にプロットします。

figure
plot(x,y,'bo',x,ysim,'r*')
legend('Observed responses','Simulated responses')
xlabel('x')
ylabel('y')

観測された応答とシミュレートされた応答は、同じ分布になっているように見えます。

入力引数

すべて折りたたむ

一般化線形回帰モデル。fitglm または stepwiseglm を使用して作成した GeneralizedLinearModel オブジェクト、または compact を使用して作成した CompactGeneralizedLinearModel オブジェクトとして指定します。

新しい予測子の入力値。table、データセット配列または行列を指定します。Xnew の各行は 1 つの観測値に対応し、各列は 1 つの変数に対応します。

  • Xnew が table またはデータセット配列である場合、mdlPredictorNames プロパティと同じ予測子名をもつ予測子が含まれていなければなりません。

  • Xnew が行列である場合、mdl の作成に使用した予測子入力と同じ個数の変数 (列) が同じ順序で含まれていなければなりません。あてはめたモデルで予測子としては使用しなかった予測子変数も Xnew に含めなければならないことに注意してください。また、mdl の作成に使用する変数は、すべて数値でなければなりません。数値予測子をカテゴリカルとして扱うには、mdl を作成するときに名前と値のペアの引数 'CategoricalVars' を使用して予測子を指定します。

データ型: single | double | table

名前と値のペアの引数

オプションの Name,Value 引数のコンマ区切りペアを指定します。Name は引数名で、Value は対応する値です。Name は引用符で囲まなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を、任意の順番で指定できます。

例: ysim = random(Mdl,Xnew,'BinomialSize',50) は、'BinomialSize' によって指定された試行回数を使用して、ランダム ノイズによる変動があった成功回数を返します。

二項分布の試行回数。'BinomialSize' と、応答と同じ長さのスカラーまたはベクトルで構成されるコンマ区切りのペアとして指定します。random は、応答と同じサイズの定数配列となるようにスカラー入力を拡張します。スカラー入力は、すべての観測が同じ試行回数であることを意味します。

ysim の出力値の意味は、'BinomialSize' の値によって異なります。

  • 'BinomialSize' が 1 (既定) である場合、出力 ysim の各値は成功確率です。

  • 'BinomialSize' が 1 でない場合、出力 ysim の各値は試行時の成功予測回数です。

データ型: single | double

Xnew の各行のオフセット値。'Offset' と、応答と同じ長さのスカラーまたはベクトルで構成されるコンマ区切りのペアとして指定します。random は、応答と同じサイズの定数配列となるようにスカラー入力を拡張します。

モデルをあてはめるときに名前と値のペアの引数 'Offset' を指定した場合でも、この引数の既定値はゼロのベクトルとなることに注意してください。あてはめるために 'Offset' を指定した場合、ソフトウェアでは 1 で固定した係数値をもつ追加の予測子としてオフセットを扱います。つまり、近似の式は次のようになります

f(μ) = Offset + X*b,

ここで、f はリンク関数、μ は平均応答、X*b は予測子 X の線形結合です。予測子 Offset の係数は 1 です。

データ型: single | double

出力引数

すべて折りたたむ

シミュレートされた応答値。数値ベクトルとして返されます。シミュレートされた値は、あてはめられたモデルにより与えられた分布をもち、ランダム ノイズによる変動があった Xnew で予測された応答値です。ysim の値は予測子では独立した条件です。二項近似およびポアソン近似の場合、random は推定された分散に対して調整なしで、指定された分布の ysim を生成します。

  • 'BinomialSize' が 1 (既定) である場合、出力 ysim の各値は成功確率です。

  • 'BinomialSize' が 1 でない場合、出力 ysim の各値は試行時の成功予測回数です。

代替機能

ランダム ノイズのない予測では、predict または feval を使用します。

  • predict は、すべての予測子変数を格納する単一の入力引数を受け入れ、予測に対する信頼区間を返します。

  • feval は、各予測子変数に 1 つの入力が対応する複数の入力引数を受け入れます。テーブルまたはデータセット配列から作成したモデルの場合、この関数をより簡単に使用できます。関数 feval は、名前と値のペアの引数 'Offset' および 'BinomialSize' をサポートしていません。この関数は、オフセット値として 0 を使用し、出力値は予測確率です。

拡張機能

R2012a で導入