最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

random

クラス: GeneralizedLinearMixedModel

近似された一般化線形混合効果モデルからのランダム応答の生成

説明

ysim = random(glme) は、元の計画点で一般化近似線形混合効果モデル glme から、シミュレートされた応答 ysim を返します。

ysim = random(glme,tblnew) は、テーブルまたはデータセット配列 tblnew で指定された新規の入力値を使用して、シミュレートされた応答を返します。

ysim = random(___,Name,Value) は、前述の構文のいずれかを使用する 1 つ以上の Name,Value のペアの引数により指定された追加オプションによって、シミュレートされた応答を返します。たとえば、観測値の重み、二項分布のサイズまたはモデルのオフセットを指定できます。

入力引数

すべて展開する

一般化線形混合効果モデル。GeneralizedLinearMixedModel オブジェクトとして指定します。このオブジェクトのプロパティとメソッドについては、GeneralizedLinearMixedModel を参照してください。

応答変数、予測変数およびグループ化変数が含まれる新規入力データ。テーブルまたはデータセット配列として指定します。予測変数は連続変数またはグループ化変数にすることができます。tblnew は、一般化線形混合効果モデル glme の近似に使用される元のテーブルまたはデータセット配列 tbl と同じ変数をもっていなければなりません。

名前と値のペアの引数

オプションの Name,Value 引数のコンマ区切りペアを指定します。Name は引数名で、Value は対応する値です。Name は引用符で囲まなければなりません。Name1,Value1,...,NameN,ValueN のように、複数の名前と値のペアの引数を、任意の順番で指定できます。

二項分布の試行回数。'BinomialSize' と正の整数値の m 行 1 列のベクトルから構成されるコンマ区切りペアとして指定します。ここで、m は tblnew の行の数になります。'BinomialSize' 名前と値のペアは、二項分布にのみ適用します。値は、ランダム応答値を生成する場合に二項の試行数を指定します。

データ型: single | double

モデル オフセット。長さ m のスカラー値のベクトルとして指定されます。ここで、m は tblnew の行の数です。オフセットは追加の予測子として使用され、1 で固定した係数値をもちます。

観測値の重み。'Weights' と、非負のスカラー値の m 行 1 列のベクトルで構成されるコンマ区切りのペアとして指定します。ここで、m は、tblnew の行数です。応答の分布が二項またはポアソンである場合、'Weights' は正の整数のベクトルでなければなりません。

データ型: single | double

出力引数

すべて展開する

シミュレートされた応答値。m 行 1 列のベクトルとして返され、m は tblnew の行数です。random は、近似事前分布に基づいて変量効果のベクトルを最初に生成することにより ysim を作成します。次に、random は変量効果が与えられた近似条件付き分布から ysim を生成します。random は、fitglme を使用してモデルを近似するとき、指定された観測値の重みの効果があれば、これを考慮します。

すべて展開する

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果を検定する実験のため、参加させる 20 件の工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

  • 新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)

  • 各バッチの処理時間。時間単位 (time)

  • バッチの温度。摂氏 (temp)

  • バッチで使用する化学薬品の供給業者 (AB または C) を示すカテゴリカル変数 (supplier)

  • バッチ内の欠陥数 (defects)

またデータに含まれる time_devtemp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocesstime_devtemp_dev および supplier を使用して一般化線形混合効果モデルを近似します。工場特有の変動に起因して品質に差がある可能性を考慮するために、factory 別にグループ化された切片の変量効果項を含めます。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。

欠陥数はポアソン分布を使用してモデル化できます

defectsijPoisson(μij)

これは一般化線形混合効果モデルに対応します

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

ここで、

  • defectsij は、バッチ j 処理中の工場 i で実行されたバッチで観測された欠陥数です。

  • μij は、バッチ j (j=1,2,...,5) 処理中の工場 i (i=1,2,...,20) に対応する欠陥の平均数です。

  • newprocessijtime_devij および temp_devij は、バッチ j 処理中の工場 i に対応する各変数の測定値です。たとえば newprocessij は、工場 i で実行されたバッチ j 処理中に新プロセスが使用されたかどうかを示します。

  • supplier_Cij および supplier_Bij はエフェクト (ゼロサム) コーディングを使用するダミー変数であり、バッチ j 処理中に工場 i で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。

  • biN(0,σb2) は、工場特有の品質変動に相当する、各工場 i の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)','Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

random を使用して、近似モデルから新しい応答ベクトルをシミュレートします。

rng(0,'twister');  % For reproducibility
ynew = random(glme);

シミュレートされた応答ベクトルの最初の 10 行を表示します。

ynew(1:10)
ans = 10×1

     3
     3
     1
     7
     5
     8
     7
     9
     5
     9

新しい入力値を使用して、新しい応答ベクトルをシミュレートします。mfr の最初の 10 件を tblnew にコピーすることにより新規テーブルを作成します。

tblnew = mfr(1:10,:);

mfr の先頭 10 行には、工場 1 および 2 の検査 1 ~ 5 から収集したデータが含まれています。どちらの工場でも実験時のすべての検査に古いプロセスを使用したので、10 個の観測値はすべて newprocess = 0 です。

newprocess の値を tblnew の観測値の 1 に変更します。

tblnew.newprocess = ones(height(tblnew),1);

tblnew の新しい入力値を使用して、新しい応答をシミュレートします。

ynew2 = random(glme,tblnew)
ynew2 = 10×1

     2
     3
     5
     4
     2
     2
     2
     1
     2
     0

詳細

すべて展開する