Main Content

response

クラス: GeneralizedLinearMixedModel

一般化線形混合効果モデルの応答ベクトル

説明

y = response(glme) は一般化線形混合効果モデル glme の当てはめに使用される応答ベクトル y を返します。

[y,binomialsize] = response(glme) はまた、変量効果が与えられた応答の条件付き分布が二項の場合、y の各要素に関連する二項サイズを返します。

入力引数

すべて展開する

一般化線形混合効果モデル。GeneralizedLinearMixedModel オブジェクトとして指定します。このオブジェクトのプロパティとメソッドについては、GeneralizedLinearMixedModel を参照してください。

出力引数

すべて展開する

n 行 1 列のベクトルとして指定された応答値。ここで、n は観測値の数です。

事前の重み wip と二項サイズ ni (適用可能な場合) をもつ観測値 i について、応答値 yi には以下の値も含まれる可能性があります。

分布許容値メモ:
Binomial

{0,1wipni,2wipni,,1}

wipni は、整数値 > 0 です。
Poisson

{0,1wip,2wip,}

wip は整数値 > 0 です。
Gamma(0,∞)wip ≥ 0
InverseGaussian(0,∞)wip ≥ 0
normal(-∞,∞)wip ≥ 0

ドット表記を使用して、事前に重みが与えられたプロパティ wip にアクセスできます。たとえば、モデル glme で事前に重みを与えられたプロパティにアクセスするには、以下を行います。

glme.ObservationInfo.Weights

y の各要素に関連する二項サイズ。n 行 1 列のベクトルとして返され、ここで n は観測の数です。response は変量効果が与えられた応答の条件付き分布が二項の場合のみ、binomialsize を返します。他の分布の場合、binomialsize は空になります。

すべて展開する

標本データを読み込みます。

load mfr

このシミュレーションされたデータは、世界中で 50 の工場を操業している製造企業から取得しており、各工場が完成品の生産のためにバッチ処理を実行しています。同社は各バッチの欠陥数を減少させるために新たな製造プロセスを開発しました。新しいプロセスの効果をテストするため、同社は実験に参加させる 20 工場を無作為に選びました。10 工場では新プロセスを実施しますが、残りの 10 工場では旧プロセスの実行を続けます。各 20 工場で、同社は 5 つのバッチ (合計 100 バッチ) を実行し以下のデータを記録しました。

  • 新しいプロセスがバッチに使用されたかどうかを示すフラグ (newprocess)

  • 各バッチの処理時間。時間単位 (time)

  • バッチの温度。摂氏 (temp)

  • バッチで使用する化学薬品の供給業者 (AB または C) を示すカテゴリカル変数 (supplier)

  • バッチ内の欠陥数 (defects)

またデータに含まれる time_devtemp_dev は、摂氏 20 度で 3 時間の標準プロセスから得られる時間と温度の絶対偏差をそれぞれ表します。

固定効果予測子として newprocesstime_devtemp_dev および supplier を使用して一般化線形混合効果モデルを当てはめます。工場特有の変動に起因して品質に差がある可能性を考慮するために、factory 別にグループ化された切片の変量効果項を含めます。応答変数 defects はポアソン分布であり、このモデルの適切なリンク関数は対数です。係数の予測にラプラス近似メソッドを使用します。ダミー変数エンコードを 'effects' として指定すると、ダミー変数の係数の合計が 0 になります。

欠陥数はポアソン分布を使用してモデル化できます

defectsijPoisson(μij)

これは一般化線形混合効果モデルに対応します

log(μij)=β0+β1newprocessij+β2time_devij+β3temp_devij+β4supplier_Cij+β5supplier_Bij+bi,

ここで

  • defectsij は、バッチ j 処理中の工場 i で実行されたバッチで観測された欠陥数です。

  • μij は、バッチ j (j=1,2,...,5) 処理中の工場 i (i=1,2,...,20) に対応する欠陥の平均数です。

  • newprocessijtime_devij および temp_devij は、バッチ j 処理中の工場 i に対応する各変数の測定値です。たとえば newprocessij は、工場 i で実行されたバッチ j 処理中に新プロセスが使用されたかどうかを示します。

  • supplier_Cij および supplier_Bij はエフェクト (ゼロサム) コーディングを使用するダミー変数であり、バッチ j 処理中に工場 i で実行されたバッチに対して、それぞれ会社 C または B が加工化学薬品を供給したかどうかを示します。

  • biN(0,σb2) は、工場特有の品質変動に相当する、各工場 i の変量効果の切片です。

glme = fitglme(mfr,'defects ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)',...
    'Distribution','Poisson','Link','log','FitMethod','Laplace','DummyVarCoding','effects');

モデルの観測された応答値を抽出し、fitted を使用して、当てはめた条件付き平均値を生成します。

y = response(glme);   % Observed response values
yfit = fitted(glme);  % Fitted response values

観測応答値と当てはめた値を対比する散布図を作成します。基準線を追加し、可視化を改善します。

figure
scatter(yfit,y)
xlim([0,12])
ylim([0,12])
refline(1,0)
title('Response versus Fitted Values')
xlabel('Fitted Values')
ylabel('Response')

Figure contains an axes object. The axes object with title Response versus Fitted Values, xlabel Fitted Values, ylabel Response contains 2 objects of type scatter, line.

プロットは当てはめた値と観測された応答値間の正の相関を表示します。

参照

[1] Hox, J. Multilevel Analysis, Techniques and Applications. Lawrence Erlbaum Associates, Inc., 2002.