ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

addTerms

クラス: GeneralizedLinearModel

一般化線形モデルに項を追加

構文

mdl1 = addTerms(mdl,terms)

説明

mdl1 = addTerms(mdl,terms)mdl と同じですが、項を追加した一般化線形モデルを返します。

入力引数

mdl

fitglm または stepwiseglm によって構築される一般化線形モデル。

terms

mdl 回帰モデルに追加するための項。次のいずれかとして指定します。

  • 追加する 1 つ以上の項を表すテキスト。詳細は、ウィルキンソンの表記法を参照してください。

  • 項の行列にある行 (fitglmmodelspec を参照してください)。たとえば、ABC という 3 つの変数があるとします。

    [0 0 0] represents a constant term or intercept
    [0 1 0] represents B; equivalently, A^0 * B^1 * C^0
    [1 0 1] represents A*C
    [2 0 0] represents A^2
    [0 1 2] represents B*(C^2)

出力引数

mdl1

mdl と同じですが、terms に項が追加されている一般化線形モデルです。mdl を上書きするために mdl1mdl と同じに設定できます。

すべて展開する

予測子を 1 つのみ使用してモデルを作成し、次に 2 つめの予測子を追加します。

元となる 2 つの予測子 X(1) および X(2) のポアソン乱数で、モデルのための人為的なデータを生成します。

rng default % for reproducibility
rndvars = randn(100,2);
X = [2+rndvars(:,1),rndvars(:,2)];
mu = exp(1 + X*[1;2]);
y = poissrnd(mu);

ポアソン データの一般化線形回帰モデルを作成します。このモデルで最初の予測子のみ使用します。

mdl = fitglm(X,y,...
    'y ~ x1','distr','poisson')
mdl = 
Generalized linear regression model:
    log(y) ~ 1 + x1
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     2.7784      0.014043    197.85      0   
    x1              1.1732     0.0033653     348.6      0   


100 observations, 98 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 1.25e+05, p-value = 0

2 つめの予測子をモデルに追加します。

mdl1 = addTerms(mdl,'x2')
mdl1 = 
Generalized linear regression model:
    log(y) ~ 1 + x1 + x2
    Distribution = Poisson

Estimated Coefficients:
                   Estimate       SE        tStat     pValue
                   ________    _________    ______    ______

    (Intercept)     1.0405      0.022122    47.034      0   
    x1              0.9968      0.003362    296.49      0   
    x2               1.987     0.0063433    313.24      0   


100 observations, 97 error degrees of freedom
Dispersion: 1
Chi^2-statistic vs. constant model: 2.95e+05, p-value = 0

詳細

すべて展開する

アルゴリズム

  • addTerms では、カテゴリカル予測子が次のように扱われます。

    • L 個のレベル (カテゴリ) があるカテゴリカル予測子をもつモデルには、L – 1 個の予測子変数が含まれています。1 番目のカテゴリが基準レベルとして使用されるので、基準レベルに対する指標変数はモデルに含まれません。カテゴリカル予測子のデータ型が categorical である場合、categories を使用してカテゴリの順序をチェックし、reordercats を使用してカテゴリを並べ替えることにより、基準レベルをカスタマイズできます。

    • addTerms は、L – 1 個の指標変数のグループを単一の変数として扱います。指標変数を個別の予測子変数として扱うには、dummyvar を使用して指標変数を手動で作成します。そして、モデルをあてはめるときに、カテゴリカル変数の基準レベルに対応するものを除く指標変数を使用します。カテゴリカル予測子 X について dummyvar(X) のすべての列と切片項を予測子として指定した場合、計画行列はランク落ちとなります。

    • L 個のレベルをもつカテゴリカル予測子と連続予測子の間の交互作用項は、L – 1 個の指標変数と連続予測子の要素単位の積から構成されます。

    • L 個のレベルをもつカテゴリカル予測子と M 個のレベルをもつカテゴリカル予測子の間の交互作用項は、2 つのカテゴリカル予測子のレベルについて可能なすべての組み合わせを含めるため、(L – 1)*(M – 1) 個の指標変数から構成されます。

    • 指標の二乗はそれ自体に等しいので、より次数が高い項をカテゴリカル予測子に対して指定することはできません。

代替方法

step は、貪欲 1 ステップ法を使ってモデルの項を追加または削除します。

参考文献

[1] Wilkinson, G. N., and C. E. Rogers. Symbolic description of factorial models for analysis of variance. J. Royal Statistics Society 22, pp. 392–399, 1973.