fitglm
一般化線形回帰モデルの作成
構文
説明
は、応答データが格納された table 変数を指定します。mdl = fitglm(tbl,ResponseVarName)
は、1 つ以上の mdl = fitglm(___,Name,Value)Name,Value のペアの引数で指定された追加オプションを使用して一般化線形回帰モデルを返します。
たとえば、カテゴリカルである変数、応答変数の分布、使用するリンク関数を指定できます。
例
入力引数
名前と値の引数
出力引数
詳細
ヒント
正則化された線形モデル
mdlは、別途Distribution名前と値のペアで指定しない限り、標準線形モデルです。plotResidualsまたはdevianceTestなどのメソッドや、GeneralizedLinearModelオブジェクトのプロパティについては、GeneralizedLinearModelを参照してください。モデルに学習をさせた後で、新しいデータについて応答を予測する C/C++ コードを生成できます。C/C++ コードの生成には MATLAB Coder™ が必要です。詳細については、コード生成の紹介を参照してください。
アルゴリズム
fitglmは、反復的に再重み付けした最小二乗 (IRLS) を使用してモデルの係数を計算します。名前と値の引数Weightsを使用して観測値の重みを指定すると、fitglmは IRLS アルゴリズムの重みに観測値の重みを乗算します。fitglmでは、カテゴリカル予測子が次のように扱われます。L 個の水準 (カテゴリ) があるカテゴリカル予測子をもつモデルには、L – 1 個の指標変数が含まれています。1 番目のカテゴリが基準水準として使用されるので、基準水準に対する指標変数はモデルに含まれません。カテゴリカル予測子のデータ型が
categoricalである場合、categoriesを使用してカテゴリの順序をチェックし、reordercatsを使用してカテゴリを並べ替えることにより、基準水準をカスタマイズできます。指標変数の作成の詳細については、ダミー変数の自動作成を参照してください。fitglmは、L – 1 個の指標変数のグループを単一の変数として扱います。指標変数を個別の予測子変数として扱うには、dummyvarを使用して指標変数を手動で作成します。そして、モデルを当てはめるときに、カテゴリカル変数の基準水準に対応するものを除く指標変数を使用します。カテゴリカル予測子Xについてdummyvar(X)のすべての列と切片項を予測子として指定した場合、計画行列はランク落ちとなります。L 個の水準をもつカテゴリカル予測子と連続予測子の間の交互作用項は、L – 1 個の指標変数と連続予測子の要素単位の積から構成されます。
L 個の水準をもつカテゴリカル予測子と M 個の水準をもつカテゴリカル予測子の間の交互作用項は、2 つのカテゴリカル予測子の水準について可能なすべての組み合わせを含めるため、(L – 1)*(M – 1) 個の指標変数から構成されます。
指標の二乗はそれ自体に等しいので、より次数が高い項をカテゴリカル予測子に対して指定することはできません。
fitglmは、tbl、XおよびYに含まれているNaN、''(空の文字ベクトル)、""(空の string)、<missing>、および<undefined>値を欠損値と見なします。fitglmは、欠損値がある観測値を当てはめで使用しません。当てはめたモデルのObservationInfoプロパティは、fitglmが各観測値を当てはめで使用したかどうかを示します。
代替機能
モデル仕様を自動的に選択するには、
stepwiseglmを使用します。step、addTermsまたはremoveTermsを使用して当てはめたモデルを調整します。
参照
[1] Collett, D. Modeling Binary Data. New York: Chapman & Hall, 2002.
[2] Dobson, A. J. An Introduction to Generalized Linear Models. New York: Chapman & Hall, 1990.
[3] McCullagh, P., and J. A. Nelder. Generalized Linear Models. New York: Chapman & Hall, 1990.