ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

CompactLinearModel クラス

スーパークラス:

コンパクトな線形回帰モデル クラス

説明

CompactLinearModel は、コンパクトな線形回帰モデル オブジェクトです。モデルのあてはめに使用したデータが格納されていないので、完全な近似済み線形回帰モデル (LinearModel モデル) よりメモリ消費が少なくなります。コンパクトなモデルには入力データが格納されていないので、タスクによってはその実行に使用できないものがあります。しかし、コンパクトな線形回帰モデルを使用して、新しい入力データで予測を行うことはできます。

構築

compactMdl = compact(mdl) は、完全な近似済み回帰モデル mdl からコンパクトな線形回帰モデル compactMdl を返します。詳細については、compact を参照してください。

入力引数

すべて展開する

完全な近似済み線形回帰モデル。LinearModel オブジェクトを指定します。

プロパティ

すべて展開する

係数推定値の共分散行列。p 行 p 列の数値の行列を指定します。p は、あてはめたモデルの係数の個数です。

係数の名前。各係数のラベルが含まれている文字ベクトルの cell 配列を指定します。

係数の値。テーブルを指定します。Coefficients は、各係数に 1 つの行が対応し、次の列があります。

  • Estimate — 推定される係数値

  • SE — 推定の標準誤差

  • tStat — 係数が 0 である検定の t 統計

  • pValue — t 統計量の p 値

ベクトルとしてこれらの列のいずれかを取得するには、ドット表記を使ってプロパティにインデックスを付けます。たとえば、mdl 内の推定された係数ベクトルは次のようになります。

beta = mdl.Coefficients.Estimate

coefTest を使用して係数に他の検定を実行します。

誤差 (残差) の自由度。推定された係数の個数を観測値の個数から減算した値に等しくなります。正の整数値を指定します。

モデルの情報。LinearFormula オブジェクトまたは NonLinearFormula オブジェクトを指定します。線形または一般化線形回帰モデルをあてはめる場合、FormulaLinearFormula オブジェクトです。非線形回帰モデルをあてはめる場合、FormulaNonLinearFormula オブジェクトです。

応答値におけるモデルの分布の対数尤度。数値を指定します。平均はモデルからあてはめられ、他のパラメーターはモデルのあてはめに伴って推定されます。

モデルの比較基準。次のフィールドがある構造体を指定します。

  • AIC — 赤池情報量基準。AIC = –2*logL + 2*mlogL は対数尤度、m は推定パラメーターの個数です。

  • AICc — 標本サイズについて修正された赤池情報量基準。AICc = AIC + (2*m*(m+1))/(n–m–1)n は観測値の個数です。

  • BIC — ベイズ情報量基準。BIC = –2*logL + m*log(n)

  • CAIC — 一貫した赤池情報量基準。CAIC = –2*logL + m*(log(n)+1)

情報量基準は、同じデータにあてはめた複数のモデルを比較するために使用できるモデル選択ツールです。これらの基準は、尤度に基づくモデル近似の尺度であり、複雑度 (特にパラメーター数) に対するペナルティが含まれています。情報量基準が異なるとペナルティの形式が異なります。

複数のモデルを比較した場合に、情報量基準の値が最も小さいモデルが最良近似モデルです。最良近似モデルは、モデルの比較に使用する基準によって変化する可能性があります。

これらの基準値のいずれかをスカラーとして取得するには、ドット表記を使用してプロパティのインデックスを指定します。たとえば、モデル mdl では、AIC 値 aic は次のようになります。

aic = mdl.ModelCriterion.AIC

平均二乗誤差 (残差)。数値を指定します。平均二乗誤差は MSE = SSE / DFE により計算されます。ここで、MSE は平均二乗誤差、SSE は誤差の二乗和、DFE は自由度です。

モデルの係数の個数。正の整数を指定します。NumCoefficients には、モデルの項がランク落ちとなる場合にゼロに設定される係数が含まれます。

モデル内の推定された係数の個数。正の整数を指定します。NumEstimatedCoefficients には、モデルの項がランク落ちとなる場合にゼロに設定される係数は含まれません。NumEstimatedCoefficients は回帰の自由度です。

近似関数があてはめに使用した観測値の個数。正の整数を指定します。これは、元のテーブル、データセットまたは行列に入力された観測の数から、除外された行 (Exclude 名前と値のペアで設定) または欠損値のある行を差し引いたものです。

モデルのあてはめに使用した予測子変数の個数。正の整数を指定します。

入力データに含まれている変数の個数。正の整数を指定します。NumVariables は、元の table またはデータセットに含まれている変数の個数です。または、あてはめが予測子行列と応答ベクトルに基づいている場合は、これらの配列の列の総数です。これは、予測子または応答としては使用されない変数があればそれら含みます。

モデルのあてはめに使用した予測子の名前。文字ベクトルの cell 配列を指定します。

応答変数名。文字ベクトルを指定します。

平方根平均二乗誤差 (残差)。数値を指定します。平方根平均二乗誤差 (RMSE) は RMSE = sqrt(MSE) に等しい値です。ここで、MSE は平均二乗誤差です。

ロバスト近似の情報。次のフィールドがある構造体を指定します。

フィールド説明
WgtFun'bisquare' などのロバストな重み付け関数 (robustfit を参照)
Tuneパラメーター調整のために指定された値 ([] で表記)
Weightsロバスト近似の最終反復で使用された重みのベクトル。コンパクトな CompactLinearModel モデルの場合、このフィールドは空です。

fitlm がロバスト回帰を使用してモデルを構築した場合を除き、この構造体は空です。

モデルの決定係数の値。構造体を指定します。

線形モデルまたは非線形モデルの場合、Rsquared は次の 2 つのフィールドをもつ構造体です。

  • Ordinary — 通常の (自由度未調整) 決定係数

  • Adjusted — 係数の数に対する自由度調整済み決定係数

一般化線形モデルの場合、Rsquared は次の 5 つのフィールドをもつ構造体です。

  • Ordinary — 通常の (自由度未調整) 決定係数

  • Adjusted — 係数の数に対する自由度調整済み決定係数

  • LLR — 対数尤度比

  • Deviance — 逸脱度

  • AdjGeneralized — 一般化された自由度調整済み決定係数

決定係数の値は、モデルによって説明される二乗総和の比率です。通常の決定係数値は、SSR および SST のプロパティに関係します。

Rsquared = SSR/SST = 1 - SSE/SST

これらの値のいずれかをスカラーとして取得するには、ドット表記を使ってプロパティにインデックスを付けます。たとえば、mdl 内の自由度調整済み決定係数は、

r2 = mdl.Rsquared.Adjusted

誤差 (残差) の二乗和。数値を指定します。

ピタゴラスの定理が示すもの

SST = SSE + SSR

回帰二乗和。数値を指定します。回帰二乗和は、近似値の平均に対する近似値の偏差二乗和に等しい値です。

ピタゴラスの定理が示すもの

SST = SSE + SSR

二乗総和。数値を指定します。二乗総和は、mean(y) に対する応答ベクトル y の偏差二乗和に等しい値です。

ピタゴラスの定理が示すもの

SST = SSE + SSR

Variables に格納されている入力変数に関する情報。各モデル項に対応する 1 つずつの行と以下の列がある table を指定します。

フィールド説明
Class'double' などの変数クラスを指定する文字ベクトル
Range

変数範囲を指定する cell 配列:

  • 連続変数 — 2 因子ベクトル [min,max]、最小値と最大値

  • カテゴリカル変数 — 異なる変数値の cell 配列

InModellogical ベクトル、true は変数がモデル内にあることを示す
IsCategoricallogical ベクトル、true はカテゴリカル変数であることを示す

あてはめに使用する変数の名前。文字ベクトルの cell 配列を指定します。

  • 近似がテーブルまたはデータセットに基づいている場合、このプロパティはそのテーブルまたはデータセット内の変数の名前を指定します。

  • 近似が予測行列および応答行列に基づいている場合、VariableNames は近似手法の VarNames の名前と値のペアにある値です。

  • それ以外の場合、変数は既定の近似名になります。

メソッド

anova線形モデルの分散分析
coefCI線形モデルの係数推定の信頼区間
coefTest線形回帰モデルの係数に対する線形仮説検定
disp線形回帰モデルの表示
feval線形回帰モデルの予測の評価
plotEffects線形回帰モデルの各予測子の主効果をプロットします。
plotInteraction線形回帰モデルの 2 つの予測子の交互作用効果のプロット
plotSlice近似線形回帰面を通るスライスのプロット
predict線形回帰モデルの応答予測
random線形回帰モデルの応答のシミュレーション

コピーのセマンティクス

値。値のクラスがコピー操作に与える影響については、オブジェクトのコピー (MATLAB)を参照してください。

すべて折りたたむ

この例では、近似プロセスに関する一部の情報と標本データを破棄することにより、完全な近似済み線形回帰モデルのサイズを小さくする方法を示します。

データをワークスペースに読み込みます。

load(fullfile(matlabroot,'examples','stats','largedata4reg.mat'))

シミュレーションによって得られた標本データには、15,000 個の観測値と 45 個の予測子変数が含まれています。

単純な線形回帰モデルをデータにあてはめます。

mdl = fitlm(X,Y)
mdl = 
Linear regression model:
    y ~ [Linear formula with 46 terms in 45 predictors]

Estimated Coefficients:
                    Estimate          SE           tStat         pValue   
                   ___________    __________    ___________    ___________

    (Intercept)         3.2903    1.2333e-05     2.6679e+05              0
    x1              -0.0006461    5.9019e-09    -1.0947e+05              0
    x2             -0.00024739    1.0256e-08         -24121              0
    x3             -9.5161e-05    1.3149e-08        -7236.9              0
    x4              0.00013143    1.8311e-08         7177.3              0
    x5               7.163e-05    2.3367e-08         3065.4              0
    x6              4.5064e-06    2.6264e-08         171.58              0
    x7             -2.6258e-05     3.006e-08        -873.51              0
    x8               6.284e-05    3.0262e-08         2076.5              0
    x9             -0.00014288    3.3258e-08        -4296.1              0
    x10            -2.2642e-05    3.6555e-08        -619.41              0
    x11            -6.0227e-05    3.7353e-08        -1612.4              0
    x12             1.1665e-05    4.0048e-08         291.27              0
    x13             3.8595e-05     4.203e-08         918.26              0
    x14             0.00010021    4.7592e-08         2105.5              0
    x15            -6.5674e-06    4.9221e-08        -133.43              0
    x16             8.5598e-06    5.0296e-08         170.19              0
    x17            -3.9107e-05       5.3e-08        -737.87              0
    x18            -6.5841e-06    5.5355e-08        -118.94              0
    x19            -1.7053e-05    5.7431e-08        -296.94              0
    x20            -3.8911e-06    6.2724e-08        -62.036              0
    x21            -9.7219e-06    6.3515e-08        -153.06              0
    x22            -1.8749e-06    6.5388e-08        -28.673    4.6032e-176
    x23            -4.7514e-06    6.6636e-08        -71.303              0
    x24            -1.7756e-05    6.8495e-08        -259.23              0
    x25            -9.6673e-06    7.0054e-08           -138              0
    x26             7.6237e-06    7.2442e-08         105.24              0
    x27            -8.4338e-07    7.7519e-08         -10.88     1.8249e-27
    x28             7.0502e-06    8.1889e-08         86.094              0
    x29            -1.4703e-05    8.7126e-08        -168.75              0
    x30             2.7008e-05    9.0084e-08          299.8              0
    x31             6.3685e-07    9.1253e-08          6.979     3.0977e-12
    x32            -1.9916e-05    1.0034e-07        -198.48              0
    x33             1.7369e-05     1.019e-07         170.45              0
    x34             -9.931e-06    1.0706e-07        -92.764              0
    x35            -1.5195e-05    1.0858e-07        -139.94              0
    x36            -1.0118e-05    1.1122e-07        -90.976              0
    x37             2.4595e-06    1.1254e-07         21.856    2.9315e-104
    x38            -2.2928e-06    1.1493e-07         -19.95     2.0535e-87
    x39             1.1397e-05    1.1855e-07         96.136              0
    x40             4.0239e-06    1.2327e-07         32.643      7.75e-226
    x41            -8.6667e-06    1.2535e-07        -69.142              0
    x42            -8.2932e-06    1.3095e-07        -63.334              0
    x43             2.7309e-06    1.3452e-07         20.301     2.0697e-90
    x44            -6.9235e-06    1.3725e-07        -50.444              0
    x45             1.1165e-06    1.4021e-07         7.9633     1.7956e-15


Number of observations: 15000, Error degrees of freedom: 14954
Root Mean Squared Error: 0.00151
R-squared: 1,  Adjusted R-Squared 1
F-statistic vs. constant model: 2.82e+08, p-value = 0

モデルを圧縮します。

compactMdl = compact(mdl)
compactMdl = 
Compact linear regression model:
    y ~ [Linear formula with 46 terms in 45 predictors]

Estimated Coefficients:
                    Estimate          SE           tStat         pValue   
                   ___________    __________    ___________    ___________

    (Intercept)         3.2903    1.2333e-05     2.6679e+05              0
    x1              -0.0006461    5.9019e-09    -1.0947e+05              0
    x2             -0.00024739    1.0256e-08         -24121              0
    x3             -9.5161e-05    1.3149e-08        -7236.9              0
    x4              0.00013143    1.8311e-08         7177.3              0
    x5               7.163e-05    2.3367e-08         3065.4              0
    x6              4.5064e-06    2.6264e-08         171.58              0
    x7             -2.6258e-05     3.006e-08        -873.51              0
    x8               6.284e-05    3.0262e-08         2076.5              0
    x9             -0.00014288    3.3258e-08        -4296.1              0
    x10            -2.2642e-05    3.6555e-08        -619.41              0
    x11            -6.0227e-05    3.7353e-08        -1612.4              0
    x12             1.1665e-05    4.0048e-08         291.27              0
    x13             3.8595e-05     4.203e-08         918.26              0
    x14             0.00010021    4.7592e-08         2105.5              0
    x15            -6.5674e-06    4.9221e-08        -133.43              0
    x16             8.5598e-06    5.0296e-08         170.19              0
    x17            -3.9107e-05       5.3e-08        -737.87              0
    x18            -6.5841e-06    5.5355e-08        -118.94              0
    x19            -1.7053e-05    5.7431e-08        -296.94              0
    x20            -3.8911e-06    6.2724e-08        -62.036              0
    x21            -9.7219e-06    6.3515e-08        -153.06              0
    x22            -1.8749e-06    6.5388e-08        -28.673    4.6032e-176
    x23            -4.7514e-06    6.6636e-08        -71.303              0
    x24            -1.7756e-05    6.8495e-08        -259.23              0
    x25            -9.6673e-06    7.0054e-08           -138              0
    x26             7.6237e-06    7.2442e-08         105.24              0
    x27            -8.4338e-07    7.7519e-08         -10.88     1.8249e-27
    x28             7.0502e-06    8.1889e-08         86.094              0
    x29            -1.4703e-05    8.7126e-08        -168.75              0
    x30             2.7008e-05    9.0084e-08          299.8              0
    x31             6.3685e-07    9.1253e-08          6.979     3.0977e-12
    x32            -1.9916e-05    1.0034e-07        -198.48              0
    x33             1.7369e-05     1.019e-07         170.45              0
    x34             -9.931e-06    1.0706e-07        -92.764              0
    x35            -1.5195e-05    1.0858e-07        -139.94              0
    x36            -1.0118e-05    1.1122e-07        -90.976              0
    x37             2.4595e-06    1.1254e-07         21.856    2.9315e-104
    x38            -2.2928e-06    1.1493e-07         -19.95     2.0535e-87
    x39             1.1397e-05    1.1855e-07         96.136              0
    x40             4.0239e-06    1.2327e-07         32.643      7.75e-226
    x41            -8.6667e-06    1.2535e-07        -69.142              0
    x42            -8.2932e-06    1.3095e-07        -63.334              0
    x43             2.7309e-06    1.3452e-07         20.301     2.0697e-90
    x44            -6.9235e-06    1.3725e-07        -50.444              0
    x45             1.1165e-06    1.4021e-07         7.9633     1.7956e-15


Number of observations: 15000, Error degrees of freedom: 14954
Root Mean Squared Error: 0.00151
R-squared: 1,  Adjusted R-Squared 1
F-statistic vs. constant model: 2.82e+08, p-value = 0

コンパクトなモデルでは、あてはめプロセスに関する一部の情報と元の標本データが破棄されます。

フル モデル mdl とコンパクト モデル compactMdl のサイズを比較します。

vars = whos('compactMdl','mdl');
[vars(1).bytes,vars(2).bytes]
ans = 1×2

       83506    11410618

コンパクトなモデルは、フル モデルよりメモリ消費量が少なくなります。

拡張機能

R2016a で導入