6 行 3 列の行列 popcorn の列に、Gourmet、National、および Generic の各ブランドについてのポップコーン生産量 (カップ数) の観測値が格納されています。popcorn の最初の 3 行はエアータイプの製造器具を使用して製造したポップコーン、最後の 3 行はオイルタイプで製造したポップコーンに対応しています。

関数repmatを使用して、ブランドと製造器具タイプの因子の値の string 配列を作成します。

brand = [repmat("Gourmet",6,1); repmat("National",6,1); repmat("Generic",6,1)];
popperType = repmat(["Air";"Air";"Air";"Oil";"Oil";"Oil"], [3, 1]);
factors = {brand,popperType};

2 因子 ANOVA を実行して、ポップコーンのブランドや製造器具タイプは平均ポップコーン生産量に影響しないという帰無仮説を検定します。

aov = anova(factors,popcorn(:),FactorNames=["Brand","PopperType"],ModelSpecification="interactions")

aov = 
2-way anova, constrained (Type III) sums of squares.

Y ~ 1 + Brand*PopperType

                        SumOfSquares    DF    MeanSquares     F        pValue  
                        ____________    __    ___________    ____    __________

    Brand                    15.75       2        7.875      56.7     7.679e-07
    PopperType                 4.5       1          4.5      32.4    0.00010037
    Brand:PopperType      0.083333       2     0.041667       0.3       0.74622
    Error                   1.6667      12      0.13889                        
    Total                       22      17                                     


  Properties, Methods

既定では、anova は成分 ANOVA 表を表示します。

要約 ANOVA 表を生成します。

s = stats(aov,"summary")

s=5×5 table
                  SumOfSquares    DF    MeanSquares      F        pValue  
                  ____________    __    ___________    _____    __________

    Linear             20.25       3         6.75       48.6    5.4835e-07
    NonLinear       0.083333       2     0.041667        0.3       0.74622
    Regression        20.333       5       4.0667      29.28    2.5065e-06
    Error             1.6667      12      0.13889                         
    Total                 22      17       1.2941

行 Linear は ANOVA モデルの項 Brand と PopperType に対応します。行 Linear の "p" 値が小さいことから、Brand と PopperType の組み合わせがポップコーン生産量に対して統計的に有意な影響を与えることがわかります。行 NonLinear は項 Brand:PopperType に対応します。行 NonLinear の "p" 値が大きいことから、交互作用項がポップコーン生産量に対して統計的に有意な影響を与えないことがわかります。行 Regression の "p" 値が小さく、この ANOVA モデルが応答データの予測子としてデータの平均よりも優れていることを示しています。

2 因子 ANOVA の平均二乗の期待値についての表の表示

ライブスクリプトを開く

自動車の標本データを読み込みます。

load carsmall

変数 Origin、Model_Year、および MPG に生産国、モデル年、および燃費のデータがそれぞれ格納されています。

2 因子 ANOVA を実行して、生産国やモデル年は平均燃費に影響しないという帰無仮説を検定します。

aov = anova({Origin, Model_Year},MPG,RandomFactors=[1 2],FactorNames=["Origin" "Year"])

aov = 
2-way anova, constrained (Type III) sums of squares.

Y ~ 1 + Origin + Year

              SumOfSquares    DF    MeanSquares      F         pValue  
              ____________    __    ___________    ______    __________

    Origin       1078.1        5      215.62       10.675    5.3303e-08
    Year         2638.4        2      1319.2       65.312    5.5975e-18
    Error          1737       86      20.198                           
    Total        6005.3       93                                       


  Properties, Methods

ANOVA の平均二乗の期待値についての表を表示します。

[~,ems] = stats(aov)

ems=3×5 table
                Type         ExpectedMeanSquares        MeanSquaresDenominator    DFDenominator    FDenominator
              ________    __________________________    ______________________    _____________    ____________

    Origin    "random"    "9.159*V(Origin)+V(Error)"            20.198                  86          MS(Error)  
    Year      "random"    "29.5014*V(Year)+V(Error)"            20.198                  86          MS(Error)  
    Error     "random"    "V(Error)"

ランダム因子 Origin と Year の平均二乗の期待値の式には、それぞれの分散成分の項が含まれています。平均二乗の期待値の式を使用して、平均二乗の期待値に誤差の分散とランダム項の分散成分がそれぞれどの程度影響するかを比較できます。

入力引数

すべて折りたたむ

`aov` — 分散分析の結果
`anova` オブジェクト

分散分析の結果。anova オブジェクトとして指定します。aov のプロパティに、ANOVA 表の統計量の計算に stats で使用される因子と応答データが格納されます。

`type` — ANOVA 表のタイプ
`"component"` (既定値) | `"summary"`

ANOVA 表のタイプ。"component" または "summary" として指定します。

例: "summary"

データ型: char | string

`sstype` — 二乗和のタイプ
`"three"` (既定値) | `"two"` | `"one"` | `"hierarchical"`

ANOVA の実行に使用する二乗和のタイプ。"three"、"two"、"one"、または "hierarchical" として指定します。ANOVA のタイプが "component" でない場合、関数 stats は sstype を無視します。主効果が含まれていて交互作用は含まれていないモデルの場合、sstype の値は不平衡なデータの計算にのみ影響します。

項の二乗和 ( $S S_{T e r m}$ ) は、その項を除くモデルに項を追加した場合の誤差二乗和 (SSE) の減少と定義されます。項 Term の二乗和の式は次のような形式になります。

$S S_{T e r m} = \underset{S S E_{f_{e x c l}}}{\underset{︸}{\sum_{i = 1}^{n} {(y_{i} - f_{e x c l} (g_{1}, ..., g_{N}))}^{2}}} - \underset{S S E_{f_{i n c l}}}{\underset{︸}{\sum_{i = 1}^{n} {(y_{i} - f_{i n c l} (g_{1}, ..., g_{N}))}^{2}}}$

ここで、n は観測値の数、 $y_{i}$ は応答データ、 $g_{1}, ..., g_{N}$ は ANOVA の実行に使用される因子、 $f_{e x c l}$ は Term を除くモデル、 $f_{i n c l}$ は Term を含むモデルです。 $f_{e x c l}$ と $f_{i n c l}$ の両方が SumOfSquaresType で指定されます。変数 $S S E_{f_{e x c l}}$ と $S S E_{f_{i n c l}}$ は、それぞれ $f_{e x c l}$ と $f_{i n c l}$ の誤差二乗和です。 $f_{e x c l}$ と $f_{i n c l}$ は、次の表に示す SumOfSquaresType のオプションのいずれかを使用して指定できます。

オプション	二乗和のタイプ
`"three"` (既定の設定)	$f_{i n c l}$ は、プロパティ `Formula` で指定される完全な ANOVA モデルです。 $f_{e x c l}$ は、 $f_{i n c l}$ の Term を除くすべての項で構成されるモデルです。モデル $f_{e x c l}$ の符号化は $f_{i n c l}$ と同じシグマ制約に従います。このタイプの二乗和はタイプ III と呼ばれます。
`"two"`	$f_{e x c l}$ は、プロパティ `Formula` で指定される ANOVA モデルの Term を除くすべての項で構成されるモデルです。Term が連続する項の場合、Term のべき乗は Term を含まない別個の項として扱われます。 $f_{i n c l}$ は、Term と $f_{e x c l}$ のすべての項で構成されるモデルです。このタイプの二乗和はタイプ II と呼ばれます。
`"one"`	$f_{e x c l}$ は、プロパティ `Formula` で指定される ANOVA モデルの Term より前のすべての項で構成されるモデルです。 $f_{i n c l}$ は、Term と $f_{e x c l}$ のすべての項で構成されるモデルです。このタイプの二乗和はタイプ I と呼ばれます。
`"hierarchical"`	$f_{e x c l}$ と $f_{i n c l}$ の定義はタイプ II と同様ですが、Term のべき乗が Term を含む項として扱われます。

例: Component="hierarchical"

データ型: char | string

出力引数

すべて折りたたむ

`s` — ANOVA 統計量
table

ANOVA 統計量。table として返されます。

s の内容は、type で指定した ANOVA のタイプによって異なります。

type が "component" である場合、定数 (切片) 項を除くモデル内の各変数の ANOVA 統計量が s に格納されます。この table には、各変数について以下の列が含まれています。

列	説明
`SumOfSquares`	項によって説明される二乗和。`sstype` に応じて計算されます。
`DF`	自由度数値変数の `DF` は 1 です。カテゴリカル変数の `DF` は、カテゴリに対して作成されるダミー変数の個数 (カテゴリ数 - 1) です。誤差項の `DF` は、全体の `DF` とモデル項の `DF` の合計の差です。全体の `DF` は `aov.NumObservations` - 1 です。
`MeanSquares`	`MeanSquares` = `SumOfSquares`/`DF` によって定義される平均二乗。誤差項の `MeanSquares` は平均二乗誤差 (MSE) です。
`F`	対応する係数がゼロであるという帰無仮説を検定するための F 統計量の値。`F` = `MeanSquares`/`MSE` によって計算されます。帰無仮説が真である場合、F 統計量は F 分布に従います。
`pValue`	F 統計量の値の p 値

type が "summary" である場合、グループ化された項の要約統計量が s の各行に格納されます。要約統計量はタイプ I の二乗和を使用して計算されます。この table には、"component" と同じ列および以下の行が含まれています。

行	説明
`Total`	総統計 `SumOfSquares` — 二乗総和。応答の平均に対する応答の偏差二乗和です。 `DF` — `Regression` と `Error` の自由度の合計
`Regression`	モデル全体に対する統計 `SumOfSquares` — モデルの二乗総和。応答の平均に対する近似値の偏差二乗和です。 `F` および `pValue` — 定数項のみから構成される縮退したモデルよりモデル全体の方が有意に優れているかどうかを検定するための値を提供します。
`Linear`	線形項の統計 `SumOfSquares` — 線形項の二乗和。モデルの二乗和と非線形項の二乗和の差です。 `F` および `pValue` — 定数項のみから構成される縮退したモデルより線形項のみから構成されるモデルの方が優れているかどうかを検定するための値を提供します。`stats` は完全なモデルに基づく平均二乗誤差を使用してこの F 値を計算するので、非線形項を削除して検定を繰り返すことにより得られる F 値はこの行の値と同じではありません。
`NonLinear`	非線形項の統計 `SumOfSquares` — 非線形 (高次または交互作用) 項の二乗和。線形項のみを保持し非線形項をすべて削除した場合の残差二乗和の増加です。 `F` および `pValue` — 線形項のみから構成される小さいモデルより完全なモデルの方が有意に優れているかどうかを検定するための値を提供します。
`Error`	誤差の統計 `SumOfSquares` — 残差二乗和。残差の値の二乗の合計です。 `MeanSquares` — 平均二乗誤差。`Regression`、`Linear` および `NonLinear` の F 統計量の値を計算するために使用されます。データに反復 (同じ因子の値を共有する複数の観測値) が含まれている場合、`s` に `LackOfFit` と `PureError` の行も含まれます。`LackOfFit` と `PureError` は、`Error` をさらに分割したものです。
`LackOfFit`	不適合の統計 `SumOfSquares` — 不適合による二乗和。残差の二乗和と反復の二乗和の差です。 `F` および `pValue` — F 統計量の値は、純粋な誤差の `MeanSquares` に対する不適合の `MeanSquares` の比率です。この比率は、残差の変動が反復の変動より大きいかどうかを調べることにより、バイアスの検定を提供します。小さい p 値は、モデルに項を追加すると近似が改善される可能性があることを示します。
`PureError`	純粋な誤差の統計 `SumOfSquares` — 反復の二乗和。予測子の値が同じである点の集合を探索し、各集合内で平均に対する偏差の二乗和を計算して、計算した値をプールすることにより得られます。 `MeanSquares` — 応答の、モデルに依存しない純粋な誤差の分散の推定値

`ems` — 推定平均二乗の情報
table

推定平均二乗の情報。table として返されます。引数 ems には、それぞれの項についての行と誤差についての行が格納されます。ems によって返される table の変数は次のとおりです。

Type — 項が固定であるかランダムであるかを示すインジケーター。
ExpectedMeanSquares — 平均二乗の期待値の式。
MeanSquaresDenominator — F 統計量の計算における分母の値。
DFDenominator — F 統計量の分母の計算における自由度の値。
FDenominator — F 統計量の計算における分母の式。分母は aov.Formula にランダムな交互作用項があるかどうかによって変わります。

ems の table を使用して、ランダム項の分散が推定平均二乗に大きな影響を与えるかどうかを判別できます。

データ型: table

参照

[1] Dunn, O. J., and V. A. Clark. Applied Statistics: Analysis of Variance and Regression. New York: Wiley, 1974.

[2] Goodnight, J. H., and F. M. Speed. Computing Expected Mean Squares. Cary, NC: SAS Institute, 1978.

[3] Seber, G. A. F., and A. J. Lee. Linear Regression Analysis. 2nd ed. Hoboken, NJ: Wiley-Interscience, 2003.

バージョン履歴

R2022b で導入

参考

anova | varianceComponent | 多因子 ANOVA | 1 因子 ANOVA | 2 因子 ANOVA

stats

構文

説明

例

2 因子 ANOVA の要約表の表示

2 因子 ANOVA の平均二乗の期待値についての表の表示

入力引数

aov — 分散分析の結果 anova オブジェクト

type — ANOVA 表のタイプ "component" (既定値) | "summary"

sstype — 二乗和のタイプ "three" (既定値) | "two" | "one" | "hierarchical"