Main Content

stats

分散分析 (ANOVA) の表

R2022b 以降

    説明

    s = stats(aov) は、anova オブジェクト aov の成分 ANOVA 表を返します。成分 ANOVA 表には、モデル項、誤差、および全体についての統計量が含まれます。詳細については、s を参照してください。

    s = stats(aov,type) は、成分 ANOVA 表と要約 ANOVA 表のどちらを返すかを指定します。要約 ANOVA 表には、線形と非線形のモデル項、回帰、誤差、および全体についての要約統計量が含まれます。詳細については、s を参照してください。

    s = stats(aov,Component=sstype) は、成分表の作成に使用される二乗和のタイプを指定します。

    [s,ems] = stats(___) は、それぞれの項および誤差の平均二乗の期待値についての情報を含む table ems も返します。stats の呼び出しで sstype を指定した場合、指定した二乗和のタイプで ems の table が作成されます。

    すべて折りたたむ

    ポップコーン生産量のデータを読み込みます。

    load popcorn.mat

    6 行 3 列の行列 popcorn の列に、Gourmet、National、および Generic の各ブランドについてのポップコーン生産量 (カップ数) の観測値が格納されています。popcorn の最初の 3 行はエアー タイプの製造器具を使用して製造したポップコーン、最後の 3 行はオイル タイプで製造したポップコーンに対応しています。

    関数repmatを使用して、ブランドと製造器具タイプの因子の値の string 配列を作成します。

    brand = [repmat("Gourmet",6,1); repmat("National",6,1); repmat("Generic",6,1)];
    popperType = repmat(["Air";"Air";"Air";"Oil";"Oil";"Oil"], [3, 1]);
    factors = {brand,popperType};

    2 因子 ANOVA を実行して、ポップコーンのブランドや製造器具タイプは平均ポップコーン生産量に影響しないという帰無仮説を検定します。

    aov = anova(factors,popcorn(:),FactorNames=["Brand","PopperType"],ModelSpecification="interactions")
    aov = 
    2-way anova, constrained (Type III) sums of squares.
    
    Y ~ 1 + Brand*PopperType
    
                            SumOfSquares    DF    MeanSquares     F        pValue  
                            ____________    __    ___________    ____    __________
    
        Brand                    15.75       2        7.875      56.7     7.679e-07
        PopperType                 4.5       1          4.5      32.4    0.00010037
        Brand:PopperType      0.083333       2     0.041667       0.3       0.74622
        Error                   1.6667      12      0.13889                        
        Total                       22      17                                     
    
    
      Properties, Methods
    
    
    

    既定では、anova は成分 ANOVA 表を表示します。

    要約 ANOVA 表を生成します。

    s = stats(aov,"summary")
    s=5×5 table
                      SumOfSquares    DF    MeanSquares      F        pValue  
                      ____________    __    ___________    _____    __________
    
        Linear             20.25       3         6.75       48.6    5.4835e-07
        NonLinear       0.083333       2     0.041667        0.3       0.74622
        Regression        20.333       5       4.0667      29.28    2.5065e-06
        Error             1.6667      12      0.13889                         
        Total                 22      17       1.2941                         
    
    

    Linear は ANOVA モデルの項 BrandPopperType に対応します。行 Linear"p" 値が小さいことから、BrandPopperType の組み合わせがポップコーン生産量に対して統計的に有意な影響を与えることがわかります。行 NonLinear は項 Brand:PopperType に対応します。行 NonLinear"p" 値が大きいことから、交互作用項がポップコーン生産量に対して統計的に有意な影響を与えないことがわかります。行 Regression"p" 値が小さく、この ANOVA モデルが応答データの予測子としてデータの平均よりも優れていることを示しています。

    自動車の標本データを読み込みます。

    load carsmall

    変数 OriginModel_Year、および MPG に生産国、モデル年、および燃費のデータがそれぞれ格納されています。

    2 因子 ANOVA を実行して、生産国やモデル年は平均燃費に影響しないという帰無仮説を検定します。

    aov = anova({Origin, Model_Year},MPG,RandomFactors=[1 2],FactorNames=["Origin" "Year"])
    aov = 
    2-way anova, constrained (Type III) sums of squares.
    
    Y ~ 1 + Origin + Year
    
                  SumOfSquares    DF    MeanSquares      F         pValue  
                  ____________    __    ___________    ______    __________
    
        Origin       1078.1        5      215.62       10.675    5.3303e-08
        Year         2638.4        2      1319.2       65.312    5.5975e-18
        Error          1737       86      20.198                           
        Total        6005.3       93                                       
    
    
      Properties, Methods
    
    
    

    ANOVA の平均二乗の期待値についての表を表示します。

    [~,ems] = stats(aov)
    ems=3×5 table
                    Type         ExpectedMeanSquares        MeanSquaresDenominator    DFDenominator    FDenominator
                  ________    __________________________    ______________________    _____________    ____________
    
        Origin    "random"    "9.159*V(Origin)+V(Error)"            20.198                  86          MS(Error)  
        Year      "random"    "29.5014*V(Year)+V(Error)"            20.198                  86          MS(Error)  
        Error     "random"    "V(Error)"                                                                           
    
    

    ランダム因子 OriginYear の平均二乗の期待値の式には、それぞれの分散成分の項が含まれています。平均二乗の期待値の式を使用して、平均二乗の期待値に誤差の分散とランダム項の分散成分がそれぞれどの程度影響するかを比較できます。

    入力引数

    すべて折りたたむ

    分散分析の結果。anova オブジェクトとして指定します。aov のプロパティに、ANOVA 表の統計量の計算に stats で使用される因子と応答データが格納されます。

    ANOVA 表のタイプ。"component" または "summary" として指定します。

    例: "summary"

    データ型: char | string

    ANOVA の実行に使用する二乗和のタイプ。"three""two""one"、または "hierarchical" として指定します。ANOVA のタイプが "component" でない場合、関数 statssstype を無視します。主効果が含まれていて交互作用は含まれていないモデルの場合、sstype の値は不平衡なデータの計算にのみ影響します。

    項の二乗和 (SSTerm) は、その項を除くモデルに項を追加した場合の誤差二乗和 (SSE) の減少と定義されます。項 Term の二乗和の式は次のような形式になります。

    SSTerm=i=1n(yifexcl(g1,...,gN))2SSEfexcli=1n(yifincl(g1,...,gN))2SSEfincl

    ここで、n は観測値の数、yi は応答データ、g1,...,gN は ANOVA の実行に使用される因子、fexcl は Term を除くモデル、fincl は Term を含むモデルです。fexclfincl の両方が SumOfSquaresType で指定されます。変数 SSEfexclSSEfincl は、それぞれ fexclfincl の誤差二乗和です。fexclfincl は、次の表に示す SumOfSquaresType のオプションのいずれかを使用して指定できます。

    オプション二乗和のタイプ
    "three" (既定の設定)

    fincl は、プロパティ Formula で指定される完全な ANOVA モデルです。fexcl は、fincl の Term を除くすべての項で構成されるモデルです。モデル fexcl の符号化は fincl と同じシグマ制約に従います。このタイプの二乗和はタイプ III と呼ばれます。

    "two"

    fexcl は、プロパティ Formula で指定される ANOVA モデルの Term を除くすべての項で構成されるモデルです。Term が連続する項の場合、Term のべき乗は Term を含まない別個の項として扱われます。fincl は、Term と fexcl のすべての項で構成されるモデルです。このタイプの二乗和はタイプ II と呼ばれます。

    "one"

    fexcl は、プロパティ Formula で指定される ANOVA モデルの Term より前のすべての項で構成されるモデルです。fincl は、Term と fexcl のすべての項で構成されるモデルです。このタイプの二乗和はタイプ I と呼ばれます。

    "hierarchical"

    fexclfincl の定義はタイプ II と同様ですが、Term のべき乗が Term を含む項として扱われます。

    例: Component="hierarchical"

    データ型: char | string

    出力引数

    すべて折りたたむ

    ANOVA 統計量。table として返されます。

    s の内容は、type で指定した ANOVA のタイプによって異なります。

    • type"component" である場合、定数 (切片) 項を除くモデル内の各変数の ANOVA 統計量が s に格納されます。この table には、各変数について以下の列が含まれています。

      説明
      SumOfSquares

      項によって説明される二乗和。sstype に応じて計算されます。

      DF

      自由度

      • 数値変数の DF は 1 です。

      • カテゴリカル変数の DF は、カテゴリに対して作成されるダミー変数の個数 (カテゴリ数 - 1) です。

      • 誤差項の DF は、全体の DF とモデル項の DF の合計の差です。

      • 全体の DFaov.NumObservations - 1 です。

      MeanSquares

      MeanSquares = SumOfSquares/DF によって定義される平均二乗。

      誤差項の MeanSquares は平均二乗誤差 (MSE) です。

      F

      対応する係数がゼロであるという帰無仮説を検定するための F 統計量の値。F = MeanSquares/MSE によって計算されます。

      帰無仮説が真である場合、F 統計量は F 分布に従います。

      pValue

      F 統計量の値の p 値

    • type"summary" である場合、グループ化された項の要約統計量が s の各行に格納されます。要約統計量はタイプ I の二乗和を使用して計算されます。この table には、"component" と同じ列および以下の行が含まれています。

      説明
      Total

      総統計

      • SumOfSquares — 二乗総和。応答の平均に対する応答の偏差二乗和です。

      • DFRegressionError の自由度の合計

      Regression

      モデル全体に対する統計

      • SumOfSquares — モデルの二乗総和。応答の平均に対する近似値の偏差二乗和です。

      • F および pValue — 定数項のみから構成される縮退したモデルよりモデル全体の方が有意に優れているかどうかを検定するための値を提供します。

      Linear

      線形項の統計

      • SumOfSquares — 線形項の二乗和。モデルの二乗和と非線形項の二乗和の差です。

      • F および pValue — 定数項のみから構成される縮退したモデルより線形項のみから構成されるモデルの方が優れているかどうかを検定するための値を提供します。stats は完全なモデルに基づく平均二乗誤差を使用してこの F 値を計算するので、非線形項を削除して検定を繰り返すことにより得られる F 値はこの行の値と同じではありません。

      NonLinear

      非線形項の統計

      • SumOfSquares — 非線形 (高次または交互作用) 項の二乗和。線形項のみを保持し非線形項をすべて削除した場合の残差二乗和の増加です。

      • F および pValue — 線形項のみから構成される小さいモデルより完全なモデルの方が有意に優れているかどうかを検定するための値を提供します。

      Error

      誤差の統計

      • SumOfSquares — 残差二乗和。残差の値の二乗の合計です。

      • MeanSquares — 平均二乗誤差。RegressionLinear および NonLinear の F 統計量の値を計算するために使用されます。

      データに反復 (同じ因子の値を共有する複数の観測値) が含まれている場合、sLackOfFitPureError の行も含まれます。LackOfFitPureError は、Error をさらに分割したものです。

      LackOfFit

      不適合の統計

      • SumOfSquares — 不適合による二乗和。残差の二乗和と反復の二乗和の差です。

      • F および pValue — F 統計量の値は、純粋な誤差の MeanSquares に対する不適合の MeanSquares の比率です。この比率は、残差の変動が反復の変動より大きいかどうかを調べることにより、バイアスの検定を提供します。小さい p 値は、モデルに項を追加すると近似が改善される可能性があることを示します。

      PureError

      純粋な誤差の統計

      • SumOfSquares — 反復の二乗和。予測子の値が同じである点の集合を探索し、各集合内で平均に対する偏差の二乗和を計算して、計算した値をプールすることにより得られます。

      • MeanSquares — 応答の、モデルに依存しない純粋な誤差の分散の推定値

    推定平均二乗の情報。table として返されます。引数 ems には、それぞれの項についての行と誤差についての行が格納されます。ems によって返される table の変数は次のとおりです。

    • Type — 項が固定であるかランダムであるかを示すインジケーター。

    • ExpectedMeanSquares — 平均二乗の期待値の式。

    • MeanSquaresDenominator — F 統計量の計算における分母の値。

    • DFDenominator — F 統計量の分母の計算における自由度の値。

    • FDenominator — F 統計量の計算における分母の式。分母は aov.Formula にランダムな交互作用項があるかどうかによって変わります。

    ems の table を使用して、ランダム項の分散が推定平均二乗に大きな影響を与えるかどうかを判別できます。

    データ型: table

    参照

    [1] Dunn, O. J., and V. A. Clark. Applied Statistics: Analysis of Variance and Regression. New York: Wiley, 1974.

    [2] Goodnight, J. H., and F. M. Speed. Computing Expected Mean Squares. Cary, NC: SAS Institute, 1978.

    [3] Seber, G. A. F., and A. J. Lee. Linear Regression Analysis. 2nd ed. Hoboken, NJ: Wiley-Interscience, 2003.

    バージョン履歴

    R2022b で導入