Main Content

multcompare

分散分析 (ANOVA) の平均の多重比較

R2022b 以降

    説明

    m = multcompare(aov) は、1 因子 anova オブジェクトについて、平均の多重比較の結果を含む table m を返します。

    m = multcompare(aov,factors) は、factors にリストされた因子の値の組み合わせについて、平均の多重比較を実行します。この構文は、1 因子、2 因子、または多因子 ANOVA に対して有効です。

    m = multcompare(___,Name=Value) では、1 つ以上の名前と値の引数を使用して追加オプションを指定します。たとえば、信頼水準を指定したり、平均が有意に異なるかどうかの判定に使用する棄却限界値の種類を指定したりできます。

    すべて折りたたむ

    ポップコーン生産量のデータを読み込みます。

    load popcorn.mat

    6 行 3 列の行列 popcorn の列に、Gourmet、National、および Generic の各ブランドについてのポップコーン生産量 (カップ数) の観測値が格納されています。

    popcorn をベクトルに変換します。

    popcorn = popcorn(:);

    関数repmatを使用して、因子 Brand の値の string 配列を作成します。

    brand = [repmat("Gourmet",6,1); repmat("National",6,1); repmat("Generic",6,1)];

    1 因子 ANOVA を実行して、3 つのブランドのいずれでも平均生産量が同じであるという帰無仮説を検定します。

    aov = anova(brand,popcorn,FactorNames="Brand")
    aov = 
    1-way anova, constrained (Type III) sums of squares.
    
    Y ~ 1 + Brand
    
                 SumOfSquares    DF    MeanSquares     F        pValue  
                 ____________    __    ___________    ____    __________
    
        Brand       15.75         2        7.875      18.9    7.9603e-05
        Error        6.25        15      0.41667                        
        Total          22        17                                     
    
    
      Properties, Methods
    
    
    

    "p" 値が小さく、帰無仮説を 99% の信頼水準で棄却できることを示しています。したがって、少なくとも 1 つのブランドの平均ポップコーン生産量に統計的な有意差があります。ダネットの検定を実行して、GourmetNational の平均生産量が Generic の平均生産量と有意に異なるかどうかを判定します。

    m = multcompare(aov,CriticalValueType="dunnett",ControlGroup=3)
    m=2×6 table
          Group1       Group2      MeanDifference    MeanDifferenceLower    MeanDifferenceUpper     pValue  
        __________    _________    ______________    ___________________    ___________________    _________
    
        "Gourmet"     "Generic"         2.25                 1.341                 3.159           4.402e-05
        "National"    "Generic"         0.75              -0.15904                 1.659             0.11012
    
    

    m の各行に、列 Group1Group2 のグループの平均に有意差がないという帰無仮説の "p" 値が格納されています。1 行目の "p" 値は十分に小さく、Gourmet の平均ポップコーン生産量に Generic との有意差がないという帰無仮説を棄却できます。2 行目の "p" 値は十分に大きく、National の平均ポップコーン生産量に Generic との有意差がないという帰無仮説を棄却できます。1 行目の MeanDifference の値は正であるため、Gourmet の平均ポップコーン生産量は Generic と比べて有意に多いことになります。

    患者のデータを読み込みます。

    load patients.mat

    患者の喫煙状況と物理的な場所についての因子の値をもつ変数と収縮期血圧についての応答データを格納する table を作成します。

    tbl = table(Smoker,Location,Systolic)
    tbl=100×3 table
        Smoker              Location               Systolic
        ______    _____________________________    ________
    
        true      {'County General Hospital'  }      124   
        false     {'VA Hospital'              }      109   
        false     {'St. Mary's Medical Center'}      125   
        false     {'VA Hospital'              }      117   
        false     {'County General Hospital'  }      122   
        false     {'St. Mary's Medical Center'}      121   
        true      {'VA Hospital'              }      130   
        false     {'VA Hospital'              }      115   
        false     {'St. Mary's Medical Center'}      115   
        false     {'County General Hospital'  }      118   
        false     {'County General Hospital'  }      114   
        false     {'St. Mary's Medical Center'}      115   
        false     {'VA Hospital'              }      127   
        true      {'VA Hospital'              }      130   
        false     {'St. Mary's Medical Center'}      114   
        true      {'VA Hospital'              }      130   
          ⋮
    
    

    2 因子 ANOVA を実行して、喫煙者と非喫煙者のどちらであるかや場所によって収縮期血圧に有意差はないという帰無仮説を検定します。

    aov = anova(tbl,"Systolic")
    aov = 
    2-way anova, constrained (Type III) sums of squares.
    
    Systolic ~ 1 + Smoker + Location
    
                    SumOfSquares    DF    MeanSquares      F         pValue  
                    ____________    __    ___________    ______    __________
    
        Smoker         2154.4        1      2154.4       94.462    5.9678e-16
        Location       46.064        2      23.032       1.0099       0.36811
        Error          2189.5       96      22.807                           
        Total          4461.2       99                                       
    
    
      Properties, Methods
    
    
    

    "p" 値は、喫煙状況が血圧に有意な影響を与えると結論付けるだけの十分な証拠があることを示しています。一方、物理的な場所が有意な影響を与えると結論付けるだけの十分な証拠はありません。

    各グループの応答データの平均差を調べます。

    m = multcompare(aov,["Smoker","Location"])
    m=15×6 table
                        Group1                                     Group2                     MeanDifference    MeanDifferenceLower    MeanDifferenceUpper      pValue  
        _______________________________________    _______________________________________    ______________    ___________________    ___________________    __________
    
        Smoker              Location               Smoker              Location                                                                                         
        ______    _____________________________    ______    _____________________________                                                                              
                                                                                                                                                                        
        false     {'County General Hospital'  }    true      {'County General Hospital'  }        -9.935              -12.908                -6.9623          7.6385e-15
        false     {'County General Hospital'  }    false     {'VA Hospital'              }         1.516              -1.6761                  4.708             0.73817
        false     {'County General Hospital'  }    true      {'VA Hospital'              }        -8.419              -12.899                -3.9394          5.3456e-06
        false     {'County General Hospital'  }    false     {'St. Mary's Medical Center'}        0.3721              -3.2806                 4.0248             0.99968
        false     {'County General Hospital'  }    true      {'St. Mary's Medical Center'}       -9.5629              -14.637                -4.4886          5.0113e-06
        true      {'County General Hospital'  }    false     {'VA Hospital'              }        11.451               7.2101                 15.692          8.3835e-11
        true      {'County General Hospital'  }    true      {'VA Hospital'              }         1.516              -1.6761                  4.708             0.73817
        true      {'County General Hospital'  }    false     {'St. Mary's Medical Center'}        10.307               5.9931                 14.621          6.5271e-09
        true      {'County General Hospital'  }    true      {'St. Mary's Medical Center'}        0.3721              -3.2806                 4.0248             0.99968
        false     {'VA Hospital'              }    true      {'VA Hospital'              }        -9.935              -12.908                -6.9623          7.6385e-15
        false     {'VA Hospital'              }    false     {'St. Mary's Medical Center'}       -1.1439              -4.8086                 2.5209             0.94367
        false     {'VA Hospital'              }    true      {'St. Mary's Medical Center'}       -11.079              -16.058                -6.0994          6.0817e-08
        true      {'VA Hospital'              }    false     {'St. Mary's Medical Center'}        8.7911               4.3482                 13.234          1.5297e-06
        true      {'VA Hospital'              }    true      {'St. Mary's Medical Center'}       -1.1439              -4.8086                 2.5209             0.94367
        false     {'St. Mary's Medical Center'}    true      {'St. Mary's Medical Center'}        -9.935              -12.908                -6.9623          7.6385e-15
    
    

    それぞれの "p" 値は、同じ行のグループの平均に有意差がないという帰無仮説に対応します。table には 0.05 より大きい "p" 値が 6 つ含まれており、それらは喫煙状況の値が同じ 6 つのグループのペアに対応しています。したがって、喫煙状況の値が同じグループの間で収縮期血圧に有意差はありません。

    入力引数

    すべて折りたたむ

    分散分析の結果。anova オブジェクトとして指定します。aov のプロパティに、平均差の計算に multcompare で使用される因子と応答データが格納されます。

    応答データのグループ化に使用する因子。string ベクトルまたは文字ベクトルの cell 配列として指定します。関数 multcompare は、factors の因子の値の組み合わせで応答データをグループ化します。引数 factors は、aov.FactorNames に含まれる 1 つ以上の名前でなければなりません。

    例: ["g1","g2"]

    データ型: string | cell

    名前と値の引数

    オプションの引数のペアを Name1=Value1,...,NameN=ValueN として指定します。ここで Name は引数名、Value は対応する値です。名前と値の引数は他の引数の後ろにする必要がありますが、ペアの順序は関係ありません。

    例: Alpha=0.01,CriticalValueType="dunnett",Approximate=true は、信頼区間の有意水準を 0.01 に設定し、p 値の計算にダネットの棄却限界値の近似を使用します。

    推定値の有意水準。範囲 (0,1) のスカラー値として指定します。信頼区間の信頼水準は 100(1α)% です。Alpha の既定値は 0.05 で、推定値の 95% 信頼区間を返します。

    例: Alpha=0.01

    データ型: single | double

    関数 multcompare で p 値の計算に使用する棄却限界値の種類。次の表のいずれかのオプションとして指定します。各オプションは multcompare が棄却限界値の計算に使用する統計検定を指定します。

    オプション統計検定
    "tukey-kramer" (既定の設定)テューキー・クレーマー検定
    "hsd"HSD 検定 — "tukey-kramer" と同じ
    "dunn-sidak"ダン・シダック補正
    "bonferroni"ボンフェローニ補正
    "scheffe"シェッフェ検定
    "dunnett"ダネットの検定 — aov が 1 因子 anova オブジェクトの場合、または factors で単一の因子が指定されている場合にのみ使用できます。ダネットの検定では、生成されたプロットで制御グループが選択されており、変更することはできません。
    "lsd"最小有意差 (Least Significant Difference) を意味し、プレーンな t 検定の棄却限界値を使用します。このオプションでは、F 検定などの予備の全体検定がないと、多重比較の問題は防止されません。

    例: CriticalValueType="dunn-sidak"

    データ型: char | string

    ダネットの棄却限界値の近似を計算するためのインジケーター。数値または logical の 1 (true) または 0 (false) として指定します。高速化のためにダネットの棄却限界値の近似を計算できます。Approximate の既定値は、因子の数が 2 より大きい多因子 ANOVA については true、それ以外については false です。この引数は、CriticalValueType"dunnett" である場合のみ有効です。

    例: Approximate=true

    データ型: logical

    ダネットの検定に使用する制御グループの因子の値のインデックス。正の整数として指定します。因子の値には aov.ExpandedFactorNames での順序に従ってインデックスが付けられます。この引数は、CriticalValueType"dunnett" である場合のみ有効です。

    例: ControlGroup=3

    データ型: single | double

    出力引数

    すべて折りたたむ

    多重比較法の結果。table として返されます。table m の変数は次のとおりです。

    • Group1 — 1 つ目の比較グループの因子の値

    • Group2 — 2 つ目の比較グループの因子の値

    • MeanDifferenceGroup1 の観測値と Group2 の観測値の平均応答の差

    • MeanDifferenceLower — 平均差の 95% 信頼限界の下限

    • MeanDifferenceUpper — 平均差の 95% 信頼限界の上限

    • pValueGroup1 の平均が Group2 の平均と有意に異なるかどうかを示す p 値

    2 つ以上の因子が factors で指定されている場合、列 Group1Group2 には、比較するグループの因子の値を含む table が格納されます。

    参照

    [1] Hochberg, Y., and A. C. Tamhane. Multiple Comparison Procedures. Hoboken, NJ: John Wiley & Sons, 1987.

    [2] Milliken, G. A., and D. E. Johnson. Analysis of Messy Data, Volume I: Designed Experiments. Boca Raton, FL: Chapman & Hall/CRC Press, 1992.

    [3] Searle, S. R., F. M. Speed, and G. A. Milliken. “Population marginal means in the linear model: an alternative to least-squares means.” American Statistician. 1980, pp. 216–221.

    [4] Dunnett, Charles W. “A Multiple Comparison Procedure for Comparing Several Treatments with a Control.” Journal of the American Statistical Association, vol. 50, no. 272, Dec. 1955, pp. 1096–121.

    [5] Krishnaiah, Paruchuri R., and J. V. Armitage. "Tables for multivariate t distribution." Sankhyā: The Indian Journal of Statistics, Series B (1966): 31-56.

    バージョン履歴

    R2022b で導入