stats
説明
例
ポップコーン生産量のデータを読み込みます。
load popcorn.mat6 行 3 列の行列 popcorn の列に、Gourmet、National、および Generic の各ブランドについてのポップコーン生産量 (カップ数) の観測値が格納されています。popcorn の最初の 3 行はエアー タイプの製造器具を使用して製造したポップコーン、最後の 3 行はオイル タイプで製造したポップコーンに対応しています。
関数repmatを使用して、ブランドと製造器具タイプの因子の値の string 配列を作成します。
brand = [repmat("Gourmet",6,1); repmat("National",6,1); repmat("Generic",6,1)]; popperType = repmat(["Air";"Air";"Air";"Oil";"Oil";"Oil"], [3, 1]); factors = {brand,popperType};
2 因子 ANOVA を実行して、ポップコーンのブランドや製造器具タイプは平均ポップコーン生産量に影響しないという帰無仮説を検定します。
aov = anova(factors,popcorn(:),FactorNames=["Brand","PopperType"],ModelSpecification="interactions")
aov =
2-way anova, constrained (Type III) sums of squares.
Y ~ 1 + Brand*PopperType
SumOfSquares DF MeanSquares F pValue
____________ __ ___________ ____ __________
Brand 15.75 2 7.875 56.7 7.679e-07
PopperType 4.5 1 4.5 32.4 0.00010037
Brand:PopperType 0.083333 2 0.041667 0.3 0.74622
Error 1.6667 12 0.13889
Total 22 17
Properties, Methods
既定では、anova は成分 ANOVA 表を表示します。
要約 ANOVA 表を生成します。
s = stats(aov,"summary")s=5×5 table
SumOfSquares DF MeanSquares F pValue
____________ __ ___________ _____ __________
Linear 20.25 3 6.75 48.6 5.4835e-07
NonLinear 0.083333 2 0.041667 0.3 0.74622
Regression 20.333 5 4.0667 29.28 2.5065e-06
Error 1.6667 12 0.13889
Total 22 17 1.2941
行 Linear は ANOVA モデルの項 Brand と PopperType に対応します。行 Linear の "p" 値が小さいことから、Brand と PopperType の組み合わせがポップコーン生産量に対して統計的に有意な影響を与えることがわかります。行 NonLinear は項 Brand:PopperType に対応します。行 NonLinear の "p" 値が大きいことから、交互作用項がポップコーン生産量に対して統計的に有意な影響を与えないことがわかります。行 Regression の "p" 値が小さく、この ANOVA モデルが応答データの予測子としてデータの平均よりも優れていることを示しています。
自動車の標本データを読み込みます。
load carsmall変数 Origin、Model_Year、および MPG に生産国、モデル年、および燃費のデータがそれぞれ格納されています。
2 因子 ANOVA を実行して、生産国やモデル年は平均燃費に影響しないという帰無仮説を検定します。
aov = anova({Origin, Model_Year},MPG,RandomFactors=[1 2],FactorNames=["Origin" "Year"])aov =
2-way anova, constrained (Type III) sums of squares.
Y ~ 1 + Origin + Year
SumOfSquares DF MeanSquares F pValue
____________ __ ___________ ______ __________
Origin 1078.1 5 215.62 10.675 5.3303e-08
Year 2638.4 2 1319.2 65.312 5.5975e-18
Error 1737 86 20.198
Total 6005.3 93
Properties, Methods
ANOVA の平均二乗の期待値についての表を表示します。
[~,ems] = stats(aov)
ems=3×5 table
Type ExpectedMeanSquares MeanSquaresDenominator DFDenominator FDenominator
________ __________________________ ______________________ _____________ ____________
Origin "random" "9.159*V(Origin)+V(Error)" 20.198 86 MS(Error)
Year "random" "29.5014*V(Year)+V(Error)" 20.198 86 MS(Error)
Error "random" "V(Error)"
ランダム因子 Origin と Year の平均二乗の期待値の式には、それぞれの分散成分の項が含まれています。平均二乗の期待値の式を使用して、平均二乗の期待値に誤差の分散とランダム項の分散成分がそれぞれどの程度影響するかを比較できます。
入力引数
分散分析の結果。anova オブジェクトとして指定します。aov のプロパティに、ANOVA 表の統計量の計算に stats で使用される因子と応答データが格納されます。
ANOVA 表のタイプ。"component" または "summary" として指定します。
例: "summary"
データ型: char | string
ANOVA の実行に使用する二乗和のタイプ。"three"、"two"、"one"、または "hierarchical" として指定します。ANOVA のタイプが "component" でない場合、関数 stats は sstype を無視します。主効果が含まれていて交互作用は含まれていないモデルの場合、sstype の値は不平衡なデータの計算にのみ影響します。
項の二乗和 () は、その項を除くモデルに項を追加した場合の誤差二乗和 (SSE) の減少と定義されます。項 Term の二乗和の式は次のような形式になります。
ここで、n は観測値の数、 は応答データ、 は ANOVA の実行に使用される因子、 は Term を除くモデル、 は Term を含むモデルです。 と の両方が SumOfSquaresType で指定されます。変数 と は、それぞれ と の誤差二乗和です。 と は、次の表に示す SumOfSquaresType のオプションのいずれかを使用して指定できます。
| オプション | 二乗和のタイプ |
|---|---|
"three" (既定の設定) | は、プロパティ |
"two" | は、プロパティ |
"one" | は、プロパティ |
"hierarchical" | と の定義はタイプ II と同様ですが、Term のべき乗が Term を含む項として扱われます。 |
例: Component="hierarchical"
データ型: char | string
出力引数
ANOVA 統計量。table として返されます。
s の内容は、type で指定した ANOVA のタイプによって異なります。
typeが"component"である場合、定数 (切片) 項を除くモデル内の各変数の ANOVA 統計量がsに格納されます。この table には、各変数について以下の列が含まれています。列 説明 SumOfSquares項によって説明される二乗和。
sstypeに応じて計算されます。DF自由度
数値変数の
DFは 1 です。カテゴリカル変数の
DFは、カテゴリに対して作成されるダミー変数の個数 (カテゴリ数 - 1) です。誤差項の
DFは、全体のDFとモデル項のDFの合計の差です。全体の
DFはaov.NumObservations- 1 です。
MeanSquaresMeanSquares=SumOfSquares/DFによって定義される平均二乗。誤差項の
MeanSquaresは平均二乗誤差 (MSE) です。F対応する係数がゼロであるという帰無仮説を検定するための F 統計量の値。
F=MeanSquares/MSEによって計算されます。帰無仮説が真である場合、F 統計量は F 分布に従います。
pValueF 統計量の値の p 値
typeが"summary"である場合、グループ化された項の要約統計量がsの各行に格納されます。要約統計量はタイプ I の二乗和を使用して計算されます。この table には、"component"と同じ列および以下の行が含まれています。行 説明 Total総統計
SumOfSquares— 二乗総和。応答の平均に対する応答の偏差二乗和です。DF—RegressionとErrorの自由度の合計
Regressionモデル全体に対する統計
SumOfSquares— モデルの二乗総和。応答の平均に対する近似値の偏差二乗和です。FおよびpValue— 定数項のみから構成される縮退したモデルよりモデル全体の方が有意に優れているかどうかを検定するための値を提供します。
Linear線形項の統計
SumOfSquares— 線形項の二乗和。モデルの二乗和と非線形項の二乗和の差です。FおよびpValue— 定数項のみから構成される縮退したモデルより線形項のみから構成されるモデルの方が優れているかどうかを検定するための値を提供します。statsは完全なモデルに基づく平均二乗誤差を使用してこの F 値を計算するので、非線形項を削除して検定を繰り返すことにより得られる F 値はこの行の値と同じではありません。
NonLinear非線形項の統計
SumOfSquares— 非線形 (高次または交互作用) 項の二乗和。線形項のみを保持し非線形項をすべて削除した場合の残差二乗和の増加です。FおよびpValue— 線形項のみから構成される小さいモデルより完全なモデルの方が有意に優れているかどうかを検定するための値を提供します。
Error誤差の統計
SumOfSquares— 残差二乗和。残差の値の二乗の合計です。MeanSquares— 平均二乗誤差。Regression、LinearおよびNonLinearの F 統計量の値を計算するために使用されます。
データに反復 (同じ因子の値を共有する複数の観測値) が含まれている場合、
sにLackOfFitとPureErrorの行も含まれます。LackOfFitとPureErrorは、Errorをさらに分割したものです。LackOfFit不適合の統計
SumOfSquares— 不適合による二乗和。残差の二乗和と反復の二乗和の差です。FおよびpValue— F 統計量の値は、純粋な誤差のMeanSquaresに対する不適合のMeanSquaresの比率です。この比率は、残差の変動が反復の変動より大きいかどうかを調べることにより、バイアスの検定を提供します。小さい p 値は、モデルに項を追加すると近似が改善される可能性があることを示します。
PureError純粋な誤差の統計
SumOfSquares— 反復の二乗和。予測子の値が同じである点の集合を探索し、各集合内で平均に対する偏差の二乗和を計算して、計算した値をプールすることにより得られます。MeanSquares— 応答の、モデルに依存しない純粋な誤差の分散の推定値
推定平均二乗の情報。table として返されます。引数 ems には、それぞれの項についての行と誤差についての行が格納されます。ems によって返される table の変数は次のとおりです。
Type— 項が固定であるかランダムであるかを示すインジケーター。ExpectedMeanSquares— 平均二乗の期待値の式。MeanSquaresDenominator— F 統計量の計算における分母の値。DFDenominator— F 統計量の分母の計算における自由度の値。FDenominator— F 統計量の計算における分母の式。分母はaov.Formulaにランダムな交互作用項があるかどうかによって変わります。
ems の table を使用して、ランダム項の分散が推定平均二乗に大きな影響を与えるかどうかを判別できます。
データ型: table
参照
[1] Dunn, O. J., and V. A. Clark. Applied Statistics: Analysis of Variance and Regression. New York: Wiley, 1974.
[2] Goodnight, J. H., and F. M. Speed. Computing Expected Mean Squares. Cary, NC: SAS Institute, 1978.
[3] Seber, G. A. F., and A. J. Lee. Linear Regression Analysis. 2nd ed. Hoboken, NJ: Wiley-Interscience, 2003.
バージョン履歴
R2022b で導入
参考
anova | varianceComponent | 多因子 ANOVA | 1 因子 ANOVA | 2 因子 ANOVA
MATLAB Command
You clicked a link that corresponds to this MATLAB command:
Run the command by entering it in the MATLAB Command Window. Web browsers do not support MATLAB commands.
Web サイトの選択
Web サイトを選択すると、翻訳されたコンテンツにアクセスし、地域のイベントやサービスを確認できます。現在の位置情報に基づき、次のサイトの選択を推奨します:
また、以下のリストから Web サイトを選択することもできます。
最適なサイトパフォーマンスの取得方法
中国のサイト (中国語または英語) を選択することで、最適なサイトパフォーマンスが得られます。その他の国の MathWorks のサイトは、お客様の地域からのアクセスが最適化されていません。
南北アメリカ
- América Latina (Español)
- Canada (English)
- United States (English)
ヨーロッパ
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)