stats
説明
例
2 因子 ANOVA の要約表の表示
ポップコーン生産量のデータを読み込みます。
load popcorn.mat
6 行 3 列の行列 popcorn
の列に、Gourmet、National、および Generic の各ブランドについてのポップコーン生産量 (カップ数) の観測値が格納されています。popcorn
の最初の 3 行はエアー タイプの製造器具を使用して製造したポップコーン、最後の 3 行はオイル タイプで製造したポップコーンに対応しています。
関数repmat
を使用して、ブランドと製造器具タイプの因子の値の string 配列を作成します。
brand = [repmat("Gourmet",6,1); repmat("National",6,1); repmat("Generic",6,1)]; popperType = repmat(["Air";"Air";"Air";"Oil";"Oil";"Oil"], [3, 1]); factors = {brand,popperType};
2 因子 ANOVA を実行して、ポップコーンのブランドや製造器具タイプは平均ポップコーン生産量に影響しないという帰無仮説を検定します。
aov = anova(factors,popcorn(:),FactorNames=["Brand","PopperType"],ModelSpecification="interactions")
aov = 2-way anova, constrained (Type III) sums of squares. Y ~ 1 + Brand*PopperType SumOfSquares DF MeanSquares F pValue ____________ __ ___________ ____ __________ Brand 15.75 2 7.875 56.7 7.679e-07 PopperType 4.5 1 4.5 32.4 0.00010037 Brand:PopperType 0.083333 2 0.041667 0.3 0.74622 Error 1.6667 12 0.13889 Total 22 17 Properties, Methods
既定では、anova
は成分 ANOVA 表を表示します。
要約 ANOVA 表を生成します。
s = stats(aov,"summary")
s=5×5 table
SumOfSquares DF MeanSquares F pValue
____________ __ ___________ _____ __________
Linear 20.25 3 6.75 48.6 5.4835e-07
NonLinear 0.083333 2 0.041667 0.3 0.74622
Regression 20.333 5 4.0667 29.28 2.5065e-06
Error 1.6667 12 0.13889
Total 22 17 1.2941
行 Linear
は ANOVA モデルの項 Brand
と PopperType
に対応します。行 Linear
の "p" 値が小さいことから、Brand
と PopperType
の組み合わせがポップコーン生産量に対して統計的に有意な影響を与えることがわかります。行 NonLinear
は項 Brand:PopperType
に対応します。行 NonLinear
の "p" 値が大きいことから、交互作用項がポップコーン生産量に対して統計的に有意な影響を与えないことがわかります。行 Regression
の "p" 値が小さく、この ANOVA モデルが応答データの予測子としてデータの平均よりも優れていることを示しています。
2 因子 ANOVA の平均二乗の期待値についての表の表示
自動車の標本データを読み込みます。
load carsmall
変数 Origin
、Model_Year
、および MPG
に生産国、モデル年、および燃費のデータがそれぞれ格納されています。
2 因子 ANOVA を実行して、生産国やモデル年は平均燃費に影響しないという帰無仮説を検定します。
aov = anova({Origin, Model_Year},MPG,RandomFactors=[1 2],FactorNames=["Origin" "Year"])
aov = 2-way anova, constrained (Type III) sums of squares. Y ~ 1 + Origin + Year SumOfSquares DF MeanSquares F pValue ____________ __ ___________ ______ __________ Origin 1078.1 5 215.62 10.675 5.3303e-08 Year 2638.4 2 1319.2 65.312 5.5975e-18 Error 1737 86 20.198 Total 6005.3 93 Properties, Methods
ANOVA の平均二乗の期待値についての表を表示します。
[~,ems] = stats(aov)
ems=3×5 table
Type ExpectedMeanSquares MeanSquaresDenominator DFDenominator FDenominator
________ __________________________ ______________________ _____________ ____________
Origin "random" "9.159*V(Origin)+V(Error)" 20.198 86 MS(Error)
Year "random" "29.5014*V(Year)+V(Error)" 20.198 86 MS(Error)
Error "random" "V(Error)"
ランダム因子 Origin
と Year
の平均二乗の期待値の式には、それぞれの分散成分の項が含まれています。平均二乗の期待値の式を使用して、平均二乗の期待値に誤差の分散とランダム項の分散成分がそれぞれどの程度影響するかを比較できます。
入力引数
aov
— 分散分析の結果
anova
オブジェクト
分散分析の結果。anova
オブジェクトとして指定します。aov
のプロパティに、ANOVA 表の統計量の計算に stats
で使用される因子と応答データが格納されます。
type
— ANOVA 表のタイプ
"component"
(既定値) | "summary"
ANOVA 表のタイプ。"component"
または "summary"
として指定します。
例: "summary"
データ型: char
| string
sstype
— 二乗和のタイプ
"three"
(既定値) | "two"
| "one"
| "hierarchical"
ANOVA の実行に使用する二乗和のタイプ。"three"
、"two"
、"one"
、または "hierarchical"
として指定します。ANOVA のタイプが "component"
でない場合、関数 stats
は sstype
を無視します。主効果が含まれていて交互作用は含まれていないモデルの場合、sstype
の値は不平衡なデータの計算にのみ影響します。
項の二乗和 () は、その項を除くモデルに項を追加した場合の誤差二乗和 (SSE) の減少と定義されます。項 Term の二乗和の式は次のような形式になります。
ここで、n は観測値の数、 は応答データ、 は ANOVA の実行に使用される因子、 は Term を除くモデル、 は Term を含むモデルです。 と の両方が SumOfSquaresType
で指定されます。変数 と は、それぞれ と の誤差二乗和です。 と は、次の表に示す SumOfSquaresType
のオプションのいずれかを使用して指定できます。
オプション | 二乗和のタイプ |
---|---|
"three" (既定の設定) | は、プロパティ |
"two" | は、プロパティ |
"one" | は、プロパティ |
"hierarchical" | と の定義はタイプ II と同様ですが、Term のべき乗が Term を含む項として扱われます。 |
例: Component="hierarchical"
データ型: char
| string
出力引数
s
— ANOVA 統計量
テーブル
ANOVA 統計量。table として返されます。
s
の内容は、type
で指定した ANOVA のタイプによって異なります。
type
が"component"
である場合、定数 (切片) 項を除くモデル内の各変数の ANOVA 統計量がs
に格納されます。この table には、各変数について以下の列が含まれています。列 説明 SumOfSquares
項によって説明される二乗和。
sstype
に応じて計算されます。DF
自由度
数値変数の
DF
は 1 です。カテゴリカル変数の
DF
は、カテゴリに対して作成されるダミー変数の個数 (カテゴリ数 - 1) です。誤差項の
DF
は、全体のDF
とモデル項のDF
の合計の差です。全体の
DF
はaov.NumObservations
- 1 です。
MeanSquares
MeanSquares
=SumOfSquares
/DF
によって定義される平均二乗。誤差項の
MeanSquares
は平均二乗誤差 (MSE) です。F
対応する係数がゼロであるという帰無仮説を検定するための F 統計量の値。
F
=MeanSquares
/MSE
によって計算されます。帰無仮説が真である場合、F 統計量は F 分布に従います。
pValue
F 統計量の値の p 値
type
が"summary"
である場合、グループ化された項の要約統計量がs
の各行に格納されます。要約統計量はタイプ I の二乗和を使用して計算されます。この table には、"component"
と同じ列および以下の行が含まれています。行 説明 Total
総統計
SumOfSquares
— 二乗総和。応答の平均に対する応答の偏差二乗和です。DF
—Regression
とError
の自由度の合計
Regression
モデル全体に対する統計
SumOfSquares
— モデルの二乗総和。応答の平均に対する近似値の偏差二乗和です。F
およびpValue
— 定数項のみから構成される縮退したモデルよりモデル全体の方が有意に優れているかどうかを検定するための値を提供します。
Linear
線形項の統計
SumOfSquares
— 線形項の二乗和。モデルの二乗和と非線形項の二乗和の差です。F
およびpValue
— 定数項のみから構成される縮退したモデルより線形項のみから構成されるモデルの方が優れているかどうかを検定するための値を提供します。stats
は完全なモデルに基づく平均二乗誤差を使用してこの F 値を計算するので、非線形項を削除して検定を繰り返すことにより得られる F 値はこの行の値と同じではありません。
NonLinear
非線形項の統計
SumOfSquares
— 非線形 (高次または交互作用) 項の二乗和。線形項のみを保持し非線形項をすべて削除した場合の残差二乗和の増加です。F
およびpValue
— 線形項のみから構成される小さいモデルより完全なモデルの方が有意に優れているかどうかを検定するための値を提供します。
Error
誤差の統計
SumOfSquares
— 残差二乗和。残差の値の二乗の合計です。MeanSquares
— 平均二乗誤差。Regression
、Linear
およびNonLinear
の F 統計量の値を計算するために使用されます。
データに反復 (同じ因子の値を共有する複数の観測値) が含まれている場合、
s
にLackOfFit
とPureError
の行も含まれます。LackOfFit
とPureError
は、Error
をさらに分割したものです。LackOfFit
不適合の統計
SumOfSquares
— 不適合による二乗和。残差の二乗和と反復の二乗和の差です。F
およびpValue
— F 統計量の値は、純粋な誤差のMeanSquares
に対する不適合のMeanSquares
の比率です。この比率は、残差の変動が反復の変動より大きいかどうかを調べることにより、バイアスの検定を提供します。小さい p 値は、モデルに項を追加すると近似が改善される可能性があることを示します。
PureError
純粋な誤差の統計
SumOfSquares
— 反復の二乗和。予測子の値が同じである点の集合を探索し、各集合内で平均に対する偏差の二乗和を計算して、計算した値をプールすることにより得られます。MeanSquares
— 応答の、モデルに依存しない純粋な誤差の分散の推定値
ems
— 推定平均二乗の情報
テーブル
推定平均二乗の情報。table として返されます。引数 ems
には、それぞれの項についての行と誤差についての行が格納されます。ems
によって返される table の変数は次のとおりです。
Type
— 項が固定であるかランダムであるかを示すインジケーター。ExpectedMeanSquares
— 平均二乗の期待値の式。MeanSquaresDenominator
— F 統計量の計算における分母の値。DFDenominator
— F 統計量の分母の計算における自由度の値。FDenominator
— F 統計量の計算における分母の式。分母はaov.Formula
にランダムな交互作用項があるかどうかによって変わります。
ems
の table を使用して、ランダム項の分散が推定平均二乗に大きな影響を与えるかどうかを判別できます。
データ型: table
参照
[1] Dunn, O. J., and V. A. Clark. Applied Statistics: Analysis of Variance and Regression. New York: Wiley, 1974.
[2] Goodnight, J. H., and F. M. Speed. Computing Expected Mean Squares. Cary, NC: SAS Institute, 1978.
[3] Seber, G. A. F., and A. J. Lee. Linear Regression Analysis. 2nd ed. Hoboken, NJ: Wiley-Interscience, 2003.
バージョン履歴
R2022b で導入
参考
anova
| varianceComponent
| 多因子 ANOVA | 1 因子 ANOVA | 2 因子 ANOVA
MATLAB コマンド
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)