このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。
compareHoldout
新しいデータを使用して 2 つの分類モデルの精度を比較
構文
説明
compareHoldout
は、2 つの分類モデルの精度を統計的に評価します。この関数では、予測したラベルを真のラベルに対して比較してから、誤分類率の違いが統計的に有意であるかどうかを調べます。
複数の分類モデルの精度が異なるかどうかや、あるモデルの性能が別のモデルより優れているかどうかを判断できます。compareHoldout
では、漸近検定、厳密条件検定、mid-p 値検定など、いくつかのマクネマー検定のバリエーションを実行できます。コストを考慮する評価については、カイ二乗検定 (Optimization Toolbox™ が必要) や尤度比検定などの検定を行うことができます。
は、「学習済みの分類モデル h
= compareHoldout(C1
,C2
,T1
,T2
,ResponseVarName
)C1
および C2
は変数 ResponseVarName
に含まれている真のクラス ラベルを予測する精度が等しい」という帰無仮説の検定の判定を返します。対立仮説は「ラベルの精度は等しくない」です。
1 番目の分類モデル C1
では T1
に含まれている予測子データを、2 番目の分類モデル C2
では T2
に含まれている予測子データを使用します。table T1
および T2
には、同じ応答変数を含めなければなりませんが、予測子については異なるセットを含めることができます。既定では、mid-p 値マクネマー検定が精度の比較に使用されます。
h
= 1
の場合、帰無仮説は 5% の有意水準で棄却されます。h
= 0
の場合、帰無仮説は 5% の水準では棄却されません。
以下のような検定を行うことができます。
同じ予測子データのセットを渡して (
T1
=T2
)、単純な分類モデルとより複雑なモデルの精度を比較する。異なる可能性がある 2 種類の予測子データのセットを使用して、異なる可能性がある 2 つのモデルの精度を比較する。
さまざまな特徴選択を実行する。たとえば、ある予測子のセットを使用して学習させたモデルの精度と、同じ予測子のサブセットまたは別の予測子のセットを使用して学習させたモデルの精度を比較できます。予測子のセットは自由に選択できます。また、PCA (
pca
参照) や逐次特徴選択 (sequentialfs
参照) などの特徴選択手法を使用することもできます。
例
入力引数
出力引数
制限
compareHoldout
は、線形分類モデルまたはカーネル分類モデル (つまりClassificationLinear
またはClassificationKernel
モデル オブジェクト) から構成される ECOC モデルを比較しません。線形分類モデルまたはカーネル分類モデルから構成されるClassificationECOC
モデルを比較するには、代わりにtestcholdout
を使用します。同様に、
compareHoldout
はClassificationLinear
またはClassificationKernel
モデル オブジェクトを比較しません。これらのモデルを比較するには、代わりにtestcholdout
を使用します。
詳細
ヒント
コストを考慮しない特徴選択を実行する方法の 1 つとして、次のようなものがあります。
あるいは、2 つのモデルの精度に有意な差があるかどうかを評価することもできます。この評価を実行するには、手順 4 から
'Alternative','less'
の指定を削除します。compareHoldout
の実行により両側検定が実行され、h = 0
は、2 つのモデル間の精度の差を示す十分な証拠がないことを示します。コストを考慮する検定では数値を最適化しますが、これには追加の計算リソースが必要です。尤度比検定では、ある区間におけるラグランジュ乗数の根を求めるため間接的に数値を最適化します。データセットによっては、根が区間の境界付近にある場合、メソッドが失敗する可能性があります。このため、Optimization Toolbox のライセンスがある場合は、コストを考慮するカイ二乗検定を代わりに実行することを検討してください。詳細については、
CostTest
およびコストを考慮する検定を参照してください。
代替機能
真のクラス ラベルのセットを予測するときに 2 つのクラス ラベルのセットについて精度を直接比較するには、testcholdout
を使用します。
参照
[1] Agresti, A. Categorical Data Analysis, 2nd Ed. John Wiley & Sons, Inc.: Hoboken, NJ, 2002.
[2] Fagerlan, M.W., S. Lydersen, and P. Laake. “The McNemar Test for Binary Matched-Pairs Data: Mid-p and Asymptotic Are Better Than Exact Conditional.” BMC Medical Research Methodology. Vol. 13, 2013, pp. 1–8.
[3] Lancaster, H.O. “Significance Tests in Discrete Distributions.” JASA, Vol. 56, Number 294, 1961, pp. 223–234.
[4] McNemar, Q. “Note on the Sampling Error of the Difference Between Correlated Proportions or Percentages.” Psychometrika, Vol. 12, Number 2, 1947, pp. 153–157.
[5] Mosteller, F. “Some Statistical Problems in Measuring the Subjective Response to Drugs.” Biometrics, Vol. 8, Number 3, 1952, pp. 220–226.
拡張機能
バージョン履歴
R2015a で導入