適合度の評価
適合度を評価する方法
1 つ以上のモデルでデータに当てはめた後、適合度を評価する必要があります。最初の手順として、曲線フィッター アプリで表示した近似曲線を視覚的に検証します。さらに、提供されている以下の方法により、線形と非線形の両方のパラメトリック近似について適合度を評価します。
統計分野の一般的な文献と同様に、ここでは "適合度" を複数の意味で使用しており、"適切な近似" は次のようなモデルを意味します。
最小二乗近似を仮定して、データを適切に導出可能
ほとんど不確定性なくモデル係数を推定可能
データの大部分の変動性を説明でき、高い確度で新しい観測値を予測可能
特別な用途では、解釈が容易な簡単なモデルであることなど、適切な近似の実現にとって重要となる他の特徴がモデル近似に求められる場合があります。ここで説明する方法は、これらのどのような意味の場合でも適合度の決定に役立ちます。
これらの方法は、グラフィカルな方法と数値的な方法の 2 つのタイプに分類できます。残差や予測限界のプロットはグラフィカルな方法であり、視覚的な解釈に役立ちます。一方、適合度の統計量や係数の信頼限界の計算は数値的な方法であり、統計量的な推論に役立ちます。
一般に、グラフィカルな方法ではデータセット全体を一度に表示でき、モデルとデータの関係を広い範囲で簡単に表示できるため、グラフィカルな方法は数値的な方法よりもメリットがあります。数値的な方法では、データの特定の特徴に絞って注目し、通常はその情報を単一の数字で要約することを試みます。実際には、データと解析要件に応じて、両方のタイプを使用して最適な近似を決定する必要がある場合があります。
これらの方法に基づく場合、どの近似もデータに対して適切であるとは見なせない可能性があることに注意してください。このようなときは、別のモデルを選択することが必要になる場合があります。また、適合度によるすべての方法が、特定の近似が適切であることを示す可能性があります。ただし、物理的意味のある近似係数の抽出が目的であるのに、モデルがデータの物理特性を反映していない場合は、結果として得られた係数は役に立ちません。この場合、データが何を表すか、データがどのように測定されたかについて理解することが、適合度の評価と同様に重要です。
適合度の統計量
グラフィカルな方法を使用して適合度を評価した後で、適合度の統計量を調べる必要があります。Curve Fitting Toolbox™ ソフトウェアは、パラメトリック モデルについて以下の適合度の統計量をサポートしています。
誤差の二乗和 (SSE)
決定係数
誤差自由度 (DFE)
自由度調整済み決定係数
平方根平均二乗誤差 (RMSE)
現在の近似について、曲線フィッター アプリの [結果] ペインにこれらの統計量が表示されます。現在の曲線近似セッションにあるすべての近似について、[近似テーブル] ペインで適合度の統計量を比較できます。
適合度の統計量をコマンド ラインで検証するには、以下のいずれかを行います。
曲線フィッター アプリで、近似と適合度をワークスペースにエクスポートする。[曲線フィッター] タブの [エクスポート] セクションで [エクスポート] をクリックし、[ワークスペースにエクスポート] を選択します。
関数
fit
を使用してgof
出力引数を指定します。
誤差の二乗和
この統計量は応答値の近似からの応答値の総偏差を測定します。残差平方和とも呼ばれ、通常 SSE と略記されます。
値が 0 に近いほど、モデルの確率的誤差成分が小さく、近似が予測に有効であることを示します。
決定係数
この統計量は、近似がデータの変動をどの程度適切に説明できるかを測定します。言い換えると、決定係数は応答値と予測された応答値の間の相関を二乗したものです。重相関係数の二乗および多重決定係数とも呼ばれます。
決定係数は回帰の二乗和 (SSR) と総二乗和 (SST) の比として定義されます。SSR は次のように定義されます。
SST は平均についての二乗和とも呼ばれ、次のように定義されます。
ここで、SST = SSR + SSE です。これらの定義から、決定係数は次のように表されます。
決定係数は 0 と 1 の間の任意の値を取り、値が 1 に近いほど、そのモデルによって分散の大部分が説明できることを示します。たとえば、決定係数の値が 0.8234 の場合、平均に関してデータの全変動の 82.34% を近似が説明できることを示しています。
モデルの近似係数の数を増やすと決定係数は増加しますが、実際には近似が改善されない場合があります。この状況を回避するには、次に説明する自由度調整済み決定係数を使用する必要があります。
定数項を含まない方程式の場合、決定係数が負になる可能性があることに注意してください。決定係数は近似によって説明される分散の割合として定義されるため、近似が実際には単なる水平線での近似より悪い場合、決定係数は負になります。この場合、決定係数は相関の二乗として解釈できません。この状況は、定数項をモデルに追加する必要があることを示しています。
自由度調整済み決定係数
この統計量は、上で定義した決定係数の統計量を残差自由度に基づいて調整したものです。残差自由度は、応答値の数 n から、応答値から推定される近似係数の数 m を差し引いた数として定義されます。
v = n – m
v は、二乗和の計算に必要な n 個のデータ点が関係する情報のうち独立な情報の数を示しています。パラメーターが有界であり、1 つ以上の推定値がその境界上にある場合、それらの推定値は固定されていると見なされることに注意してください。自由度は、そのようなパラメーターの数だけ増加します。
一般に、自由度調整済み決定係数の統計量は "入れ子" になっている 2 つのモデル (つまり、前のモデルに係数を追加した一連のモデル) を比較するとき、近似品質の最も優れた指標になります。
自由度調整済み決定係数の統計量は 1 以下の任意の値を取り、値が 1 に近いほど近似が適切であることを示します。応答の予測に寄与しない項がモデルに含まれていると、負の値になる場合があります。
平方根平均二乗誤差
この統計量は、近似標準誤差および回帰の標準誤差とも呼ばれます。これはデータに含まれるランダムな成分の標準偏差の推定値であり、次のように定義されます。
ここで、MSE は平均二乗誤差または残差平均二乗です。
SSE と同様に、MSE の値が 0 に近いほど、近似が予測に有効であることを示します。