Main Content

stepwise

対話形式のステップワイズ回帰

構文

stepwise
stepwise(X,y)
stepwise(X,y,inmodel,penter,premove)

説明

stepwisehald.mat の標本データを使用し、ingredients の予測項に関する heat の応答値のステップワイズ回帰を実行するための、グラフィカル ユーザー インターフェイスを表示します。

Graphical user interface for stepwise regression.

インターフェイスの左上は、90% (色付き) および 95% (グレー) 信頼区間を示す水平のバーで、すべての追加可能項の係数の推定を表示します。赤い色は、最初はこれらの項がモデルにないことを示します。表に表示された値は、項がモデルに追加された場合の結果です。

インターフェイスの中央は、モデル全体の要約統計量を表示します。これらの統計量は、各ステップで更新されます。

インターフェイスの下部にある [モデル履歴] は、モデルの RMSE を表示します。このプロットは、RMSE をステップごとに追跡するので、異なるモデルの最適性を比較できます。履歴の青いドットから、ある特定のステップにおいてどの項がモデルにあったかを見ます。履歴の青いドットをクリックして、そのステップにおけるモデルの項を初期状態にもつインターフェイスのコピーを開きます。

F 統計量の p 値に対する開始/終了許容値と同様に、初期のモデルは stepwise への追加の入力引数を使って指定されます。既定の設定は、開始許容誤差が 0.05 で終了許容値が 0.10 である、項をもたない初期のモデルです。

基になっている最小二乗問題の条件付けを良くするために、入力データをセンタリングしてスケーリングする (z スコアを計算) ために、[ステップワイズ] メニューから [スケール入力] を選択します。

次の 2 つの方法のいずれかのステップ回帰で開始します。

  1. [次のステップ] をクリックして、推奨の次のステップを選択します。推奨の次のステップは、最も有意な項を追加するか、または最も有意でない項を削除します。回帰が RMSE の局所的最小値に到達した場合、次のステップとして推奨されるのは "項を移動しない" です。[すべてのステップ] をクリックすると、すべての推奨されるステップを実行できます。

  2. プロットまたは表内の線をクリックして、対応する項の状態を切り替えます。モデルに現在ない項に相当する赤い直線をクリックすると、モデルに項を追加し、直線を青に変えます。モデルに現在ある項に相当する青い線をクリックすると、この項がモデルから削除され、赤い線に変わります。

addedvarplot を呼び出し、stepwise インターフェイスから追加変数プロットを作成するには、[ステップワイズ] メニューから [追加された変数プロット] を選択します。項のリストが表示されます。追加したい項を選択し、[OK] をクリックします。

[エクスポート] をクリックするとダイアログ ボックスが表示され、インターフェイスから情報を選択して、MATLAB® ワークスペースに保存できます。エクスポートしたい情報をチェックし、オプションで、作成されるワークスペース変数の名前を変更します。[OK] をクリックして、情報をエクスポートします。

stepwise(X,y) は n 行 p 列の行列 X の p 予測項と n 行 1 列のベクトル y の応答値を使用して、インターフェイスを表示します。X の各列には異なる予測項を入れる必要があります。

メモ

stepwise は自動的に定数項をすべてのモデルに含めます。X に数値 1 だけを続けた列を直接入力しないでください。

stepwise は、X または yNaN 値を欠損値として認識し、無視します。

stepwise(X,y,inmodel,penter,premove) では、初期モデル (inmodel) と、F 統計量の p 値に対する開始許容誤差 (penter) および終了許容誤差 (premove) も指定します。inmodel は、長さが X の列数に等しい logical ベクトル、または値の範囲が 1 から X の列数までになっているインデックスのベクトルです。penter の値は、premove の値以下でなければなりません。

アルゴリズム

"ステップワイズ回帰" は、回帰における各項の統計的な重要性に基づき、多重線形モデルに項を追加したり削除するための体系的な方法です。この方法は、初期モデルを考え、次に、徐々に説明能力が、より大きいまたはより小さいモデルを比較していきます。各手順で、追加可能項がある場合とない場合のモデルを検定するために、F 統計量の p 値が計算されます。ある項が現在はモデルにない場合、帰無仮説は、項がモデルに追加された場合に係数ゼロをもつということです。帰無仮説を棄却する十分な証拠があれば、その項がモデルに追加されます。逆に、ある項がモデルに現在ある場合、帰無仮説は、その項が係数ゼロをもつことです。帰無仮説を棄却する十分な証拠がなければ、その項がモデルから削除されます。この方法は、以下のように進めます。

  1. 初期モデルを当てはめます。

  2. モデルにない任意の項が開始許容誤差よりも小さい p 値をもつ場合 (すなわち、モデルに加えられた場合にゼロ係数をもつ可能性がない場合)、最小の p 値をもつ項を追加し、この手順を繰り返します。それ以外の場合、手順 3 に進みます。

  3. モデルの任意の項が、終了許容誤差よりも大きい p 値をもつ場合は (すなわち、係数ゼロをもつという仮説は棄却されない場合は)、最大の p 値をもつ項を除外して手順 2 に進みます。それ以外の場合は終了します。

この方法では、初期モデルに含まれる項と、項が出入りする順序に依存して、追加可能項の同じ集合から異なるモデルが作成されることがあります。この方法は、1 つのステップがモデルを改良することがないと終了します。しかし、初期モデルが異なる場合またはステップの順序が異なる場合に、より良い近似にならないという保証はありません。この意味において、ステップワイズ モデルは、局所的には最適でも大域的には最適ではないことがあります。

バージョン履歴

R2006a より前に導入