Main Content

コックス比例ハザード モデル

はじめに

コックス比例ハザード回帰は、生存率の推定値を調整して予測子変数の影響を定量化するためのセミパラメトリック法です。この手法は、説明変数の影響を一般的なベースライン ハザード関数 h0(t) の乗数として表します。ハザード関数はコックス比例ハザード回帰関数のノンパラメトリック部分ですが、予測子変数の影響は対数線形回帰です。0 に対するベースラインの場合、このモデルは次に対応します。

h(Xi,t)=h0(t)exp[j=1pxijbj],

ここで、Xi=(xi1,xi2,,xip) は i 番目の被験者についての予測子変数、h(Xi,t) は時間 t における Xi についてのハザード率、h0(t) はベースライン ハザード率関数です。

コックス比例ハザード モデルをデータに当てはめるには、関数 coxphfit または関数 fitcox を使用します。fitcox の方が新しい関数であり、モデルに関する詳細な情報を含む CoxModel オブジェクトを返します。fitcox の使用例については、コックス比例ハザード モデル オブジェクトを参照してください。

ハザード率

コックス比例ハザード モデルは、値が Xi のときの個体またはアイテムのハザード率をベースライン値のときの個体またはアイテムのハザード率に関連付けます。このモデルは、次のようにハザード率の推定値を生成します。

HR(Xi)=h(Xi,t)h0(t)=exp[j=1pxijbj].

このモデルは、ベースライン ハザード関数が時間 t に依存しているが、予測子変数は時間に依存していないという仮定に基づいています。この仮定は比例ハザードの仮定とも呼ばれ、個体に対するハザード率が時間が経過しても変化しないことを示します。

ハザード率は、予測子変数値 Xi をもつ個体またはアイテムの瞬時故障の相対リスクを、ベースライン値をもつ個体またはアイテムと比較して表します。たとえば、予測子変数が喫煙ステータスであり、非喫煙がベースライン カテゴリである場合、ハザード率は、ベースライン カテゴリ (非喫煙者) と比較した喫煙者の相対的な瞬時故障率を示します。X* に対するベースラインと予測子変数値 Xi の場合、ハザード率は次のようになります。

HR(Xi)=h(Xi,t)h(X*,t)=exp[j=1p(xijxj*)bj].

たとえば、ベースラインが予測子変数の平均値 (mean(X)) である場合、ハザード率は次のようになります。

HR(Xi)=h(Xi,t)h(X¯,t)=exp[j=1p(xijx¯j)bj].

ハザード率は生存率に関連しており、説明変数の値が Xi である個体の時刻 t における生存率は次のようになります。

SXi(t)=S0(t)HR(Xi),

ここで S0(t) は、ベースライン ハザード率関数 h0(t) を含む生存時間関数で、HR(Xi) は、ベースライン値に相対的な予測子変数値 Xi のハザード率です。

コックス比例ハザード モデルの拡張

比例ハザード (PH) の仮定を満たさない変数がある場合、層化コックス モデルおよび時間に依存する変数があるコックス モデルという 2 つのコックス比例ハザード モデルの拡張を使用することを検討できます。

PH の仮定を満たさない変数がカテゴリ化可能である場合は、層化コックス モデルを使用します。

hs(Xi,t)=h0s(t)exp[j=1pxijbj],

ここで、添字 s は s 番目の階層を示します。層化コックス モデルでは、ベースライン ハザード率関数が各階層で異なりますが、係数は共有されます。したがって、予測子変数の値が同じである場合、すべての階層でハザード率が同じになります。名前と値のペア 'Strata' を使用すると、階層化変数を coxphfit に含めることができます。コックス モデル オブジェクトでの層化コックス モデルの使用例については、コックス比例ハザード モデル オブジェクトを参照してください。

PH の仮定を満たさない変数が時間に依存する変数である場合は、時間に依存する変数があるコックス モデルを使用します。

h(Xi,t)=h0(t)exp[j=1p1xijbj+k=1p2xik(t)ck],

ここで、xij は時間に依存しない予測子の要素、xik(t) は時間に依存する予測子の要素です。時間に依存する変数を coxphfit に含める方法の例については、共変量が時間に依存するコックス比例ハザード モデルを参照してください。

部分尤度関数

各注釈変数の影響の推定値、つまり、各注釈変数の影響の推定ハザード率は、他のすべての変数が一定であることを前提にすると、exp(b) となります。ここで b はその変数の係数推定値です。係数推定値は、モデルの部分尤度関数を最大化することにより得られます。比例ハザード回帰モデルの部分尤度関数は、イベントの観測順序に基づきます。これは、各故障時間について推定された故障の部分尤度の積です。n 個の異なる故障時間に n 回の故障があり、t1<t2<<tn である場合、部分尤度は次のようになります。

L=HR(X1)j=1nHR(Xj)×HR(X2)j=2nHR(Xj)××HR(Xn)HR(Xn)=i=1nHR(Xi)j=inHR(Xj).

リスク集合 Ri を使用すると、部分尤度を次のように書き直すことができます。

L=i=1nHR(Xi)jRiHR(Xj),

ここで Ri は、調査対象の被験者の中で i 番目の故障時間までイベントを経験しない被験者のインデックス集合です。

尤度比検定を使用すると、モデルへの項の追加の有意性を評価できます。1 つ目のモデルに p 予測子変数があり、2 つ目のモデルに p + r 予測子変数がある 2 つのモデルについて考えてみます。この場合、2 つのモデルを比較すると、–2*(L1/L2) には自由度 r (検定されている項の数) をもつカイ二乗分布が含まれます。

同時発生イベントの部分尤度関数

同時発生イベントがある場合、coxphfit は厳密な部分尤度を計算する代わりに、Breslow (既定) または Efron の方法を使用してモデルの部分尤度を近似します。厳密な部分尤度の計算では、同時発生イベント時間についてのリスク集合の順列全体が含まれるので、大量の計算が必要です。

最もシンプルな近似法は、Breslow の方法です。この方法では、各同時発生集合について同じ分母を使用します。

L=i=1djDiHR(Xj)kRiHR(Xk),

ここで、d は異なるイベント時間の個数、Di はイベント時間が i 番目のイベント時間に等しいすべての被験者のインデックス集合です。

Efron の方法は Breslow の方法より正確ですが、シンプルです。この方法では、同時発生イベントの分母を次のように調整します。

L=i=1djDiHR(Xj)kRiHR(Xk)j1dikDiHR(Xk),

ここで、di は Di 内のインデックスの個数です。

例として、はじめの 2 つのイベントが同時発生、つまり t1 = t2 および t2<t3<<tn であるとします。Breslow の方法では、はじめの 2 つの項の分母は同じです。

L=HR(X1)j=1nHR(Xj)×HR(X2)j=1nHR(Xj)×HR(X3)j=3nHR(Xj)×HR(X4)j=4nHR(Xj)××HR(Xn)HR(Xn).

Efron の方法では、2 番目の項の分母を調整します。

L=HR(X1)j=1nHR(Xj)×HR(X2)0.5HR(X1)+0.5HR(X2)+j=3nHR(Xj)×HR(X3)j=3nHR(Xj)×HR(X4)j=4nHR(Xj)××HR(Xn,tn)HR(Xn,tn).

近似法は、coxphfit の名前と値のペア 'Ties' を使用して指定できます。

観測値の頻度または重み

コックス比例ハザード モデルには、観測値の頻度または重みを組み入れることができます。wi が i 番目の観測値の重みであるとします。すると、重みがあるコックス モデルの部分尤度は次のようになります。

  • 重みがある部分尤度

    L=i=1nHRw(Xi)jRiwjHR(Xj),

    ここで

    HRw(Xi)=exp[j=1pwjxijbj].

  • 重みがある部分尤度と Breslow の方法

    L=i=1djDiHRw(Xj)[kRiwkHR(Xk)]1dijDiwj

  • 重みがある部分尤度と Efron の方法

    L=i=1djDiHRw(Xj)[kRiwkHR(Xk)j1dikDiwkHR(Xk)]1dijDiwj

観測値の頻度または重みは、coxphfit の名前と値のペア 'Frequency' を使用して指定できます。

参照

[1] Cox, D. R., and D. Oakes. Analysis of Survival Data. London: Chapman & Hall, 1984.

[2] Lawless, J. F. Statistical Models and Methods for Lifetime Data. Hoboken, NJ: Wiley-Interscience, 2002.

[3] Kleinbaum, D. G., and M. Klein. Survival Analysis. Statistics for Biology and Health. 2nd edition. Springer, 2005.

[4] Klein, J. P., and M. L. Moeschberger. Survival Analysis. Statistics for Biology and Health. 2nd edition. Springer, 2003.

参考

| |

関連する例

詳細