因子分析

多変量データには測定された変数が多く含まれますが、中にはオーバーラップしている、つまりグループに従属する変数が存在する場合もあります。たとえば、十種競技ではそれぞれの選手が 10 種目を競いますが、競技によってはスピード競技と見なされたり、強さを競うと見なされることもあります。したがって、選手の 10 種目の得点は、3 ～ 4 種類の身体能力に関するやや小さいセットに大きく依存していると考えられます。

因子分析は、この種の相互依存だけを推定するために、多変量データにモデルを当てはめる方法です。因子分析モデルでは、測定された変数は、少数の観測されない (潜在している) 因子に依存します。各因子は複数の変数に対して共通に影響を与える可能性があるので、"共通因子" と呼ばれます。各変数は、共通因子の線形結合に依存すると仮定されます。また、係数は "負荷" と呼ばれます。測定された各変数には、独立したランダムな変動による成分も含まれます。これは、1 つの変数に固有であるという理由から、"独自因子の分散" として知られています。

特に、因子分析は、データの共分散行列が次の形であると想定します。

$\sum_{x} = Λ Λ^{Τ} + Ψ$

ここで Λ は、負荷の行列であり、対角行列 Ψ の要素は、独自因子の分散です。関数 factoran は、最尤を使用して因子分析モデルを近似します。

参考

factoran

トピック

因子分析の使用による株価の分析