Main Content

ノミナル配列と順序配列を使用する利点

メモ

nominal 配列データ型および ordinal 配列データ型は推奨されません。順序付きおよび順序付けのない離散非数値データを表すには、代わりにcategorical 配列データ型を使用します。

カテゴリ レベルの操作

カテゴリカル変数とそのレベルを操作する場合に必要となる一般的な操作があります。次の表は、カテゴリ レベルを操作するためにノミナル配列または順序配列で使用できる関数の一覧です。この他の関数については、コマンド ラインで「methods nominal」または「methods ordinal」と入力するか、nominal および ordinal のリファレンス ページを参照してください。

タスク関数
新しいカテゴリ レベルの追加 addlevels
カテゴリ レベルの削除droplevels
カテゴリ レベルの結合mergelevels
カテゴリ レベルでの並べ替えreorderlevels
各カテゴリの観測数のカウントlevelcounts
カテゴリ レベルのラベルまたは名前の変更setlabels
交互作用因子の作成times
定義済みカテゴリに該当しない観測値の探索isundefined

ノミナル配列と順序配列を使用した分析

ノミナル配列と順序配列は、さまざまな統計分析で使用できます。たとえば、カテゴリ レベル別にデータの記述統計を計算したり、カテゴリ平均の間の差分に関する統計的検定を実行したり、カテゴリカル予測子による回帰解析を実行することができます。

グループ化変数を入力引数として受け入れる Statistics and Machine Learning Toolbox™ 関数は、ノミナル配列と順序配列を受け入れます。この中には、次の説明的な関数などが含まれます。

また、ノミナル配列と順序配列は、モデルに基づいて次のような分析関数およびメソッドに対する入力引数として使用することもできます。

ノミナル配列または順序配列をこれらの関数で予測子として使用すると、近似関数が自動的にカテゴリカル予測子を認識し、分析用の適切なダミー指標変数を作成します。また、dummyvar を使用して独自のダミー指標変数を作成することもできます。

メモリ要件の軽減

カテゴリカル変数のレベルはテキストとして定義されることが多く、その場合文字ベクトルの cell 配列や char 配列で格納や操作を行うには多大なコストがかかる可能性があります。ノミナル配列と順序配列ではカテゴリのメンバーシップとラベルが別々に格納されるので、変数の格納に必要なメモリが大幅に削減されます。

例として、標本データを読み込んでみましょう。

load('fisheriris')
変数 species は文字ベクトルの cell 配列で、メモリが 19,300 バイト必要です。

species をノミナル配列に変換します。

species = nominal(species);

変数の格納に必要なメモリは 95% 減少しています。

参考

|

関連する例

詳細