Main Content

カテゴリ レベルのマージ

メモ

nominal 配列データ型および ordinal 配列データ型は推奨されません。順序付きおよび順序付けのない離散非数値データを表すには、代わりにcategorical 配列データ型を使用します。

カテゴリ レベルのマージ

この例では、mergelevels を使用してノミナル配列内または順序配列内のカテゴリをマージする方法を示します。この方法は、観測数が少ないカテゴリをまとめる場合に便利です。

標本データを読み込みます。

load carsmall

ノミナル配列を作成します。

変数 Origin は 100 台の標本の自動車の生産国が格納されている文字配列です。Origin をノミナル配列に変換します。

Origin = nominal(Origin);
getlevels(Origin)
ans = 1x6 nominal
     France      Germany      Italy      Japan      Sweden      USA 

データ内には生産国の一意の値が 6 つあります。

カテゴリ カウントを表にします。

ノミナル配列の要素を調査します。

tabulate(Origin)
    Value    Count   Percent
   France        4      4.00%
  Germany        9      9.00%
    Italy        1      1.00%
    Japan       15     15.00%
   Sweden        2      2.00%
      USA       69     69.00%

ヨーロッパ諸国の観測数は比較的少なくなっています。

カテゴリをマージします。

カテゴリ FranceGermanyItalySweden をマージして、Europe という 1 つのカテゴリを生成します。

Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},...
                     'Europe');
getlevels(Origin)
ans = 1x3 nominal
     Europe      Japan      USA 

変数 Origin のカテゴリ レベルはこれで 3 つだけになりました。

カテゴリ カウントを表にします。

マージされたカテゴリの要素を調査します。

tabulate(Origin)
   Value    Count   Percent
  Europe       16     16.00%
   Japan       15     15.00%
     USA       69     69.00%

カテゴリ Europe には観測数の 16% があります。マージ前はこれらの観測は 4 か国に分散していました。

参考

|

関連する例

詳細