カテゴリ レベルのマージ
メモ
nominal
配列データ型および ordinal
配列データ型は推奨されません。順序付きおよび順序付けのない離散非数値データを表すには、代わりにcategorical 配列データ型を使用します。
カテゴリ レベルのマージ
この例では、mergelevels
を使用してノミナル配列内または順序配列内のカテゴリをマージする方法を示します。この方法は、観測数が少ないカテゴリをまとめる場合に便利です。
標本データを読み込みます。
load carsmall
ノミナル配列を作成します。
変数 Origin
は 100 台の標本の自動車の生産国が格納されている文字配列です。Origin
をノミナル配列に変換します。
Origin = nominal(Origin); getlevels(Origin)
ans = 1x6 nominal
France Germany Italy Japan Sweden USA
データ内には生産国の一意の値が 6 つあります。
カテゴリ カウントを表にします。
ノミナル配列の要素を調査します。
tabulate(Origin)
Value Count Percent France 4 4.00% Germany 9 9.00% Italy 1 1.00% Japan 15 15.00% Sweden 2 2.00% USA 69 69.00%
ヨーロッパ諸国の観測数は比較的少なくなっています。
カテゴリをマージします。
カテゴリ France
、Germany
、Italy
、Sweden
をマージして、Europe
という 1 つのカテゴリを生成します。
Origin = mergelevels(Origin,{'France','Germany','Italy','Sweden'},... 'Europe'); getlevels(Origin)
ans = 1x3 nominal
Europe Japan USA
変数 Origin
のカテゴリ レベルはこれで 3 つだけになりました。
カテゴリ カウントを表にします。
マージされたカテゴリの要素を調査します。
tabulate(Origin)
Value Count Percent Europe 16 16.00% Japan 15 15.00% USA 69 69.00%
カテゴリ Europe
には観測数の 16% があります。マージ前はこれらの観測は 4 か国に分散していました。