カテゴリ別の要約統計
メモ
nominal
配列データ型および ordinal
配列データ型は推奨されません。順序付きおよび順序付けのない離散非数値データを表すには、代わりにcategorical 配列データ型を使用します。
カテゴリ別の要約統計
この例では、カテゴリカル変数のレベル別に要約統計を計算する方法を示します。grpstats
を使用すると、数値配列またはデータセット配列のグループ単位の要約統計を計算できます。
標本データを読み込みます。
load hospital
データセット配列 hospital
には 7 つの変数 (列) と 100 件の観測 (行) があります。
カテゴリ別の要約統計を計算します。
変数 Sex
はノミナル配列で、Male
と Female
の 2 つのレベルがあります。性別ごとの体重の最小値と最大値を特定します。
stats = grpstats(hospital,'Sex',{'min','max'},'DataVars','Weight')
stats = Sex GroupCount min_Weight max_Weight Female Female 53 111 147 Male Male 47 158 202
データセット配列 stats
には、変数 Sex
の各レベルに対応する観測値が格納されています。変数 min_Weight
には各グループの体重の最小値が格納され、変数 max_Weight
には各グループの体重の最大値が格納されます。
複数のカテゴリを基準とした要約統計を計算します。
変数 Smoker
は logical 配列で、値 1
は喫煙者、値 0
は非喫煙者をそれぞれ表します。性別と喫煙の有無の組み合わせごとに体重の最小値と最大値を特定します。
stats = grpstats(hospital,{'Sex','Smoker'},{'min','max'},... 'DataVars','Weight')
stats = Sex Smoker GroupCount min_Weight max_Weight Female_0 Female false 40 111 147 Female_1 Female true 13 115 146 Male_0 Male false 26 158 194 Male_1 Male true 21 164 202
データセット配列 stats
には、元のデータの Sex
と Smoker
のレベルのそれぞれの組み合わせに対する観測値の行が格納されています。