summary
クラス: dataset
(非推奨) データセット配列のまとめの表示
dataset
データ型は推奨されません。異種混合データを処理するには、代わりに MATLAB® table
データ型を使用します。詳細は、MATLAB table
ドキュメンテーションを参照してください。
構文
summary(A)
s = summary(A)
説明
summary(A)
は、データセット配列とそこに含まれる変数のまとめを表示します。
s = summary(A)
は、データセット A
のまとめと A
が含む変数を含む、スカラー構造体 s
を返します。s
のフィールドの詳細は、「出力」を参照してください。
まとめの情報はデータセットの変数のタイプにより変わります。
数値変数の場合、
summary
はデータのまとめの 5 つの数字、最小値、1 番目の四分位、中央値、3 番目の四分位、最大値を計算します。論理変数の場合、
summary
はデータ内のtrue
の数とfalse
の数をカウントします。カテゴリカル変数の場合、
summary
は各水準におけるデータ数をカウントします。
出力引数
次のリストは構造体 s
のフィールドを示しています。
Description
— データセットの説明を含む文字配列。Variables
— A 内の各データセット変数に対して 1 つずつ要素がある構造体配列。各要素には次のフィールドがあります。Name
— 変数名が含まれている文字ベクトル。Description
— 変数の説明が含まれている文字ベクトル。Units
— 変数の単位が含まれている文字ベクトル。Size
— 変数のサイズを含む数値ベクトルClass
— 変数のクラスが含まれている文字ベクトル。Data
— 以下のフィールドをもつスカラー構造体数値変数の場合:
Probabilities
— 確率 [0.0 .25 .50 .75 1.0] と NaN (対応するデータセット変数にあれば) を含む数値ベクトル。Quantiles
— データセット変数に対応する"確率"に対する値と NaN のカウント数 (ある場合) を含む数値ベクトル。
論理変数の場合:
Values
— logical ベクトル [true false]。Counts
— 各論理値のカウント数の数値ベクトル。
カテゴリカル変数の場合:
Levels
— 対応するデータセット変数の各水準のラベルを含む cell 配列。Counts
— 各水準のカウント数の数値ベクトル。
数値変数、カテゴリカル変数、論理変数のいずれでもない場合、
'Data'
は空になります。データセット変数が 2 列以上の場合、対応する'Quantiles'
フィールドまたは'Counts'
フィールドは行列または配列になります。
例
フィッシャーのアヤメのデータのまとめを表示します。
load fisheriris species = nominal(species); data = dataset(species,meas); summary(data) species: [150x1 nominal] setosa versicolor virginica 50 50 50 meas: [150x4 double] min 4.3000 2 1 0.1000 1st Q 5.1000 2.8000 1.6000 0.3000 median 5.8000 3 4.3500 1.3000 3rd Q 6.4000 3.3000 5.1000 1.8000 max 7.9000 4.4000 6.9000 2.5000
hospital.mat
のデータのまとめを表示します。
load hospital summary(hospital) Dataset array created from the data file hospital.dat. The first column of the file ("id") is used for observation names. Other columns ("sex" and "smoke") have been converted from their original coded values into categorical and logical variables. Two sets of columns ("sys" and "dia", "trial1" through "trial4") have been combined into single variables with multivariate observations. Column headers have been replaced with more descriptive variable names. Units have been added where appropriate. LastName: [100x1 cell array of character vectors] Sex: [100x1 nominal] Female Male 53 47 Age: [100x1 double, Units = Yrs] min 1st Q median 3rd Q max 25 32 39 44 50 Weight: [100x1 double, Units = Lbs] min 1st Q median 3rd Q max 111 130.5000 142.5000 180.5000 202 Smoker: [100x1 logical] true false 34 66 BloodPressure: [100x2 double, Units = mm Hg] Systolic/Diastolic min 109 68 1st Q 117.5000 77.5000 median 122 81.5000 3rd Q 127.5000 89 max 138 99 Trials: [100x1 cell, Units = Counts] From zero to four measurement trials performed