Main Content

dataset クラス

(非推奨) 統計データの配列

dataset データ型は推奨されません。異種混合データを処理するには、代わりに MATLAB® table データ型を使用します。詳細は、MATLAB table ドキュメンテーションを参照してください。

説明

データセット配列は、変数名や観測名などを含む異種混合データやメタデータを集めて 1 つのコンテナー変数にまとめるときに使用します。データセット配列は、一般にテキスト ファイルやスプレッドシートの列として格納される列や表にまとめたデータの格納に便利です。また、さまざまなデータ型、サイズ、単位などをもつ変数を扱うことができます。

データセット配列には、数値、logical、文字、string、categorical、cell などのさまざまな種類の変数を含めることができます。ただし、データセット配列のクラスは、含んでいる変数のクラスとは異なります。たとえば、double 配列の変数のみを含むデータセット配列でも、それ自体を double 配列であるかのように処理することはできません。ただし、ドット添字を使うと、データセット配列内の変数をワークスペース変数のように処理できます。

データセット配列の添字表現には、通常の数値配列の場合と同様に、かっこを使用できますが、数値型と論理型のインデックスに加えて変数名と観測名もインデックスとして使用できます。

構築

MATLAB ワークスペースにある変数からデータセット配列を作成するには、dataset コンストラクターを使用します。テキスト ファイルやスプレッドシート ファイルからデータを読み取ってデータセット配列を作成することもできます。データセット配列内の変数には、ドット添字を使ってアクセスできます。構造体のフィールドにアクセスする場合と同じです。データセット配列に適用できる操作のリストは、以下の節を参照してください。

dataset(非推奨) データセット配列の作成

メソッド

cat(非推奨) データセット配列の連結
cellstr(非推奨) データセット配列から文字ベクトルの cell 配列を作成
dataset2cell(非推奨) データセット配列の cell 配列への変換
dataset2struct(非推奨) データセット配列の構造体への変換
datasetfun(非推奨) データセット配列変数への関数の適用
disp(非推奨) データセット配列の表示
display(非推奨) データセット配列の表示
double(非推奨) データセット変数を double 配列に変換
end(非推奨) データセット配列のインデックス式における最後のインデックス
export(非推奨) データセット配列のファイルへの書き込み
get(非推奨) データセット配列プロパティにアクセス
horzcat(非推奨) データセット配列の水平連結
intersect(非推奨) データセット配列の観測の共通集合
isempty(非推奨) 空のデータセット配列の場合 true
ismember(非推奨) 集合内のメンバーであるデータセット配列要素
ismissing(非推奨) 欠損値のあるデータセット配列要素の検出
join(非推奨) データ セット配列の観測値のマージ
length(非推奨) データセット配列の長さ
ndims(非推奨) データセット配列の次元数
numel(非推奨) データセット配列の要素数
replaceWithMissing(非推奨) データセット配列への欠損データのインジケーターの挿入
replacedata(非推奨) データセット変数の置き換え
set(非推奨) データ セット配列のプロパティの設定と表示
setdiff(非推奨) データセット配列の観測の差集合
setxor(非推奨) データセット配列の観測の排他的論理和集合
single(非推奨) データセット変数を single 配列に変換
size(非推奨) データセット配列のサイズ
sortrows(非推奨) データセット配列の行の並べ替え
stack(非推奨) 複数変数のデータ セット配列を単一変数に連結
subsasgn(非推奨) データセット配列への添字付き代入
subsref(非推奨) データセット配列の添字付き参照
summary(非推奨) データセット配列のまとめの表示
union(非推奨) データセット配列の観測の和集合
unique(非推奨) データセット配列の一意の観測値
unstack(非推奨) 単一変数からデータ セット配列を取り出して複数変数に入れる
vertcat(非推奨) データセット配列の垂直連結

プロパティ

データセット配列 D にはメタデータ (データに関する情報) を格納するプロパティがあります。プロパティへのアクセスや代入には、P = D.Properties.PropName または D.Properties.PropName = P を使用します。ここで、PropName は次のいずれかです。

Description

Description は、データセット配列を説明する文字ベクトルです。既定値は空の文字ベクトルです。

DimNames

データセット配列の 2 つの次元に付ける名前の文字ベクトルが含まれている 2 要素の cell 配列です。既定の設定は {'Observations' 'Variables'} です。

ObsNames

データセット配列内の観測値の名前を与える、空でない相違する文字ベクトルの cell 配列です。このプロパティは空の場合もありますが、空でない場合は文字ベクトルの個数が観測値の個数と等しくなければなりません。

Units

データセット配列における変数の単位を与える文字ベクトルの cell 配列です。このプロパティは空の場合もありますが、空でない場合は文字ベクトルの個数が変数の個数と等しくなければなりません。単位が定義されていない変数については、個別の文字ベクトルを空にすることができます。既定値は空の cell 配列です。

UserData

データセット配列に関連付けられる追加情報を格納する任意の変数です。既定値は空の配列です。

VarDescription

データセット配列における変数の説明を与える文字ベクトルの cell 配列です。このプロパティは空の場合もありますが、空でない場合は文字ベクトルの個数が変数の個数と等しくなければなりません。説明が定義されていない変数については、個別の文字ベクトルを空にすることができます。既定値は空の cell 配列です。

VarNames

データセット配列内の変数の名前を与える、空でない相違する文字ベクトルの cell 配列です。文字ベクトルの個数は変数の個数と等しくなければなりません。既定の設定は、データセットの作成に使用される変数の名前の cell 配列です。

コピーのセマンティクス

値。これがクラスの使用に与える影響については、『MATLAB オブジェクト指向プログラミング』ドキュメンテーションのハンドル クラスと値クラスの比較を参照してください。

.mat ファイルからデータセット配列を読み込んで単純なサブセットを作成します。

load hospital
h1 = hospital(1:10,:)
h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'})

% Access and modify metadata
hospital.Properties.Description
hospital.Properties.VarNames{4} = 'Wgt'

% Create a new dataset variable from an existing one
hospital.AtRisk = hospital.Smoker | (hospital.Age > 40)

% Use individual variables to explore the data
boxplot(hospital.Age,hospital.Sex)
h3 = hospital(hospital.Age<30,...
   {'LastName' 'Age' 'Sex' 'Smoker'})

% Sort the observations based on two variables
h4 = sortrows(hospital,{'Sex','Age'})