Main Content

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

dataset クラス

(非推奨) 統計データの配列

dataset データ型は推奨されません。異種混合データを処理するには、代わりに MATLAB® table データ型を使用します。詳細は、MATLAB table ドキュメンテーションを参照してください。

説明

データセット配列は、変数名や観測名などを含む異種混合データやメタデータを集めて 1 つのコンテナー変数にまとめるときに使用します。データセット配列は、一般にテキスト ファイルやスプレッドシートの列として格納される列や表にまとめたデータの格納に便利です。また、さまざまなデータ型、サイズ、単位などをもつ変数を扱うことができます。

データセット配列には、数値、logical、文字、string、categorical、cell などのさまざまな種類の変数を含めることができます。ただし、データセット配列のクラスは、含んでいる変数のクラスとは異なります。たとえば、double 配列の変数のみを含むデータセット配列でも、それ自体を double 配列であるかのように処理することはできません。ただし、ドット添字を使うと、データセット配列内の変数をワークスペース変数のように処理できます。

データセット配列の添字表現には、通常の数値配列の場合と同様に、かっこを使用できますが、数値型と論理型のインデックスに加えて変数名と観測名もインデックスとして使用できます。

構築

MATLAB ワークスペースにある変数からデータセット配列を作成するには、dataset コンストラクターを使用します。テキスト ファイルやスプレッドシート ファイルからデータを読み取ってデータセット配列を作成することもできます。データセット配列内の変数には、ドット添字を使ってアクセスできます。構造体のフィールドにアクセスする場合と同じです。データセット配列に適用できる操作のリストは、以下の節を参照してください。

dataset(非推奨) データセット配列の作成

メソッド

cat(非推奨) データセット配列の連結
cellstr(非推奨) データセット配列から文字ベクトルの cell 配列を作成
dataset2cell(非推奨) データセット配列の cell 配列への変換
dataset2struct(非推奨) データセット配列の構造体への変換
datasetfun(非推奨) データセット配列変数への関数の適用
disp(非推奨) データセット配列の表示
display(非推奨) データセット配列の表示
double(非推奨) データセット変数を double 配列に変換
end(非推奨) データセット配列のインデックス式における最後のインデックス
export(非推奨) データセット配列のファイルへの書き込み
get(非推奨) データセット配列プロパティにアクセス
horzcat(非推奨) データセット配列の水平連結
intersect(非推奨) データセット配列の観測の共通集合
isempty(非推奨) 空のデータセット配列の場合 true
ismember(非推奨) 集合内のメンバーであるデータセット配列要素
ismissing(非推奨) 欠損値のあるデータセット配列要素の検出
join(非推奨) 観測のマージ
length(非推奨) データセット配列の長さ
ndims(非推奨) データセット配列の次元数
numel(非推奨) データセット配列の要素数
replaceWithMissing(非推奨) データセット配列への欠損データのインジケーターの挿入
replacedata(非推奨) データセット変数の置き換え
set(非推奨) プロパティの設定と表示
setdiff(非推奨) データセット配列の観測の差集合
setxor(非推奨) データセット配列の観測の排他的論理和集合
single(非推奨) データセット変数を single 配列に変換
size(非推奨) データセット配列のサイズ
sortrows(非推奨) データセット配列の行の並べ替え
stack(非推奨) 複数変数のデータを単一変数に連結
subsasgn(非推奨) データセット配列への添字付き代入
subsref(非推奨) データセット配列の添字付き参照
summary(非推奨) データセット配列のまとめの表示
union(非推奨) データセット配列の観測の和集合
unique(非推奨) データセット配列の一意の観測値
unstack(非推奨) 単一変数からデータを取り出して複数変数に入れる
vertcat(非推奨) データセット配列の垂直連結

プロパティ

データセット配列 D にはメタデータ (データに関する情報) を格納するプロパティがあります。プロパティへのアクセスや代入には、P = D.Properties.PropName または D.Properties.PropName = P を使用します。ここで、PropName は次のいずれかです。

Description(非推奨) データセットを説明する文字ベクトル
DimNames(非推奨) データセットの次元に付ける名前の文字ベクトルが含まれている 2 要素の cell 配列
ObsNames(非推奨) データセット内の観測値の名前を与える、空でない相違する文字ベクトルの cell 配列
Units(非推奨) データセットにおける変数の単位
UserData(非推奨) データセットに関連付けられる追加情報を格納する変数
VarDescription(非推奨) データセットにおける変数の説明を与える文字ベクトルの cell 配列
VarNames(非推奨) データセットにおける変数の名前を与える文字列の cell 配列

コピーのセマンティクス

値。これがクラスの使用に与える影響については、『MATLAB オブジェクト指向プログラミング』ドキュメンテーションのハンドル クラスと値クラスの比較を参照してください。

.mat ファイルからデータセット配列を読み込んで単純なサブセットを作成します。

load hospital
h1 = hospital(1:10,:)
h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'})

% Access and modify metadata
hospital.Properties.Description
hospital.Properties.VarNames{4} = 'Wgt'

% Create a new dataset variable from an existing one
hospital.AtRisk = hospital.Smoker | (hospital.Age > 40)

% Use individual variables to explore the data
boxplot(hospital.Age,hospital.Sex)
h3 = hospital(hospital.Age<30,...
   {'LastName' 'Age' 'Sex' 'Smoker'})

% Sort the observations based on two variables
h4 = sortrows(hospital,{'Sex','Age'})