変数エディターでのデータセット配列
メモ
dataset
データ型は推奨されません。異種混合データを処理するには、代わりに MATLAB® table
データ型を使用します。詳細は、MATLAB table
ドキュメンテーションを参照してください。
変数エディターでデータセット配列を開きます。
MATLAB 変数エディターにはデータセット配列の表示、変更、プロットに便利なインターフェイスがあります。
まず、標本データセット hospital
を読み込みます。
load hospital
hospital
が MATLAB ワークスペース内に作成されます。このデータセット配列には 100 件の観測値と 7 個の変数があります。
変数エディターで hospital
を開くには、[変数を開く] をクリックして、hospital
を選択します。
変数エディターが開き、データセット配列の内容が表示されます (ここでは最初の 10 件の観測のみが表示されます)。
変数エディターでは、最も上の行に 7 個の変数の名前が表示され、それより下の部分では最初の列に観測名が表示されます。
変数名と観測名の変更
変数名と観測名を変更するには、名前をダブルクリックしてから、新しいテキストを入力します。
変数エディターでの変更はすべてコマンド ラインにも送信されます。
データセットの 6 番目の変数 BloodPressure
は 2 つの列をもつ数値配列です。最初の列には収縮期血圧が表示され、2 番目の列には拡張期血圧が表示されます。変数名セルの右側に表示される矢印をクリックすると、変数の単位と説明が表示されます。単位フィールドや説明フィールドに直接入力して、テキストを変更することができます。変数のデータ型とサイズは変数の説明の下に表示されます。
変数の並べ替えと削除
変数エディターを使用すると、データセット配列の変数を並べ替えることができます。変数名セルの左端にマウスを移動し、十字矢印を表示します。
矢印が表示されたら、変数列をクリックして新しい場所にドラッグします。
変数を並べ替えるためのコマンドがコマンド ラインに表示されます。
変数エディターで変数を削除するには、変数列を選択して右クリックし、[列変数の削除] を選択します。
変数を削除するためのコマンドがコマンド ラインに表示されます。
新しいデータの追加
変数エディターで直接新しいデータの値を入力できます。たとえば、hospital
データセットに新しい患者の観測を追加できます。新しい姓を入力するには、変数 LastName
の末尾に文字ベクトルを追加します。
変数 Gender
は nominal
配列です。Gender
列でセルをダブルクリックすると、カテゴリカル変数のレベルがドロップダウン リストに表示されます。既に使用されているレベルから選択したり、[新規アイテム] を選択して新しいレベルを作成することもできます。
残りの変数のデータの追加を継続することもで可能です。
観測名を変更するには、観測名をクリックして新しい名前を入力します。
新しいデータを入力するためのコマンドがコマンド ラインに表示されます。
最初の代入の後で警告が表示されます。新しい観測行に最初のデータ (ここでは姓) を入力すると、他のすべての変数に既定値が代入されます。既定の代入は次のとおりです。
数値変数の場合:
0
カテゴリカル変数の場合:
<undefined>
cell 配列の場合:
[]
また、変数エディターを使用して、データセット配列のデータをコピーし、別のデータセット配列に貼り付けることもできます。
観測値の並べ替え
変数エディターでは、1 つまたは複数の変数の値でデータセット配列の観測値を並べ替えることができます。たとえば、性別で並べ替える場合、変数 Gender
を選択します。その後、[並べ替え] をクリックして、選択した変数の値の昇順または降順のどちらで行を並べ替えるかを選択します。
文字ベクトルまたはノミナル データ型の cell 配列の変数で並べ替えると、観測値はアルファベット順に並べ替えられます。順序変数の場合、行はレベルの順序に従って並べ替えられます。たとえば、hospital
の観測を Gender
の値で並べ替えると、まず女性 (female) がグループ化され、その後に男性 (male) がグループ化されます。
複数の変数の値で並べ替えるには、Ctrl キーを押しながら複数の変数を選択します。
変数エディターで行を並べ替える作業は、sortrows
を呼び出すことと同じです。並べ替えの実行後に、コマンド ラインでこのコマンドが表示されます。
データのサブセットの選択
変数エディターのデータセット配列でデータのサブセットを選択し、選択したデータから新しいデータセット配列を作成することができます。たとえば、変数 LastName
および Age
のみが格納されているデータセット配列を作成するには、次の手順を実行します。
Ctrl キーを押しながら、変数
LastName
およびAge
をクリックします。右クリックしてから [選択からワークスペース変数を新規作成] 、 [新規データセット配列] を選択します。
新しいデータセット配列が hospital1
という名前でワークスペース ウィンドウに表示されます。コマンド ウィンドウに、選択を実行するコマンドが表示されます。
同じ手順でデータのどのサブセットでも選択できます。何らかの論理条件に従って観測を選択するには、並べ替えと選択を組み合わせて使用します。たとえば、45 歳以上の男性患者の情報のみが格納されている新しいデータセット配列を作成するには、次の手順を実行します。
hospital
の観測を、Gender
とAge
の値の降順で並べ替えます。45 歳以上の男性の観測を選択します。
右クリックしてから [選択からワークスペース変数を新規作成] 、 [新規データセット配列] を選択します。新しいデータセット配列
hospital2
がワークスペース ウィンドウ内に作成されます。ワークスペース ウィンドウでデータセット配列の名前を変更できます。
プロットの作成
変数エディターでプロット オプションを使用してデータセット配列からデータをプロットすることができます。選択可能なプロットは、プロットする変数のデータ型によって異なります。
たとえば、変数 Age
を選択した場合、[プロット] タブに一変量の数値変数に適したプロット オプションが表示されます。
データ型によっては、複数の変数で使用できるプロット オプションが存在する場合があります。たとえば、Age
と Gender
を選択した場合、性別ごとの年齢の箱ひげ図を作成することができます。