最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。
Statistics and Machine Learning Toolbox™ には、2 種類の追加データ型が用意されています。順序付きおよび順序付けられていない離散的な非数値データを処理するには、nominal
および ordinal
データ型を使用します。異なるデータ型が含まれている複数の変数を単一のオブジェクトに格納するには、dataset
配列データ型を使用します。ただし、これらは Statistics and Machine Learning Toolbox に特有なデータ型です。製品間の互換性を向上させるには、MATLAB® に用意されている categorical
データ型または table
データ型をそれぞれ使用します。詳細については、categorical 配列の作成またはテーブルの作成と操作を参照するか、Tables and Categorical Arrays をご覧ください。
dataset | (非推奨) 統計データの配列 |
ノミナル配列と順序配列には、有限個の離散レベルをもつデータが格納されます。これには、自然な順序がある場合もない場合もあります。
カテゴリ レベルを容易に操作し、統計解析を実行し、メモリ要件を軽減します。
グループ化変数は観測値のグループ化または分類に使用されるユーティリティ変数です。
ダミー変数により、分類および回帰分析でカテゴリカル データを使用できます。
ノミナル配列および順序配列をサポートするその他の MATLAB 関数
ノミナル配列と順序配列をサポートする MATLAB 関数について学ぶ。
関数 nominal
および ordinal
を使用して、ノミナル配列と順序配列をそれぞれ作成する。
ordinal
を使用して、数値データを分類し categorical 順序配列に格納する。
setlabels
を使用して、ノミナル配列内または順序配列内のカテゴリ レベルのラベルを変更する。
ノミナル配列または順序配列に対してデータを追加および削除します。
mergelevels
を使用して、ノミナル配列内および順序配列内のカテゴリをマージします。
reorderlevels
を使用して、ノミナル配列内または順序配列内のカテゴリ レベルを並べ替える。
順序配列の並べ替え順序を決定します。
カテゴリカル変数のレベル別にデータをプロットします。
カテゴリカル変数のレベル別に要約統計を計算します。
t 検定、2 因子 ANOVA (分散分析)、ANOCOVA (共分散分析) を使用してカテゴリ (グループ) の平均値間の有意差を検定します。
カテゴリまたはグループによるデータのインデックス付けと検索を行います。
categorical 配列と fitlm
を使用してカテゴリカル共変量による回帰を実行します。
データセット配列には種類が異なる型のデータが混在して格納されます。
MATLAB ワークスペースにある数値配列または異種混合の変数からデータセット配列を作成します。
タブ区切りまたはコンマ区切りテキストのコンテンツ、つまり Excel ファイルからデータセット配列を作成します。
データセット配列の観測値を追加および削除します。
データセット配列の変数を追加および削除します。
データセット配列変数とそのデータを操作します。
データセット配列から 1 つの観測値または観測値のサブセットを選択します。
コマンド ラインを使用してデータセット配列の観測値 (行) を並べ替えます。
join
を使用してデータセット配列をマージします。
stack
と unstack
を使用してデータセット配列を再構築します。
データセット配列の観測値の中で欠損データがあるものを検索、整理および削除します。
グループ化変数による平均計算や要約など、データセット配列に対して計算を実行します。
データセット配列を MATLAB ワークスペースからテキスト ファイルまたはスプレッドシート ファイルにエクスポートします。
MATLAB 変数エディターにはデータセット配列の表示、変更、プロットに便利なインターフェイスがあります。
データセット配列のインデックス処理を行う多数の方法を学びます。
次の例では、データセット配列を使用して線形およびステップワイズ回帰解析を行う方法を示します。