ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

データの前処理

データ クリーニング、平滑化、グループ化

正確で効率的かつ意義のある解析を確実に行うには、データセットに前処理の手法が必要になる場合があります。データ クリーニングは、正しくないデータや欠落したデータを検索、削除、および置換する方法を指します。局所的極値や急激な変化を検出すると、重要なデータのトレンドを識別できます。平滑化およびトレンド除去は、スケーリングによってデータの境界を変更しながら、ノイズや線形トレンドをデータから削除する処理です。グループ化とビン化方法は、データの変数間の関係を特定する手法です。

関数

すべて展開する

ismissing欠損値を検出
rmmissing欠損エントリを削除
fillmissing欠損値を埋める
missing欠損値を作成
standardizeMissing標準の欠損値を挿入
isoutlierデータの外れ値を検出
filloutliersデータの外れ値の検出と置き換え
rmoutliersデータ内の外れ値の検出と削除
movmad移動中央絶対偏差
ischangeデータの急激な変化の検出
islocalmin局所的最小値の検出
islocalmax局所的最大値を検出
smoothdataノイズの多いデータの平滑化
movmean移動平均値
movmedian移動中央値
detrend線形トレンドを除去
normalizeデータの正規化
rescale配列要素のスケール範囲
discretizeデータをビンまたはカテゴリにグループ化
groupsummaryグループ要約の計算
grouptransformグループごとの変換
histcountsヒストグラムのビンのカウント数
histcounts2二変量ヒストグラムのビンのカウント数
findgroupsグループを見つけてグループ番号を返す
splitapplyデータをグループに分割して関数を適用
rowfuntable または timetable の行への関数の適用
varfun関数をテーブル変数または timetable 変数に適用
accumarray累算による配列作成

トピック

MATLAB 内の欠損データ

データセット内の欠損値を処理する。

table 内の乱雑な欠損データの整理

この例では、データが欠損している table 行を検出、整理および削除する方法を示します。

データの平滑化と外れ値の検出

データの不要なノイズや動作の排除、および外れ値の特定、埋め込み、および削除を行う。

データのトレンド除去

データの線形トレンドを除去します。

データ分割のためのグループ化変数

グループ化変数を使用して、データ変数を分類できます。

データのグループへの分割と統計値の計算

この例では、データをグループに分割して各グループに統計関数を適用する方法を示します。

テーブル データ変数の分割と関数の適用

この例では、データ変数をグループに分割して各グループに関数を適用する方法を示します。