Main Content

このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。

データの前処理

データ クリーニング、平滑化、グループ化

正確な、効率的な、または有意義な解析を確実に行うために、データに前処理の手法が必要になる場合があります。データ クリーニングは、正しくないデータや欠落したデータを検索、削除、および置換する方法を指します。局所的極値や急激な変化を検出すると、重要なデータのトレンドを識別できます。平滑化およびトレンド除去は、スケーリングによってデータの境界を変更しながら、ノイズや多項式トレンドをデータから削除する処理です。グループ化とビン化の方法によって、データの特性をグループごとに特定します。

アプリ

データ クリーナー列方向データの前処理と整理 (R2022a 以降)

ライブ エディター タスク

欠損データの削除ライブ エディターでの欠損データの検出、埋め込みまたは削除 (R2019b 以降)
外れ値データの削除ライブ エディターでの外れ値の検出、埋め込みまたは削除 (R2019b 以降)
変化点の検出ライブ エディターでデータ内の急激な変化を検出 (R2019b 以降)
局所的極値の検出ライブ エディターでの局所的最大値と局所的最小値の検出 (R2019b 以降)
データの平滑化ライブ エディターでノイズを含むデータを平滑化 (R2019b 以降)
トレンドの検出と除去Find and remove polynomial or periodic trends from data in the Live Editor (R2019b 以降)
データの正規化ライブ エディターでデータをセンタリングおよびスケーリング (R2021b 以降)
ピボット テーブルSummarize tabular data in pivoted table in the Live Editor (R2023b 以降)
グループ別に計算ライブ エディターでのグループごとの要約、変換、またはフィルター処理 (R2021b 以降)

関数

すべて展開する

anymissingいずれかの配列要素が欠損しているかどうかの判別 (R2022a 以降)
ismissing欠損値を検出
rmmissing欠損エントリを削除
fillmissing欠損エントリを埋める
fillmissing2Fill missing entries in 2-D data (R2023a 以降)
missing欠損値を作成
standardizeMissing標準の欠損値を挿入
isoutlierデータの外れ値を検出
filloutliersデータの外れ値の検出と置き換え
rmoutliersデータ内の外れ値の検出と削除
movmad移動中央絶対偏差
ischangeデータの急激な変化の検出
islocalmin局所的最小値の検出
islocalmax局所的最大値を検出
smoothdataノイズの多いデータの平滑化
smoothdata2 Smooth noisy data in two dimensions (R2023b 以降)
movmean移動平均値
movmedian移動中央値
detrend多項式のトレンドを削除
trenddecompデータのトレンドを検出 (R2021b 以降)
normalizeデータの正規化
rescale配列要素のスケール範囲
discretizeデータをビンまたはカテゴリにグループ化
pivotSummarize tabular data in pivoted table (R2023a 以降)
groupsummaryグループ要約の計算
groupcountsグループの要素数
groupfilterグループによるフィルター処理 (R2019b 以降)
grouptransformグループごとの変換
histcountsヒストグラムのビンのカウント数
histcounts2二変量ヒストグラムのビンのカウント数
findgroupsグループを見つけてグループ番号を返す
splitapplyデータをグループに分割して関数を適用
rowfuntable または timetable の行への関数の適用
varfun関数をテーブル変数または timetable 変数に適用
accumarrayベクトル要素の累積

トピック