Main Content

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

外れ値データの削除

ライブ エディターでの外れ値の検出、埋め込みまたは削除

説明

外れ値データの削除タスクでは、データ内の外れ値を対話的に処理できます。このタスクは、ライブ スクリプト用の MATLAB® コードを自動生成します。

このタスクを使用すると、次を行うことができます。

  • ワークスペース変数内のデータの外れ値の検出、埋め込みまたは削除。

  • 外れ値の検出メソッドと埋め込みメソッドのカスタマイズ。

  • 外れ値データとクリーニング済みのデータの自動的な可視化。

タスクを開く

外れ値データの削除タスクを MATLAB エディターでライブ スクリプトに追加するには、次を行います。

  • [ライブ エディター] タブで、[タスク]、[外れ値データの削除] を選択します。

  • スクリプトのコード ブロック内に、outlierclean などの関連キーワードを入力します。コマンドの補完候補から [外れ値データの削除] を選択します。

パラメーター

次のオプションのいずれかを使用して、外れ値の埋め込みメソッドを指定します。

埋め込みメソッド説明
線形内挿隣接する非外れ値の線形内挿。
定数値指定したスカラー値。既定では 0
中心値検出メソッドで求めた中心値。
しきい値までクリップ検出メソッドで求めた下限しきい値よりも小さい要素を下限しきい値で埋める。検出メソッドで求めた上限しきい値よりも大きい要素を上限しきい値で埋める。
前の値前の非外れ値。
次の値次の非外れ値。
最も近い値最も近い非外れ値。
スプライン内挿区分的 3 次スプライン内挿。
形状保持 3 次内挿 (PCHIP)形状維持区分的 3 次スプライン内挿。
修正 Akima 3 次内挿修正 Akima 3 次エルミート内挿。

次のオプションのいずれかを使用して、外れ値を見つけるための検出メソッドを指定します。

メソッド説明
中央値外れ値は、スケーリングされた中央絶対偏差 (MAD) の指定したしきい値 (既定では 3) を超えて中央値から離れている要素と定義されます。入力データ A の場合、スケーリングされた MAD は c*median(abs(A-median(A))) と定義されます。ここで、c=-1/(sqrt(2)*erfcinv(3/2)) です。
平均値外れ値は、標準偏差の指定したしきい値 (既定では 3) を超えて平均値から離れている要素と定義されます。このメソッドは [中央値] より高速ですが、ロバスト性は低下します。
四分位数外れ値は、上位四分位数 (75%) から上に、または下位四分位数 (25%) から下に、四分位範囲の指定したしきい値 (既定では 1.5) を超えて離れている要素と定義されます。このメソッドは、入力データが正規分布でない場合に便利です。
Grubbs外れ値の検出にグラブス検定を使用します。これは、仮説検定に基づいて反復ごとに 1 つの外れ値を除去するものです。このメソッドは、入力データが正規分布していることを前提としています。
一般化極値スチューデント化偏差 (GESD)外れ値に対して一般化 ESD 検定を使用して、外れ値を検出します。この反復メソッドは [Grubbs] に似ていますが、複数の外れ値が相互にマスキングしている場合により効果的に機能します。
移動中央値外れ値は、指定したウィンドウでの局所中央値から、スケーリングされた局所 MAD の指定したしきい値を超えて離れている要素と定義されます。既定のしきい値は 3 です。
移動平均値外れ値は、指定したウィンドウでの局所平均値から、局所標準偏差の指定したしきい値を超えて離れている要素と定義されます。既定のしきい値は 3 です。

外れ値検出のメソッドが [移動中央値] または [移動平均値] である場合は、ウィンドウのタイプとサイズを指定します。

ウィンドウ説明
中央揃え現在の点を中心にしてウィンドウの長さを指定する。
非対称現在の点の前にある要素数と、現在の点の後にある要素数を含むウィンドウを指定する。

ウィンドウのサイズは、[X 軸] の変数の単位を基準とします。

R2019b で導入