Main Content

ライブ エディター タスクを使用した乱雑なデータのクリーニングと極値の検索

一連のライブ エディター タスクを使用し、ステップごとにデータを可視化することで、対話的にデータを前処理することができます。この例では、局所的最小値と最大値を特定するために、5 つのタスクを使用して欠損値と外れ値をもつノイズの多いデータをクリーニングします。ライブ エディター タスクの詳細については、ライブ スクリプトへの対話型タスクの追加を参照してください。

最初に、4 つの NaN 値と 5 つの外れ値を含む乱雑なデータのベクトルを作成し、プロットします。

x = 1:100;
data = cos(2*pi*0.05*x+2*pi*rand) + 0.5*randn(1,100);
data(20:20:80) = NaN;
data(10:20:90) = [-50 40 30 -45 35];

乱雑なデータをプロットするには、[プロットの作成] タスクを開きます。まず、コード ブロックにキーワード plot を入力し、Create Plot がメニューに表示されたらクリックします。プロット タイプと入力データを選択し、データをプロットします。

このタスクにより生成されるコードを確認するには、タスク パラメーター エリアの下部にある Small arrow pointing down をクリックしてタスクの表示を展開します。

Live Task

Figure contains an axes object. The axes object with title x vs. data, xlabel x, ylabel data contains an object of type line. This object represents data.

欠損データの埋め込み

データの NaN 値を置き換えて結果を可視化するために、[欠損データの削除] タスクを開きます。まず、コード ブロックにキーワード missing を入力し、Clean Missing Data がメニューに表示されたらクリックします。入力データとクリーニング メソッドを選択して、埋められたデータを自動的にプロットします。

このタスクにより生成されるコードを確認するには、タスク パラメーター エリアの下部にある Small arrow pointing down をクリックしてタスクの表示を展開します。

Live Task

Figure contains an axes object. The axes object with title Number of filled missing entries: 4 contains 2 objects of type line. One or more of the lines displays its values using only markers These objects represent Cleaned data, Filled missing entries.

外れ値の埋め込み

ここで、[外れ値データの削除] タスクを使用することで、前のタスクでクリーニングされたデータから外れ値を削除することができます。新しいコード ブロックにキーワード outliers を入力し、Clean Outlier Data をクリックしてタスクを開きます。cleanedData を入力データとして選択します。外れ値のクリーニングと検出用のメソッドをカスタマイズし、しきい値を調整して外れ値の検出数を増減できます。

このタスクにより生成されるコードを確認するには、タスク パラメーター エリアの下部にある Small arrow pointing down をクリックしてタスクの表示を展開します。

Live Task

Figure contains an axes object. The axes object with title Number of outliers cleaned: 5 contains 5 objects of type line. One or more of the lines displays its values using only markers These objects represent Input data, Cleaned data, Outliers, Filled outliers, Outlier thresholds.

データの平滑化

次に、[データの平滑化] タスクを使用することで、前のタスクのクリーニング済みデータを平滑化します。キーワード smooth を入力して、タスクが表示されたらクリックします。前のタスクの出力である cleanedData2 を、入力データとして選択します。平滑化法を選択し、平滑化の度合いに応じて平滑化係数を調整します。

このタスクにより生成されるコードを確認するには、タスク パラメーター エリアの下部にある Small arrow pointing down をクリックしてタスクの表示を展開します。

Live Task

Figure contains an axes object. The axes object contains 2 objects of type line. These objects represent Input data, Smoothed data.

極値の検索

最後に、キーワード extrema の入力を開始し、Find Local Extrema をクリックします。smoothedData を入力データとして使用し、極値のタイプを変更して、クリーニングされ平滑化されたデータの局所的最大値と局所的最小値の両方を見つけます。局所的極値のパラメーターを調整して、見つける最大値と最小値の数を増減できます。

このタスクにより生成されるコードを確認するには、タスク パラメーター エリアの下部にある Small arrow pointing down をクリックしてタスクの表示を展開します。

Live Task

Figure contains an axes object. The axes object with title Number of extrema: 11 contains 3 objects of type line. One or more of the lines displays its values using only markers These objects represent Input data, Local maxima, Local minima.

参考

ライブ エディター タスク

関数

関連するトピック