Main Content

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

ライブ エディター タスクを使用した乱雑なデータのクリーニングと極値の検索

一連のライブ エディター タスクを使用し、ステップごとにデータを可視化することで、対話的にデータを前処理することができます。この例では、局所的最小値と最大値を特定するために、4 つのタスクを使用して欠損値と外れ値をもつノイズの多いデータをクリーニングします。ライブ エディター タスクの詳細については、ライブ スクリプトへの対話型タスクの追加を参照してください。

最初に、4 つの NaN 値と 5 つの外れ値を含む乱雑なデータのベクトルを作成し、プロットします。

x = 1:100;
data = cos(2*pi*0.05*x+2*pi*rand) + 0.5*randn(1,100);
data(20:20:80) = NaN;
data(10:20:90) = [-50 40 30 -45 35];
plot(x,data)

欠損データの埋め込み

データの NaN 値を置き換えて結果を可視化するために、[欠損データの削除] タスクを開きます。まず、コード ブロックにキーワード missing を入力し、Clean Missing Data がメニューに表示されたらクリックします。入力データとクリーニング メソッドを選択して、埋められたデータを自動的にプロットします。

外れ値の埋め込み

ここで、[外れ値データの削除] タスクを使用することで、前のタスクでクリーニングされたデータから外れ値を削除することができます。新しいコード ブロックにキーワード outliers を入力し、Clean Outlier Data をクリックしてタスクを開きます。cleanedData を入力データとして選択します。外れ値のクリーニングと検出用のメソッドをカスタマイズし、しきい値を調整して外れ値の検出数を増減できます。

データの平滑化

次に、[データの平滑化] タスクを使用することで、前のタスクのクリーニング済みデータを平滑化します。キーワード smooth を入力して、タスクが表示されたらクリックします。前のタスクの出力である cleanedData2 を、入力データとして選択します。平滑化法を選択し、平滑化の度合いに応じて平滑化係数を調整します。

極値の検索

最後に、キーワード extrema の入力を開始し、Find Local Extrema をクリックします。smoothedData を入力データとして使用し、極値のタイプを変更して、クリーニングされ平滑化されたデータの局所的最大値と局所的最小値の両方を見つけます。局所的極値のパラメーターを調整して、見つける最大値と最小値の数を増減できます。

コードの生成

出力と可視化の生成にタスクが使用したコードを表示するには、プロットの上にあるタスク ウィンドウ下部の矢印をクリックします。

タスクではコード ブロックが表示され、切り取りと貼り付けによって、既存のスクリプトや別のプログラムで後ほど使用したり変更したりできます。以下に例を示します。

基となるコードがライブ スクリプトの一部となっているため、タスクによって作成された変数を、その後の処理に引き続き使用することができます。たとえば、maxIndices を使用して平滑化済みのデータ内で対応する局所的最大値を見つけ、平均を計算することができます。

参考

ライブ エディター タスク

関数

関連するトピック