欠損データの削除
説明
欠損データの削除タスクでは、NaN
や <missing>
などの欠損データ値を対話的に処理できます。このタスクは、ライブ スクリプト用の MATLAB® コードを自動生成します。
このタスクを使用すると、次を行うことができます。
ワークスペース変数内の欠損データの検出、埋め込みまたは削除。
データを埋めるメソッドのカスタマイズ。
非標準の欠損値インジケーターの定義。
欠損データとクリーニング済みのデータの可視化。
その他
関連する関数
[欠損データの削除] では、関数 ismissing
、standardizeMissing
、fillmissing
、および rmmissing
を使用するコードが生成されます。
タスクを開く
[欠損データの削除] タスクを MATLAB エディターでライブ スクリプトに追加するには、次を行います。
[ライブ エディター] タブで [タスク] 、 [欠損データの削除] を選択します。
スクリプトのコード ブロック内に、
missing
、NaN
、fill
、remove
などの関連キーワードを入力します。コマンドの補完候補から[欠損データの削除]
を選択します。キーワードによっては、1 つ以上の対応するパラメーターがタスクで自動的に更新されます。
例
等間隔にサンプリングされていないデータ内の欠損エントリを埋める
等間隔にサンプリングされていないデータ内の欠損値を対話的に埋めます。
等間隔でないサンプル点のベクトルを作成し、それらの点で正弦関数を評価します。
x = [-4*pi:0.1:0 0.1:0.2:4*pi]; A = sin(x);
欠損値を A
に挿入します。
A(A < 0.75 & A > 0.5) = missing;
ライブ エディターで [欠損データの削除] タスクを開きます。データをクリーニングするには、A
を入力データとして、x
をデータの "x" 軸座標として選択します。
[欠損データの削除] タスクでは、欠損データを埋めるか削除できます。隣接する非欠損値の線形内挿を使用して欠損エントリを埋めるには、[クリーニング メソッド] フィールドを使用して [欠損を埋める]
と [線形内挿]
を選択します。
このタスクはクリーニングしたデータをプロットし、線形内挿によって入力データ内の 21 個の欠損エントリが埋められたことを示します。
既定の凡例の位置では一部の埋められた欠損エントリが覆われるため、凡例の位置を座標軸外の右上隅に指定します。
legend("Location","northeastoutside")
関連する例
パラメーター
入力データ
— ワークスペースからの有効な入力データ
ベクトル | table | timetable
このタスクは、ベクトル、table、または timetable に含まれる入力データに対して実行されます。データは single
型、double
型、duration
型、calendarDuration
型、datetime
型、categorical
型、string
型、char
型、または文字ベクトルの cell
配列型にできます。
入力データとして table または timetable を提供する場合、[サポートされているすべての変数]
を選択すると、サポートされる型のすべての変数を削除します。[すべての数値変数]
を選択すると、single
型または double
型のすべての変数を削除します。サポートされている特定の変数を削除対象として選択するには、[指定された変数]
を選択し、変数を個別に選択します。
埋め込みメソッド
— 欠損データを埋めるメソッド
線形内挿
(既定値) | 定数値
| 前の値
| ...
欠損データを埋めるメソッドを次のオプションのいずれかとして指定します。
メソッド | 説明 |
---|---|
線形内挿 | 隣接する非欠損値の線形内挿 |
定数値 | 指定したスカラー値 (既定では 0 ) |
前の値 | 前の非欠損値 |
次の値 | 次の非欠損値 |
最も近い値 | x 軸で定義される最も近い非欠損値 |
スプライン内挿 | 区分的 3 次スプライン内挿 |
形状保持 3 次内挿 (PCHIP) | 形状維持区分的 3 次スプライン内挿 |
修正 Akima 3 次内挿 | 修正 Akima 3 次エルミート内挿 |
移動中央値 | 指定されたウィンドウ サイズでの移動中央値 |
移動平均値 | 指定されたウィンドウ サイズでの移動平均値 |
k 最近傍法 | 距離関数で定義される最近傍の平均 |
カスタム関数 | ローカル関数または関数ハンドルとして指定するカスタム埋め込みメソッド |
ウィンドウ
— 移動メソッドのウィンドウ
中央揃え
(既定値) | 非対称
欠損データを埋めるメソッドが [移動中央値]
または [移動平均値]
である場合は、ウィンドウのタイプとサイズを指定します。
ウィンドウ | 説明 |
---|---|
中央揃え | 現在の点を中心にしてウィンドウの長さを指定する |
非対称 | 現在の点の前にある要素数と、現在の点の後にある要素数を含むウィンドウを指定する |
ウィンドウのサイズは、[X 軸] の変数の単位を基準とします。
バージョン履歴
R2019b で導入R2023b: k
最近傍の行から取得した近傍点の平均での埋め込み
k 最近傍法
埋め込みメソッドを使用して、近傍点の平均で欠損エントリを埋めます。近傍の数を指定し、ユークリッド距離、スケーリングされたユークリッド距離、またはカスタム関数を使用して行間の距離を定義します。
R2022b: 非数値 table データと複数の table 変数のプロット
このライブ エディター タスクの表示で、非数値データをプロットします。カテゴリカル ヒストグラムを表示するには、非数値の入力配列を選択するか、[表示する変数] フィールドを categorical
、string
、cellstr
、calendarDuration
、または char
の各データ型が含まれた非数値の table 変数に設定します。
また、このタスクの表示で、複数の table 変数を同時にプロットできます。データが table または timetable の場合、複数の変数をタイル表示チャート レイアウトでプロットするには、[表示する変数] フィールドを設定します。
R2022b: 欠損エントリの最小数とカスタム埋め込みメソッドの指定
データの行を削除するために必要な欠損エントリの最小数を指定します。複数の table 変数またはデータの行列をクリーニング対象として選択する場合は、[欠損の削除]
クリーニング メソッドを選択し、[削除するにあたっての欠損の最小数] フィールドを使用して欠損エントリの最小数を指定します。
また、欠損データを埋めるカスタム メソッドを指定できます。まず、[欠損を埋める]
クリーニング メソッドを選択してから、[カスタム関数]
クリーニング メソッド パラメーターとローカル関数または関数ハンドルのオプションを選択してカスタム埋め込みメソッドを指定します。
R2022b: クリーニングした table 変数の追加
入力 table 変数に、クリーニングしたデータを含む table 変数を追加します。入力データが table または timetable の場合、クリーニングしたデータを追加するには、[出力形式] フィールドを設定します。
R2022a: 入力に 100 万個を超える要素がある場合、ライブ エディター タスクは自動実行されない
入力に 100 万個を超える要素がある場合、このライブ エディター タスクは自動実行されません。以前のリリースでは、入力がどのようなサイズでもタスクは必ず自動実行されていました。入力の要素が多い場合、このタスクで生成されたコードは実行にかなりの時間 (数秒間以上) を要することがあります。
タスクが自動的に実行されない場合、自動実行インジケーターが無効になります。必要に応じてタスクを手動で実行するか、タスクの自動実行の有効化を選択することができます。
R2021a: 複数の table 変数の操作
このライブ エディター タスクは、複数の table 変数を同時に操作できます。入力データが table または timetable の場合、複数の変数を操作するには、[サポートされているすべての変数]
または [指定された変数]
を選択します。すべての変数、または変更した変数のみを返し、可視化する変数を指定します。
参考
関数
ライブ エディター タスク
アプリ
MATLAB コマンド
次の MATLAB コマンドに対応するリンクがクリックされました。
コマンドを MATLAB コマンド ウィンドウに入力して実行してください。Web ブラウザーは MATLAB コマンドをサポートしていません。
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)