ドキュメンテーション

最新のリリースでは、このページがまだ翻訳されていません。 このページの最新版は英語でご覧になれます。

standardizeMissing

標準の欠損値を挿入

説明

B = standardizeMissing(A,indicator) は、配列または table 内の indicator で指定された値を標準の欠損値に置き換えます。

標準の欠損値はデータ型によって異なります。

  • doublesingleduration および calendarDuration の場合は NaN

  • datetime の場合は NaT

  • string の場合は <missing>

  • categorical の場合は <undefined>

  • char の場合は ' '

  • 文字配列の cell の場合は {''}

B = standardizeMissing(A,indicator,'DataVariables',vars) は、A が table または timetable である場合に、vars で指定された変数の欠損値を標準化します。

すべて折りたたむ

行ベクトルを作成し、-99 のすべてのインスタンスを double データ型の標準の欠損値 NaN に置き換えます。

A = [0 1 5 -99 8 3 4 -99 16];
B = standardizeMissing(A,-99)
B = 1×9

     0     1     5   NaN     8     3     4   NaN    16

欠損値を表す Inf および 'N/A' を含む table を作成します。

dblVar = [NaN;3;Inf;7;9];
cellstrVar = {'one';'three';'';'N/A';'nine'};
charVar = ['A';'C';'E';' ';'I'];
categoryVar = categorical({'red';'yellow';'blue';'violet';''});

A = table(dblVar,cellstrVar,charVar,categoryVar)
A=5×4 table
    dblVar    cellstrVar    charVar    categoryVar
    ______    __________    _______    ___________

     NaN       'one'           A       red        
       3       'three'         C       yellow     
     Inf       ''              E       blue       
       7       'N/A'                   violet     
       9       'nine'          I       <undefined>

Inf のすべてのインスタンスを NaN に置き換え、'N/A' のすべてのインスタンスを空の文字ベクトル '' に置き換えます。

B = standardizeMissing(A,{Inf,'N/A'})
B=5×4 table
    dblVar    cellstrVar    charVar    categoryVar
    ______    __________    _______    ___________

     NaN       'one'           A       red        
       3       'three'         C       yellow     
     NaN       ''              E       blue       
       7       ''                      violet     
       9       'nine'          I       <undefined>

table の指定された変数で発生する Inf および 'N/A' のインスタンスを標準の欠損値インジケーターに置き換えます。

欠損値を表す Inf および 'N/A' を含む table を作成します。

a = {'alpha';'bravo';'charlie';'';'N/A'};
x = [1;NaN;3;Inf;5];
y = [57;732;93;1398;Inf];

A = table(a,x,y)
A=5×3 table
        a         x      y  
    _________    ___    ____

    'alpha'        1      57
    'bravo'      NaN     732
    'charlie'      3      93
    ''           Inf    1398
    'N/A'          5     Inf

変数 a および変数 x については、Inf のインスタンスを NaN に置き換え、'N/A' のインスタンスを空の文字ベクトル '' に置き換えます。

B = standardizeMissing(A,{Inf,'N/A'},'DataVariables',{'a','x'})
B=5×3 table
        a         x      y  
    _________    ___    ____

    'alpha'        1      57
    'bravo'      NaN     732
    'charlie'      3      93
    ''           NaN    1398
    ''             5     Inf

変数 yInf は変更されません。これは、y は名前と値のペアの引数 'DataVariables' に含まれていないからです。

入力引数

すべて折りたたむ

入力データ。ベクトル、行列、多次元配列、table または timetable として指定します。A が timetable の場合、ismissing は table データに対してのみ操作を実行し、行時間のベクトルにある NaT 値と NaN 値を無視します。

データ型: double | single | char | string | cell | table | timetable | categorical | datetime | duration

非標準の欠損値インジケーター。スカラー、ベクトル、または cell 配列として指定します。indicator の要素は、standardizeMissing が欠損値として扱う値を定義します。A が配列の場合、indicator はベクトルでなければなりません。A が table または timetable の場合、indicator は複数のデータ型のエントリをもつ cell 配列にすることもできます。

indicator で指定されたデータ型は、A の対応するエントリ内のデータ型と一致します。以下は indicator の要素と A の要素間で一致する追加のデータ型です。

  • double インジケーターは、Adoublesingle、整数および logical のエントリに一致します。

  • string および char インジケーターは、Acategorical エントリと一致します。

例: B = standardizeMissing(A,'N/A') は、文字ベクトル 'N/A' を空の文字ベクトル '' に置き換えます。

データ型: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical | char | string | cell | datetime | duration

標準化する table 変数。変数名、変数名の cell 配列、数値ベクトル、論理ベクトルまたは関数ハンドルとして指定します。vars は次のいずれかになります。

  • 単一の table 変数名を指定する文字ベクトル

  • 各要素が table 変数名である文字ベクトルの cell 配列

  • table 変数インデックスのベクトル

  • 各要素が table 変数に対応する logical ベクトル。true の場合は対応する変数を含めて、false の場合は対応する変数を除外します。

  • @isnumeric などの論理スカラーを返す関数ハンドル

例: 'Age'

例: {'Height','Weight'}

例: @iscategorical

データ型: char | cell | single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64 | logical | function_handle

出力引数

すべて折りたたむ

標準化された配列または table。ベクトル、行列、多次元配列、table または timetable として指定します。BA と同じサイズです。

データ型: double | single | char | string | cell | table | timetable | categorical | datetime | duration | calendarDuration

アルゴリズム

standardizeMissing は、文字ベクトルの cell 配列、文字配列および categorical 配列の先頭と末尾の空白を異なる方法で処理します。

  • 文字ベクトルの cell 配列の場合、standardizeMissing は空白を無視しません。すべての文字ベクトルは、indicator に指定された文字ベクトルに厳密に一致していなければなりません。

  • 文字配列の場合、standardizeMissing は、末尾の空白を無視します。

  • categorical 配列の場合、standardizeMissing は、先頭と末尾の空白を無視します。

拡張機能

R2013b で導入