Main Content

plotHistogram

データ ドリフト検出用に指定された変数についてのヒストグラムをプロット

R2022a 以降

    説明

    plotHistogram(DDiagnostics) は、関数 detectdrift で計算された p 値が最も低い変数についてのベースライン データとターゲット データのヒストグラムをプロットします。

    detectdrift の呼び出しで EstimatePValues の値を false に設定した場合、plotHistogram は p 値とドリフト ステータスについて NaN を表示します。

    plotHistogram(DDiagnostics,Variable=variable) は、variable で指定された変数についてのベースライン データとターゲット データのヒストグラムをプロットします。

    plotHistogram(ax,___) は、上記の構文におけるいずれかの入力引数の組み合わせを使用して、gca ではなく ax の座標軸にプロットします。

    H = plotHistogram(___) は、ヒストグラムをプロットし、Histogram オブジェクトの配列を H として返します。H はヒストグラムのプロパティを調べたり変更したりするために使用します。詳細については、Histogram のプロパティ を参照してください。

    すべて折りたたむ

    3 つの変数をもつベースライン データとターゲット データを生成します。ターゲット データで 2 つ目と 3 つ目の変数の分布パラメーターを変化させます。

    rng('default') % For reproducibility
    baseline = [normrnd(0,1,100,1),wblrnd(1.1,1,100,1),betarnd(1,2,100,1)];
    target = [normrnd(0,1,100,1),wblrnd(1.2,2,100,1),betarnd(1.7,2.8,100,1)];

    すべての変数についての並べ替え検定を実行して、ベースライン データとターゲット データの間のドリフトを調べます。

    DDiagnostics = detectdrift(baseline,target)
    DDiagnostics = 
      DriftDiagnostics
    
                  VariableNames: ["x1"    "x2"    "x3"]
           CategoricalVariables: []
                    DriftStatus: ["Stable"    "Drift"    "Warning"]
                        PValues: [0.3850 0.0050 0.0910]
            ConfidenceIntervals: [2×3 double]
        MultipleTestDriftStatus: "Drift"
                 DriftThreshold: 0.0500
               WarningThreshold: 0.1000
    
    
      Properties, Methods
    
    

    既定の変数についてのヒストグラムをプロットします。

    plotHistogram(DDiagnostics)

    既定では、plotHistogram は、"p" 値が最も低い変数についてのベースライン データとターゲット データのヒストグラムをプロットします。その変数の "p" 値とドリフト ステータスも表示されます。

    3 つの変数をもつベースライン データとターゲット データを生成します。ターゲット データで 2 つ目と 3 つ目の変数の分布パラメーターを変化させます。

    rng('default') % For reproducibility
    baseline = [normrnd(0,1,100,1),wblrnd(1.1,1,100,1),betarnd(1,2,100,1)];
    target = [normrnd(0,1,100,1),wblrnd(1.2,2,100,1),betarnd(1.7,2.8,100,1)];

    すべての変数についての並べ替え検定を実行して、ベースライン データとターゲット データの間のドリフトを調べます。エネルギー統計量をメトリクスとして使用します。

    DDiagnostics = detectdrift(baseline,target,ContinuousMetric="energy")
    DDiagnostics = 
      DriftDiagnostics
    
                  VariableNames: ["x1"    "x2"    "x3"]
           CategoricalVariables: []
                    DriftStatus: ["Stable"    "Drift"    "Warning"]
                        PValues: [0.3790 0.0110 0.0820]
            ConfidenceIntervals: [2×3 double]
        MultipleTestDriftStatus: "Drift"
                 DriftThreshold: 0.0500
               WarningThreshold: 0.1000
    
    
      Properties, Methods
    
    

    3 つのすべての変数についてのヒストグラムをタイル レイアウトでプロットします。

    tiledlayout(3,1);
    ax1 = nexttile;
    plotHistogram(DDiagnostics,ax1,Variable="x1")
    ax2 = nexttile;
    plotHistogram(DDiagnostics,ax2,Variable="x2")
    ax3 = nexttile;
    plotHistogram(DDiagnostics,ax3,Variable="x3")

    3 つの変数をもつベースライン データとターゲット データを生成します。ターゲット データで 2 つ目と 3 つ目の変数の分布パラメーターを変化させます。

    rng('default') % For reproducibility
    baseline = [normrnd(0,1,100,1),wblrnd(1.1,1,100,1),betarnd(1,2,100,1)];
    target = [normrnd(0,1,100,1),wblrnd(1.2,2,100,1),betarnd(1.7,2.8,100,1)];

    すべての変数についての並べ替え検定を実行して、ベースライン データとターゲット データの間のドリフトを調べます。

    DDiagnostics = detectdrift(baseline,target)
    DDiagnostics = 
      DriftDiagnostics
    
                  VariableNames: ["x1"    "x2"    "x3"]
           CategoricalVariables: []
                    DriftStatus: ["Stable"    "Drift"    "Warning"]
                        PValues: [0.3850 0.0050 0.0910]
            ConfidenceIntervals: [2×3 double]
        MultipleTestDriftStatus: "Drift"
                 DriftThreshold: 0.0500
               WarningThreshold: 0.1000
    
    
      Properties, Methods
    
    

    1 つ目の変数についてのヒストグラムをプロットし、Histogram オブジェクトを返します。

    H = plotHistogram(DDiagnostics,Variable=1)

    H = 
      2×1 Bar array:
    
      Bar    (Baseline)
      Bar    (Target)
    
    

    ベースライン データについてのヒストグラムのバーの色を変更します。

    H(1).FaceColor = [1 0 1];

    入力引数

    すべて折りたたむ

    ドリフト検出用の並べ替え検定の診断。detectdrift から返される DriftDiagnostics オブジェクトとして指定します。

    ヒストグラムをプロットする変数。string、文字ベクトル、または整数のインデックスとして指定します。

    例: Variable="x2"

    例: Variable=2

    データ型: single | double | char | string

    plotHistogram でプロットする座標軸。Axes オブジェクトまたは UIAxes オブジェクトとして指定します。ax を指定しない場合、plotHistogram は、現在の座標軸を使用してプロットを作成します。axes オブジェクトを作成する方法の詳細については、axesuiaxes を参照してください。

    アルゴリズム

    • categorical データの場合、detectdrift は、空のビン (カテゴリ) を処理するために各ビンのヒストグラムのビンのカウント数に 0.5 の補正係数を追加します。これは、パラメーター p (変数の値がそのカテゴリに含まれる確率) が事前分布 Beta(0.5,0.5) をもつという仮定 (分布パラメーターに関するジェフリーズ事前分布の仮定) と同等です。

    • plotHistogram は、次の場合に、可視化を目的として変数を順序変数として扱います。

      • ベースライン データまたはターゲット データの変数に順序があり、ベースライン データとターゲット データの両方のカテゴリが同じである。

      • ベースライン データまたはターゲット データの変数に順序があり、他方のデータ セットのカテゴリが順序データのサブセットである。

      • ベースライン データとターゲット データの両方の変数に順序があり、一方のデータ セットのカテゴリが他方のサブセットである。

    • 変数に順序がある場合、plotHistogram はビンの名前の順序を保持します。

    バージョン履歴

    R2022a で導入