AI モデルがエンジニアード システム、特にセーフティ クリティカルな分野で利用されるようになるにつれて、その信頼性とロバスト性を確保することが極めて重要になってきています。AI Verification Library for Deep Learning Toolbox は、AI モデルを厳密に評価してテストすることができます。
AI Verification Library を使用することで、以下を行うことができます。
- 敵対的サンプルに対するロバスト性など、AI モデルの特性の検証
- 入力の摂動に対する AI モデルの予測感度の推定
- データを分布内と分布外に分けてランタイム モニタリングを行うための分布ディスクリミネーターの作成
- AI モデルの性能を監視するランタイム モニタリング システムの展開
- ケーススタディを通した航空機用ディープラーニング システムの検証
AI 検証とは
従来の検証・妥当性確認 (V&V) ワークフロー、たとえば V サイクルなどは、AI モデルに十分に対応できないことがあります。AI 検証とは、意図した動作を確実にし、意図しない動作を回避するために、厳密なテストを行うことです。これに適応させた W 字型開発のようなプロセスは、敵対的入力への対応、分布外検出、不確実性の推定、ネットワーク特性の検証を通じて、システムのロバスト性と安全性を高めることができます。
- ニューラル ネットワークの形式的検証手法入門 - ビデオ (Tech Talk)
- MATLAB と Simulink を使用した AI の検証と妥当性確認
- ニューラル ネットワークの検証
航空機用ディープラーニング システムの検証 (ケーススタディ)
DO-178C、ARP4754A、策定見込みの EASA や FAA のガイドラインなど、航空業界の標準に沿って航空機用ディープラーニングシステムを検証するケーススタディを紹介しています。このケーススタディでは、ディープラーニング システムが業界標準やガイドラインに完全に準拠するために必要な手順を包括的に解説しています。
分類のためのディープ ニューラル ネットワークにおけるロバスト性の検証
形式的手法を用いて、敵対的サンプル (ネットワークをミスリードするように設計された、巧妙に改変された入力) に対するネットワークのロバスト性を向上させます。このアプローチでは無限の入力をテストできます。これにより摂動が存在しても予測の整合性が証明され、ネットワークの信頼性と精度の向上を可能にする学習強化の指針となります。
回帰のためのディープ ニューラル ネットワーク出力範囲の推定
形式的手法を用いて、指定した入力範囲に対するネットワーク出力の上限を推定します。このプロセスにより、指定した入力の摂動に対するネットワークの潜在的な出力への理解を深めることができます。これにより、制御システムや信号処理などのシナリオで、信頼性の高い性能を確実に実現できるようになります。
ランタイム モニタリングを使用した安全なディープラーニング システムの構築
分布外検出を使用してランタイム モニタリングを組み込み、安全なディープラーニング システムを構築します。受信データが学習データと整合しているかどうかを継続的に評価することにより、ネットワークの出力を信頼すべきか、リダイレクトして安全な処理を実行するかの判断に役立ち、システムの安全性と信頼性が強化されます。
説明可能性技術を活用
説明可能性技術を使用して、ネットワークの意思決定プロセスを理解します。D-RISE (Detector Randomized Input Sampling for Explanation) アルゴリズムなどの手法を活用して、オブジェクト検出器のサリエンシーマップを計算し、ネットワークの予測で最も影響を及ぼす入力データ内の特定の領域を可視化します。
制約付きディープラーニングの統合
制約付きディープラーニングは、ドメイン固有の制約を学習プロセスに組み込むことによってディープ ニューラル ネットワークの学習を行う高度な手法です。このような制約をニューラル ネットワークの構成と学習に統合することで、望ましい動作の保証が最優先されるセーフティ クリティカルなシナリオでそうした保証を実現できます。