Main Content

Statistics and Machine Learning Toolbox

統計および機械学習によるデータの解析とモデル化

Statistics and Machine Learning Toolbox™ には、データを説明、分析およびモデル化するための関数とアプリが用意されています。記述統計、可視化、クラスタリングを使用して、探索的データ解析、データへの確率分布の当てはめ、モンテカルロ シミュレーション用の乱数の生成、および仮説検定を実行できます。回帰と分類のアルゴリズムを使用して、データから推論を引き出し、予測モデルを構築できます。分類学習器および回帰学習器アプリを使用して対話的に行うことも、あるいは AutoML を使用してプログラムで行うこともできます。

多次元データ分析と特徴抽出に関しては、ツールボックスに用意されている主成分分析 (PCA)、正則化、次元削減、および特徴選択手法を使用して、予測力が最も高い変数を識別できます。

ツールボックスには、教師あり、半教師あり、および教師なしの機械学習アルゴリズムとして、サポート ベクター マシン (SVM)、ブースティングされた決定木、k-means、その他のクラスタリング手法などが用意されています。部分依存プロットや LIME といった解釈可能性を提供する手法を適用し、組み込み展開用の C/C++ コードを自動的に生成できます。ツールボックスのアルゴリズムの多くは、メモリに格納できないほど大きなデータ セットでも使用できます。

Statistics and Machine Learning Toolbox 入門

Statistics and Machine Learning Toolbox の基礎を学ぶ

記述統計と可視化

データのインポートとエクスポート、記述統計、可視化

確率分布

データ頻度モデル、無作為標本の生成、パラメーターの推定

仮説検定

t 検定、F 検定、カイ二乗適合性検定など

クラスター分析と異常検出

データの自然なグループ、パターン、異常を見つけるための教師なし学習法

分散分析

分散分析と共分散分析、多変量 ANOVA、反復測定 ANOVA

回帰

線形、一般化線形、非線形およびノンパラメトリック方式による教師あり学習

分類

バイナリ問題とマルチクラス問題のための教師あり学習および半教師あり学習アルゴリズム

次元削減と特徴抽出

PCA、因子分析、特徴選択、特徴抽出など

産業用統計

実験計画法 (DOE)、生存時間分析および信頼性分析、統計的工程管理

tall 配列によるビッグ データの分析

メモリ不足になるデータの分析

統計計算の速度の向上

統計関数の並列計算または分散計算

コード生成

Statistics and Machine Learning Toolbox 関数に対する C/C++ コードおよび MEX 関数の生成

統計と機械学習の応用

統計と機械学習の手法を業界固有のワークフローに適用