Statistics and Machine Learning Toolbox 入門
Statistics and Machine Learning Toolbox™ には、データを説明、分析およびモデル化するための関数とアプリが用意されています。記述統計、可視化、クラスタリングを使用して、探索的データ解析、データへの確率分布の当てはめ、モンテカルロ シミュレーション用の乱数の生成、および仮説検定を実行できます。回帰と分類のアルゴリズムを使用して、データから推論を引き出し、予測モデルを構築できます。分類学習器および回帰学習器アプリを使用して対話的に行うことも、あるいは AutoML を使用してプログラムで行うこともできます。
多次元データ分析と特徴抽出に関しては、ツールボックスに用意されている主成分分析 (PCA)、正則化、次元削減、および特徴選択手法を使用して、予測力が最も高い変数を識別できます。
ツールボックスには、教師あり、半教師あり、および教師なしの機械学習アルゴリズムとして、サポート ベクター マシン (SVM)、ブースティングされた決定木、k-means、その他のクラスタリング手法などが用意されています。部分依存プロットや LIME といった解釈可能性を提供する手法を適用し、組み込み展開用の C/C++ コードを自動的に生成できます。ツールボックスのアルゴリズムの多くは、メモリに格納できないほど大きなデータ セットでも使用できます。
チュートリアル
- データの探索的解析
可視化と記述統計を使用してデータの分布を調べます。
- 2 つの標本による仮説検定
仮説検定を使用して、時期の異なる 2 か月間にマサチューセッツ州全体で測定されたガソリン価格を解析します。
- 最適なクラスター数の評価
evalclusters関数を使用して、データ セットにおける最適なクラスター数を特定します。 - 回帰ニューラル ネットワークの性能評価
fitrnetを使用して全結合層をもつフィードフォワード回帰ニューラル ネットワーク モデルを作成し、テスト データでモデルの性能を評価する。 - 分類学習器アプリを使用した決定木の学習
分類木を作成および比較し、新しいデータについて予測を行うため学習済みモデルをエクスポートします。
機械学習について
- MATLAB の機械学習
自動化されたモデル学習やコード生成用のアプリなど、分類、回帰、クラスタリングおよび深層学習用の MATLAB® の機械学習機能について理解します。

