Text Analytics Toolbox 入門

テキストデータの解析とモデル化

Text Analytics Toolbox™ は、テキストデータの前処理、解析、モデル化のためのアルゴリズムと可視化を提供します。ツールボックスで作成されたモデルは、センチメント分析、予知保全、トピックモデリングなどの用途で使用できます。

Text Analytics Toolbox には、装置のログ、ニュースフィード、アンケート、オペレーターレポート、ソーシャルメディアなどのソースから得た生テキストを処理するためのツールが含まれます。一般的なファイル形式からテキストを抽出し、生テキストを前処理し、個々の単語を抽出し、テキストを数値表現に変換し、統計モデルを構築することができます。

LSA、LDA、単語埋め込みなどの機械学習手法を使用して、クラスターを検出し、高次元のテキストデータセットから特徴を作成することができます。Text Analytics Toolbox で作成された特徴を他のデータソースの特徴と組み合わせて、テキスト、数値、およびその他の種類のデータを利用する機械学習モデルを構築することができます。

チュートリアル

10 行コードでのテキスト解析の試用

この例では、わずか 10 行の MATLAB® コードを使用し、テキスト解析を使用してテキストデータを分類する方法を示します。
MATLAB へのテキストデータのインポート

さまざまなソースからテキストデータをインポートする。
単純な前処理関数の作成

この例では、[テキストデータの前処理] ライブエディタータスクを使用して、解析のためにテキストデータをクリーニングおよび前処理する関数を作成する方法を示します。
トピックモデリング入門

この例では、トピックモデルをテキストデータに当てはめて、トピックを可視化する方法を示します。
ワードクラウドを使用したテキストデータの可視化

この例では、ワードクラウドを使用してテキストデータを可視化する方法を示します。