このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
Text Analytics Toolbox 入門
Text Analytics Toolbox™ は、テキスト データの前処理、解析、モデル化のためのアルゴリズムと可視化を提供します。ツールボックスで作成されたモデルは、センチメント分析、予知保全、トピック モデリングなどの用途で使用できます。
Text Analytics Toolbox には、装置のログ、ニュース フィード、アンケート、オペレーター レポート、ソーシャル メディアなどのソースから得た生テキストを処理するためのツールが含まれます。一般的なファイル形式からテキストを抽出し、生テキストを前処理し、個々の単語を抽出し、テキストを数値表現に変換し、統計モデルを構築することができます。
LSA、LDA、単語埋め込みなどの機械学習手法を使用して、クラスターを検出し、高次元のテキスト データセットから特徴を作成することができます。Text Analytics Toolbox で作成された特徴を他のデータ ソースの特徴と組み合わせて、テキスト、数値、およびその他の種類のデータを利用する機械学習モデルを構築することができます。
チュートリアル
- 10 行コードでのテキスト解析の試用
この例では、わずか 10 行の MATLAB® コードを使用し、テキスト解析を使用してテキスト データを分類する方法を示します。
- MATLAB へのテキスト データのインポート
さまざまなソースからテキスト データをインポートする。
- 単純な前処理関数の作成
この例では、[テキスト データの前処理] ライブ エディター タスクを使用して、解析のためにテキスト データをクリーニングおよび前処理する関数を作成する方法を示します。
- トピック モデリング入門
この例では、トピック モデルをテキスト データに当てはめて、トピックを可視化する方法を示します。
- ワード クラウドを使用したテキスト データの可視化
この例では、ワード クラウドを使用してテキスト データを可視化する方法を示します。