Text Analytics Toolbox 製品の説明

テキストデータの解析とモデル化

Text Analytics Toolbox™ は、テキストデータの前処理、解析、モデル化のためのアルゴリズムと可視化を提供します。ツールボックスで作成されたモデルは、センチメント分析、予知保全、トピックモデリングなどの用途で使用できます。

Text Analytics Toolbox には、装置のログ、ニュースフィード、アンケート、オペレーターレポート、ソーシャルメディアなどのソースから得た生テキストを処理するためのツールが含まれます。一般的なファイル形式からテキストを抽出し、生テキストを前処理し、個々の単語を抽出し、テキストを数値表現に変換し、統計モデルを構築することができます。

LSA、LDA、単語埋め込みなどの機械学習手法を使用して、クラスターを検出し、高次元のテキストデータセットから特徴を作成することができます。Text Analytics Toolbox で作成された特徴を他のデータソースの特徴と組み合わせて、テキスト、数値、およびその他の種類のデータを利用する機械学習モデルを構築することができます。

主な機能

テキストの前処理と正規化
潜在的ディリクレ配分 (LDA) および潜在意味解析 (LSA) などの機械学習アルゴリズム
単語埋め込み学習、および word2vec、FastText、GloVe からの事前学習済みモデルのインポート
ワードクラウドとテキスト散布図
PDF ファイルおよび Microsoft^® Word ファイルからのドキュメントのインポート
TF-IDF と単語頻度統計