Main Content

Text Analytics Toolbox 製品の説明

テキスト データの解析とモデル化

Text Analytics Toolbox™ は、テキスト データの前処理、解析、モデル化のためのアルゴリズムと可視化を提供します。ツールボックスで作成されたモデルは、センチメント分析、予知保全、トピック モデリングなどの用途で使用できます。

Text Analytics Toolbox には、装置のログ、ニュース フィード、アンケート、オペレーター レポート、ソーシャル メディアなどのソースから得た生テキストを処理するためのツールが含まれます。一般的なファイル形式からテキストを抽出し、生テキストを前処理し、個々の単語を抽出し、テキストを数値表現に変換し、統計モデルを構築することができます。

LSA、LDA、単語埋め込みなどの機械学習手法を使用して、クラスターを検出し、高次元のテキスト データセットから特徴を作成することができます。Text Analytics Toolbox で作成された特徴を他のデータ ソースの特徴と組み合わせて、テキスト、数値、およびその他の種類のデータを利用する機械学習モデルを構築することができます。

主な機能

  • テキストの前処理と正規化

  • 潜在的ディリクレ配分 (LDA) および潜在意味解析 (LSA) などの機械学習アルゴリズム

  • 単語埋め込み学習、および word2vec、FastText、GloVe からの事前学習済みモデルのインポート

  • ワード クラウドとテキスト散布図

  • PDF ファイルおよび Microsoft® Word ファイルからのドキュメントのインポート

  • TF-IDF と単語頻度統計