Text Analytics Toolbox

Text Analytics Toolbox

テキストデータの解析とモデル化

無料評価版を試す

価格を表示する

ご質問はありますか?営業へのお問い合わせ

Text Analytics Toolbox は、テキストデータの前処理、解析、およびモデル化のためのアルゴリズムと可視化機能を提供します。ツールボックスで作成されたモデルは、感情分析、予知保全、トピックモデリングなどの用途に使用できます。

Text Analytics Toolbox には、機器のログ、ニュースフィード、アンケート、オペレーターレポート、ソーシャルメディアなどのソースからの生のテキストデータを処理するツールが含まれています。広く利用されているファイル形式からテキストを抽出し、生のテキストデータを前処理し、個々の単語を抽出し、テキストを数値表現に変換して、統計モデルを構築できます。

LSA、LDA、単語埋め込みなどの機械学習手法を使用して、高次元のテキストデータセットからクラスターを検出し、特徴量を作成できます。Text Analytics Toolbox で作成した特徴量を他のデータソースの特徴量と組み合わせることで、テキスト、数値、その他の種類のデータを活用した機械学習モデルを構築できます。

Microsoft Word 文書からデータストアにテキストデータを抽出する MATLAB コード。

テキストのインポートと可視化

PDF、HTML、Microsoft^® Word ファイルなど、単一のファイルや大量のファイルからテキストデータを MATLAB にインポートします。ワードクラウドとテキスト散布図を使用して、テキストデータセットを視覚的に探索します。

PDF、HTML、Microsoft Word、Microsoft Excel、および CSV ファイルからのテキストデータの抽出

ドキュメンテーション | 例

ワードクラウドとして結果が表示された [テキストデータの前処理] ライブエディタータスクのスクリーンショット。

テキストのクリーニングと前処理

高水準のフィルター処理関数を適用して、URL、HTML タグ、句読点などの不要なコンテンツを削除します。スペルを修正し、ストップワードをフィルター処理し、単語を語根形に正規化します。

ライブエディターでのテキストデータのクリーニングと前処理

ドキュメンテーション | 例

散布図を作成するための MATLAB コードと、作成された単語埋め込み t-SNE プロット。

テキストの構造化形式への変換

トークン化アルゴリズムを使用して言語的特徴を抽出し、テキストデータを数値で表現するための単語頻度統計を計算し、word2vec や skip-gram などの単語埋め込みモデルの学習を行います。

単語埋め込みの探索と可視化

ドキュメンテーション | 例

肯定的な態度と否定的な態度を識別するために、テキストデータに対して FFinBERT Transformer モデルを使用して転移学習を実行するためのワークフロー。

テキスト解析への AI の適用

LSA、LDA、LSTM などの機械学習モデルやディープラーニングモデルをテキストデータに当てはめます。BERT、FinBERT、GPT-2 などのTransformer モデルを活用して、テキストデータで転移学習を実行します。

BERT による文書分類器の学習

ドキュメンテーション | 例

大規模言語モデル

MATLAB を OpenAI Chat Completions API に接続します。テキスト要約やチャットなどのタスクに対して、MATLAB 環境内で GPT モデルの自然言語処理機能を活用します。

MATLAB を使用した大規模言語モデル (LLM)

ドキュメンテーション | 例

自然言語処理のためのテキストデータクリーニングの図。左: 生データのワードクラウド。右: クリーニングされたデータのワードクラウド。

エンジニア向けテキスト解析

センサーデータとテキストログデータに基づいて、予知保全スケジュールを作成します。要件の形式化とコンプライアンスチェックを自動化します。

作業指示データを使用した情報の取得

ドキュメンテーション | 例

テキスト解析を使用して、複数の文書を 1 つの文書に要約します。

文書解析

トピックモデリングを使用してテキストを解析し、基礎となるパターン、トレンド、および複雑な関係を検出して可視化します。文書を要約し、キーワードを抽出し、文書の重要度と類似度を評価します。

畳み込みニューラルネットワークを使用したテキストデータの分類

ドキュメンテーション | 例

肯定的な言葉と否定的な言葉に分離されたワードクラウド。

感情分析

テキストデータで表現された態度や意見を特定して、その文章の内容を肯定的、中立的、否定的のいずれかに分類します。感情をリアルタイムで予測できるモデルを構築します。

MATLAB による感情分析

ドキュメンテーション | 例

小説「高慢と偏見」から生成されたテキストのワードクラウド。

テキスト生成と分類

ディープラーニングを用いて、観察されたテキストに基づいて新しいテキストを生成し、カテゴリの識別が可能な単語埋め込みを使用してテキストの説明を分類します。

オートエンコーダーを使用したテキストの生成

ドキュメンテーション | 例

製品リソース:

ドキュメンテーション例ビデオ技術情報関数要件リリースノート

Text Analytics Toolbox の無料評価版を試す

今すぐ、その可能性を体験しましょう。

今すぐ始める

購入する

製品価格に関する情報と関連製品はこちら

価格を表示する営業へのお問い合わせ

あなたは学生ですか?

ご所属の学校にはすでに Campus-Wide License が導入されていて、MATLAB、Simulink、その他のアドオン製品を利用できる可能性があります。

MATLAB を入手する

次のトピック

ホワイトペーパー

MATLAB によるテキスト解析入門

チートシート

Text Analytics Toolbox 入門

ビデオ

MATLAB によるテキスト解析 (23:35)