このページの内容は最新ではありません。最新版の英語を参照するには、ここをクリックします。
モデル化と予測
トピック モデルと単語埋め込みを使用して予測モデルを開発する
高次元のテキスト データセットからクラスターを検出して特徴を抽出するために、LSA、LDA、単語埋め込みなどの機械学習の手法やモデルを使用できます。Text Analytics Toolbox™ で作成された特徴を他のデータ ソースの特徴と組み合わせることができます。これらの特徴を使用して、テキスト、数値、およびその他の種類のデータを利用する機械学習モデルを構築することができます。
関数
トピック
分類とモデリング
- 単純な前処理関数の作成
この例では、[テキスト データの前処理] ライブ エディター タスクを使用して、解析のためにテキスト データをクリーニングおよび前処理する関数を作成する方法を示します。 - 分類用の単純なテキスト モデルの作成
この例では、bag-of-words モデルを使用して、単語の頻度カウントを単純なテキスト分類器に学習させる方法を示します。 - 文書埋め込みを使用した文書の分類
この例では、文書埋め込みを使用して文書を特徴ベクトルに変換することにより、文書分類器に学習させる方法を説明します。 - マルチワード フレーズを使用したテキスト データの解析
この例では、n-gram 頻度カウントを使用してテキストを解析する方法を示します。 - トピック モデルを使用したテキスト データの解析
この例では、潜在的ディリクレ配分 (LDA) トピック モデルを使用してテキスト データを解析する方法を示します。 - LDA モデルのトピック数の選択
この例では、潜在的ディリクレ配分 (LDA) モデルの適切なトピック数を決定する方法を示します。 - Compare LDA Solvers
This example shows how to compare latent Dirichlet allocation (LDA) solvers by comparing the goodness of fit and the time taken to fit the model. - LDA モデルを使用した文書クラスターの可視化
この例では、潜在的ディリクレ配分 (LDA) トピック モデルと t-SNE プロットを使用して文書のクラスタリングを可視化する方法を示します。 - LDA トピックの相関の可視化
この例では、潜在的ディリクレ配分 (LDA) トピック モデルでトピック間の相関を解析する方法を示します。 - Visualize Correlations Between LDA Topics and Document Labels
This example shows how to fit a Latent Dirichlet Allocation (LDA) topic model and visualize correlations between the LDA topics and document labels. - Train Custom Named Entity Recognition Model
This example shows how to train a custom named entity recognition (NER) model. - 共起ネットワークの作成
この例では、bag-of-words モデルを使用して共起ネットワークを作成する方法を示します。 - Information Retrieval with Document Embeddings
Learn about different types of document embeddings and how to use them for information retrieval. (R2024b 以降) - 作業指示データを使用した情報検索
この例では、情報検索技術を使用し、過去に実行されたアクションと作業指示書の説明に基づいて新しい作業指示書の解決策を検索する方法を説明します。 (R2023b 以降) - BERT 文書分類器の学習
この例では、文書分類用の BERT ニューラル ネットワークに学習させる方法を説明します。 (R2023b 以降)
センチメント分析とキーワード抽出
- Sentiment Analysis in MATLAB
Learn about sentiment analysis techniques. (R2023b 以降) - テキスト内のセンチメントの分析
この例では、センチメント分析のために Valence Aware Dictionary and sEntiment Reasoner (VADER) アルゴリズムを使用する方法を示します。 - Generate Domain Specific Sentiment Lexicon
This example shows how to generate a lexicon for sentiment analysis using 10-K and 10-Q financial reports. - センチメント分類器の学習
この例では、ポジティブ センチメントやネガティブ センチメントを含む単語のアノテーション付きリストと事前学習済みの単語埋め込みを使用して、センチメント分析用の分類器に学習させる方法を示します。 - Extract Keywords from Text Data Using RAKE
This example shows how to extract keywords from text data using Rapid Automatic Keyword Extraction (RAKE). - Extract Keywords from Text Data Using TextRank
This example shows to extract keywords from text data using TextRank.
深層学習
- 深層学習を使用したテキスト データの分類
この例では、深層学習長短期記憶 (LSTM) ネットワークを使用してテキスト データを分類する方法を説明します。 - 畳み込みニューラル ネットワークを使用したテキスト データの分類
この例では、畳み込みニューラル ネットワークを使用してテキスト データを分類する方法を説明します。 - 深層学習を使用したメモリ外のテキスト データの分類
この例では、変換されたデータストアを使用して深層学習ネットワークでメモリ外のテキスト データを分類する方法を説明します。 - アテンションを使用した sequence-to-sequence 変換
この例では、アテンションを使用した再帰型 sequence-to-sequence 符号化器-復号化器モデルを用いて数字の文字列をローマ数字に変換する方法を説明します。 - 深層学習を使用した複数ラベルをもつテキストの分類
この例では、複数の独立したラベルをもつテキスト データを分類する方法を説明します。 - 深層学習を使用したテキストの生成 (Deep Learning Toolbox)
この例では、深層学習長短期記憶 (LSTM) ネットワークに学習させてテキストを生成する方法を説明します。 - 『Pride and Prejudice』と MATLAB
この例では、深層学習 LSTM ネットワークに学習させ、文字の埋め込みを使用してテキストを生成する方法を説明します。 - 深層学習を使用した単語単位のテキスト生成
この例では、深層学習 LSTM ネットワークに学習させ、単語単位でテキストを生成する方法を説明します。 - カスタム学習ループを使用したテキスト データの分類
この例では、カスタム学習ループのある深層学習の双方向長短期記憶 (BiLSTM) ネットワークを使用してテキスト データを分類する方法を説明します。 - 自己符号化器を使用したテキストの生成
この例では、自己符号化器を使用してテキスト データを生成する方法を示します。 - テキスト符号化器モデル関数の定義
この例では、テキスト符号化器モデル関数の定義方法を示します。 - テキスト復号化器モデル関数の定義
この例では、テキスト復号化器モデル関数の定義方法を示します。 - Language Translation Using Deep Learning
This example shows how to train a German to English language translator using a recurrent sequence-to-sequence encoder-decoder model with attention. - BERT を使用した文書からの回答の抽出
この例では、抽出型質問応答用に事前学習済みの BERT モデルを変更および微調整する方法を説明します。 (R2024b 以降) - Out-of-Distribution Detection for BERT Document Classifier
Detect out-of-distribution (OOD) data in a BERT document classifier. (R2024b 以降) - Out-of-Distribution Detection for LSTM Document Classifier
Detect out-of-distribution (OOD) data in an LSTM document classifier. (R2024a 以降)
言語サポート
- 言語に関する考慮事項
他の言語向けの、Text Analytics Toolbox の機能の使用に関する情報。 - 日本語言語サポート
Text Analytics Toolbox での日本語サポートに関する情報。 - 日本語のテキスト データの解析
この例では、トピック モデルを使用して、日本語のテキスト データをインポート、準備、および解析する方法を示します。 - German Language Support
Information on German support in Text Analytics Toolbox. - Analyze German Text Data
This example shows how to import, prepare, and analyze German text data using a topic model.