ワードクラウドを使用した LDA トピックの可視化

この例では、潜在的ディリクレ配分 (LDA) モデルのトピックに含まれる単語を可視化する方法を示します。

潜在的ディリクレ配分 (LDA) モデルは、文書のコレクションに内在するトピックを発見し、トピック内の単語の確率を推測するトピックモデルです。単語とそれに対応するトピック単語確率を表示することで、ワードクラウドを使用して LDA トピックを可視化できます。

LDA モデルの読み込み

さまざまな障害イベントの詳細を示す工場レポートのデータセットを使用して学習させた LDA モデル factoryReportsLDAModel を読み込みます。LDA モデルをテキストデータのコレクションに当てはめる方法を示す例については、トピックモデルを使用したテキストデータの解析を参照してください。

load factoryReportsLDAModel
mdl

mdl = 
  ldaModel with properties:

                     NumTopics: 7
             WordConcentration: 1
            TopicConcentration: 0.5755
      CorpusTopicProbabilities: [0.1587 0.1573 0.1551 0.1534 0.1340 0.1322 0.1093]
    DocumentTopicProbabilities: [480×7 double]
        TopicWordProbabilities: [158×7 double]
                    Vocabulary: ["item"    "occasionally"    "get"    "stuck"    "scanner"    "spool"    "loud"    "rattling"    "sound"    "come"    "assembler"    "piston"    "cut"    "power"    "start"    "plant"    "capacitor"    "mixer"    …    ]
                    TopicOrder: 'initial-fit-probability'
                       FitInfo: [1×1 struct]

ワードクラウドを使用したトピックの可視化

wordcloud 関数を使用してトピックを可視化します。

numTopics = mdl.NumTopics;

figure
t = tiledlayout("flow");
title(t,"LDA Topics")

for i = 1:numTopics
    nexttile
    wordcloud(mdl,i);
    title("Topic " + i)
end

Figure contains objects of type wordcloud. The chart of type wordcloud has title Topic 1. The chart of type wordcloud has title Topic 2. The chart of type wordcloud has title Topic 3. The chart of type wordcloud has title Topic 4. The chart of type wordcloud has title Topic 5. The chart of type wordcloud has title Topic 6. The chart of type wordcloud has title Topic 7.

参考

tokenizedDocument | fitlda | ldaModel | wordcloud

ワード クラウドを使用した LDA トピックの可視化

LDA モデルの読み込み

ワード クラウドを使用したトピックの可視化

参考

トピック

ワードクラウドを使用した LDA トピックの可視化

ワードクラウドを使用したトピックの可視化