bagOfNGrams
bag-of-n-grams モデル
説明
bag-of-n-grams モデルは、各 n-gram がコレクションの各文書に出現する回数を記録します。n-gram は、連続する n 個の単語のコレクションです。
bagOfNgrams は、テキストを単語に分割しません。トークン化された文書の配列を作成するには、tokenizedDocument を参照してください。
作成
構文
説明
は、空の bag-of-n-grams モデルを作成します。bag = bagOfNgrams
は、bag = bagOfNgrams(uniqueNgrams,counts)uniqueNgrams 内の n-gram と counts 内の対応する頻度カウントを使用して、bag-of-n-grams モデルを作成します。uniqueNgrams に <missing> 値が含まれている場合、counts 内の対応する値が無視されます。
入力引数
プロパティ
オブジェクト関数
encode | Encode documents as matrix of word or n-gram counts |
tfidf | 単語頻度-逆文書頻度 (tf-idf) 行列 |
topkngrams | Most frequent n-grams |
addDocument | Add documents to bag-of-words or bag-of-n-grams model |
removeDocument | Remove documents from bag-of-words or bag-of-n-grams model |
removeEmptyDocuments | Remove empty documents from tokenized document array, bag-of-words model, or bag-of-n-grams model |
removeNgrams | Remove n-grams from bag-of-n-grams model |
removeInfrequentNgrams | Remove infrequently seen n-grams from bag-of-n-grams model |
join | Combine multiple bag-of-words or bag-of-n-grams models |
wordcloud | Create word cloud chart from text, bag-of-words model, bag-of-n-grams model, or LDA model |
例
バージョン履歴
R2018a で導入
