言語に依存しない機能
単語と n-gram のカウント
関数 bagOfWords
および関数 bagOfNgrams
は、言語に関係なく、tokenizedDocument
の入力をサポートします。データを含む tokenizedDocument
配列がある場合、これらの関数を使用できます。
モデル化と予測
関数 fitlda
および関数 fitlsa
は、言語に関係なく、bagOfWords
および bagOfNgrams
の入力をサポートします。データを含む bagOfWords
オブジェクトまたは bagOfNgrams
オブジェクトがある場合、これらの関数を使用できます。
関数 trainWordEmbedding
は、言語に関係なく、tokenizedDocument
またはファイルの入力をサポートします。tokenizedDocument
配列または正しい形式のデータを含むファイルがある場合、この関数を使用できます。
参考
stopWords
| removeWords
| normalizeWords
| bagOfWords
| bagOfNgrams
| tokenizedDocument
| fitlda
| fitlsa
| wordcloud
| addSentenceDetails
| addLanguageDetails